英文数据集txt_语义分割数据集(一) — VOC系列

英文数据集txt_语义分割数据集(一) — VOC系列_第1张图片

一、 PASCAL VOC 2011

1. 简介:

PASCAL VOC数据集除了用于segmentation任务之外,还用于object detection等任务。因此不是所有image都有pixel-wise的标注,有些图片只有object-wise的标注。

  • 官网: http://host.robots.ox.ac.uk/pascal/VOC/voc2011/index.html

语义类别:

该数据集包含20个对象类,加背景共21类: + person; + bird; cat;cow;dog;horse;sheep; + aerphone;bicycle;boat;bus;car;matorbike;train; + bottle;chair;dining table;potted plant;sofa;monitor,

该数据集包含10个动作类: running,jumping,phoning,playing music instrument,reading,riding,riding a horse,taking a photo,using a computer,walking

文件结构:

数据集文件列表中,语义分割中常用的几个文件如下:

  • JPEGimages:存放了数据集所包含的所有图片,共17125张。
  • ImageSets:存放了数据集的一些统计信息文件,包含Action、Layout、Main和Segmentation四个子文件夹。其中Segmentation文件夹中包含train.txt、val.txt等文件,分别存放的是训练集图像的文件名和验证集图像的文件名。
  • SegmentationClass:存放了JPEGimages中部分对应的pixel-level标注,以png形式存放,用于语义分割。

数据集划分:

查看"ImageSets/Segmentation"目录下的txt文件可知train set、val set和test set包含的图像数量如下:

  • train:1112
  • val:1111
  • train+val:2223
  • test:1111

2. 如何下载:

推荐: 数据集自动下载+整理 ,参见github:https://github.com/StoneWST/Dataset-Tool-Segmentation/ ,操作简单仅运行.sh文件即可。

此外,还可以手动下载:

  • TrainVal set下载链接:http://host.robots.ox.ac.uk/pascal/VOC/voc2011/VOCtrainval_25-May-2011.tar
  • Test set的下载需要先在 http://host.robots.ox.ac.uk:8080/accounts/login/?next=/ 上进行注册,登陆后通过链接 http://host.robots.ox.ac.uk:8080/eval/downloads/VOC2011test.tar 进行下载

二、 PASCAL VOC 2012

1. 简介:

VOC2012的JPEGimages中的图像和VOC2011的JPEGimages中的图像是一模一样的,都是17125张。
VOC2011中提到,并不是所有图像都有pixel-level的标注,VOC 2012就是在VOC2011的基础上,对一些图像增加了标注。

语义类别:

与VOC2011相同,21类(包含背景类)。

文件结构:

数据集中文件的存放格式也与VOC2011相同。

数据集划分:

  • train:1464
  • val:1449
  • train+val:2913
  • test:1456

2. 如何下载:

推荐: 数据集自动下载+整理 ,参见github:https://github.com/StoneWST/Dataset-Tool-Segmentation/ 。

此外,还可以手动下载:

  • TrainVal set下载链接:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
  • Test set的下载需要先在 http://host.robots.ox.ac.uk:8080/accounts/login/?next=/ 上进行注册,登陆后通过链接 http://host.robots.ox.ac.uk:8080/eval/downloads/VOC2012test.tar 进行下载

三、 SBD

1. 简介:

SBD 数据集是一个VOC2011数据集的增强版,包含来自 PASCAL VOC 2011 数据集的 11355 张图像的标注,SBD中的11355张图像,完全选自VOC2011数据集中的JPEGimages文件夹中的图片,只是对其中更多的图像进行了标注。类别种类也与 VOC 2011 相同(21个类别)。

该数据集于 2011 年由加州大学伯克利分校发布,相关论文为 Semantic contours from inverse detectors。作者还提供了一个网站,里边有较详细的介绍。

  • Paper Link:http://home.bharathh.info/pubs/pdfs/BharathICCV2011.pdf
  • Website Link:http://home.bharathh.info/pubs/codes/SBD/download.html

文件结构:

数据集中各文件说明如下:

  • cls: classification和segmentation任务的.mat标注信息,包含11335个.mat格式的标签。对于segmentation,每个图像的每个pixel都用一个数字来标注,数字代表类别。
  • img: 分割图像(原始图像),11335张jpg图片。
  • inst: 图像物体分割的.mat标注信息,图像物体分割指的是:只需要在一幅图中将不同物体分割显示出来即可而不是对不同的物体进行类别标记。

注:cls和inst的区别是比如,如果图中有人、狗、背景,那么在inst中人、狗、背景分别对应的数字是0、1、2,而在cls中对应的数字为2、5、0。即inst的标注信息中的数字仅用于区分该张图像中的不同类别物体,至于哪个类别对应的是哪个数字,并不care。

因此,语义分割中用到的标签信息应该是cls。由于.mat文件并不方便,事实上在预处理时,为了和VOC数据集保持一致,可以将.mat格式的label标注文件转换成.png格式(利用调色板),代码: https://github.com/StoneWST/Dataset-Tool-Segmentation/blob/master/py/voc.py 中的 SBD_label_mat2png 函数。

数据集划分:

SBD数据集只有训练集和验证集,具体数量如下:

  • train:8498
  • val:2857
  • train+val:11355

SBD train set中包含了一部分VOC2011和VOC2012的val set中的图片:

VOC_2011_subval(736) = VOC_2011_val(1111) - VOC_2011_val和SBD_train重复的图片(375)
VOC_2012_subval(904) = VOC_2012_val(1449) - VOC_2012_val和SBD_train重复的图片(545)

因此,如果想使用SBD train set作为训练集、VOC2011或VOC2012作为验证集时,需要取VOC2011或VOC2012的子集作为验证集(扣除其中包含在SBD train set中的图像)。

如何生成VOC_2011_subval(736)和VOC_2012_subval(904)的.txt文件,代码: https://github.com/StoneWST/Dataset-Tool-Segmentation/blob/master/py/voc.py 中的 generate_VOC2011_VOC2012_subval_txt 函数。

2. 如何下载:

推荐: 数据集自动下载+整理 ,参见github:https://github.com/StoneWST/Dataset-Tool-Segmentation/ 。

也可以手动下载,链接:http://www.eecs.berkeley.edu/Research/Projects/CS/vision/grouping/semantic_contours/benchmark.tgz

四、 PASCAL VOC 2012 Augment

1. 简介:

SBD是VOC2011和VOC2012的一个增强版本,但是他们之间的兼容性还存在一些问题:(1) VOC2012 train set中有331张image,不包含在 SBD train set中。这导致了,无论 VOC2012 还是 SBD 的 train set 都不是最强的。(2) VOC2012 val set中有545张image,包含在 SBD train set中。这导致了,使用SBD train set作为训练集、VOC2012作为验证集时,只能使用VOC2012的subval set。

考虑到以上两点不足,PASCAL VOC 2012 Augment(VOC2012AUG)就诞生了。 + 针对问题(2),VOC2012AUG 的 val set 就等于 VOC2012 的 val set + 针对问题(1),VOC2012AUG 的 train set 聚合了 VOC2012 train set(a)、SBD train set(b) 和 SBD val set(c),并扣除了 b与a重复的部分、c与a重复的部分、b与VOC2012 val set重复的部分、c与VOC2012 val set重复的部分。

数据集构成:

PASCAL VOC2012AUG 的构成如下:

  • train:10582
  • val:1449
  • train+val:12031
VOC2012AUG_train(10582) = VOC2012_train(1464) + SBD_train(8498) + SBD_val(2857) - SBD_train与VOC2012_train重复部分(1133) 
                          - SBD_val与VOC2012_train重复部分(1) - SBD_train与VOC2012_val重复部分(545) - SBD_val与VOC2012_val重复部分(558)

VOC2012AUG_val(1449) = VOC2012_val(1449)

2. 如何生成VOC2012AUG数据集:

因为VOC2012AUG是由VOC2012和SBD组成的,因此不需要额外下载,只需要做一些额外的reorganize。代码:https://github.com/StoneWST/Dataset-Tool-Segmentation/blob/master/voc.sh

你可能感兴趣的:(英文数据集txt)