目标检测数据集

一.Pascal VOC(Pascal Visual Object Classes)

Pascal VOC网址:http://host.robots.ox.ac.uk/pascal/VOC/ 
查看各位大牛算法的排名的Leaderboards:http://host.robots.ox.ac.uk:8080/leaderboard/main_bootstrap.php 
训练/验证数据集下载(2G):host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

VOC数据集是目标检测经常用的一个数据集,从05年到12年都会举办比赛(比赛有task: Classification 、Detection(将图片中所有的目标用bounding box框出来) 、 Segmentation(将图片中所有的目标分割出来)、Person Layout)
VOC2007:中包含9963张标注过的图片, 由train/val/test三部分组成, 共标注出24,640个物体。 VOC2007的test数据label已经公布, 之后的没有公布(只有图片,没有label)。

VOC2012:对于检测任务,VOC2012的trainval/test包含08-11年的所有对应图片。 trainval有11540张图片共27450个物体。 对于分割任务, VOC2012的trainval包含07-11年的所有对应图片, test只包含08-11。trainval有 2913张图片共6929个物体。

这些物体一共分为20类:

  • Person: person 
  • Animal: bird, cat, cow, dog, horse, sheep 
  • Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train 
  • Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor
     

数据集下载后解压得到一个名为VOCdevkit的文件夹,该文件夹结构如下:

.
└── VOCdevkit     #根目录
    └── VOC2012   #不同年份的数据集,这里只下载了2012的,还有2007等其它年份的
        ├── Annotations        #存放xml文件,与JPEGImages中的图片一一对应,解释图片的内容等等
        ├── ImageSets          #该目录下存放的都是txt文件,txt文件中每一行包含一个图片的名称,末尾会加上±1表示正负样本
        │   ├── Action
        │   ├── Layout
        │   ├── Main
        │   └── Segmentation
        ├── JPEGImages         #存放源图片
        ├── SegmentationClass  #存放的是图片,分割后的效果,见下文的例子
        └── SegmentationObject #存放的是图片,分割后的效果,见下文的例子

  • Annotation文件夹存放的是xml文件,该文件是对图片的解释,每张图片都对于一个同名的xml文件。 
  • ImageSets文件夹存放的是txt文件,这些txt将数据集的图片分成了各种集合。如Main下的train.txt中记录的是用于训练的图片集合 
  • JPEGImages文件夹存放的是数据集的原图片 
  • SegmentationClass以及SegmentationObject文件夹存放的都是图片,且都是图像分割结果图

JEPGImages文件夹

该文件夹存放的是数据集的所有源图片,内容如下: 

                      目标检测数据集_第1张图片

Annotation文件夹 

Annotation文件夹的内容如下: 

                         目标检测数据集_第2张图片

其中xml主要介绍了对应图片的基本信息,如来自那个文件夹、文件名、来源、图像尺寸以及图像中包含哪些目标以及目标的信息等等,内容如下:


    VOC2007
    000005.jpg#文件名
    #文件来源
        The VOC2007 Database
        PASCAL VOC2007
        flickr
        325991873
    
    
        archintent louisville
        ?
    
    #文件尺寸,包括长、宽、通道数
        500
        375
        3
    
    0#是否用于分割
    #检测目标
        chair#目标类别
        Rear#摄像头角度
        0#是否被截断,0表示完整
        0#目标是否难以识别,0表示容易识别
        #bounding-box
            263
            211
            324
            339
        
    
    #检测到的多个物体, 可以看到上图中,图片000005中有多个椅子
        chair
        Unspecified
        0
        0
        
            165
            264
            253
            372
        
    
    #检测到的多个物体
        chair
        Unspecified
        1
        1
        
            5
            244
            67
            374
        
    
    
        chair
        Unspecified
        0
        0
        
            241
            194
            295
            299
        
    
    #检测到的多个物体
        chair
        Unspecified
        1
        1
        
            277
            186
            312
            220
        
    

对应图片为:

                                   目标检测数据集_第3张图片

 ImageSets文件夹

ImageSets包含如下四个子文件夹: 

                          

  • Action下存放的是人的动作(例如running、jumping等等,这也是VOC challenge的一部分)
  • Layout下存放的是具有人体部位的数据(人的head、hand、feet等等,这也是VOC challenge的一部分)
  • Main下存放的是图像物体识别的数据,总共分为20类。
  • Segmentation下存放的是可用于分割的数据。

 然后我们主要关注于main文件夹。里面放了20个类的train、val、trainval的txt。

                                   目标检测数据集_第4张图片

  • _train中存放的是训练使用的数据,每一个class的train数据都有5717个。
  • _val中存放的是验证结果使用的数据,每一个class的val数据都有5823个。
  • _trainval将上面两个进行了合并,每一个class有11540个。

                                                 目标检测数据集_第5张图片 

上图中前面代表图片编号,后面-1代表负样本,1代表正样本。

 SegmentationClass文件夹

这里面包含了2913张图片,每一张图片都对应JPEGImages里面的相应编号的图片。这里面的图片的像素颜色共有20种,对应20类物体。比如所有飞机都会被标为红色。

                                目标检测数据集_第6张图片

SegmentationObject文件夹 

这里面同样包含了2913张图片,图片编号都与Class里面的图片编号相同。这里面的图片和Class里面图片的区别在于,这是针对Object的。在Class里面,一张图片里如果有多架飞机,那么会全部标注为红色。而在Object里面,同一张图片里面的飞机会被不同颜色标注出来。

                                   目标检测数据集_第7张图片

 

二.Microsoft COCO(Common Objects in Context)

你可能感兴趣的:(deep,learning)