目标检测数据集VOC 2007/2012 整理

做目标检测时我们经常用到voc 2007, voc 2012 数据集,今天就来整理一下。

数据集的下载地址: https://pjreddie.com/projects/pascal-voc-dataset-mirror/

 

voc 2007

数据集包含 训练集:5011 张,测试集:4952张,共9963张,20个类

20个类分别为:

aeroplane
bicycle
bird
boat
bottle
bus
car
cat
chair
cow
diningtable
dog
horse
motorbike
person
pottedplant
sheep
sofa
train
tvmonitor 

VOC2007 ,我们解压训练集后看到的文件目录:

目标检测数据集VOC 2007/2012 整理_第1张图片

 

目录的结构如下:

├── Annotations            # 里面存放 .xml 文件,图片的标签,比如坐标位置信息等。
├── ImageSets             # 这个目录下有三个文件夹,文件夹存放的都是 .txt 文件,类别标签
│   ├── Layout
│   ├── Main                 # Main 目录下
│   └── Segmentation
├── JPEGImages               # 图像文件 .jpg 格式
├── labels
├── SegmentationClass     # 存放的是图片文件,分割后的图片
└── SegmentationObject    # 存放的是图片文件,分割后的图片

Annotations:存放 xml格式文件,每一个xml文件名对应JPEGImages 中的一张图片。xml文件里是对图片的解释,想了解可以自己看。

ImageSets:里面有三个文件夹Layout,Main,Segmentation

  1. layout:存放的是人体部位的数据
  2. Main:存放物体识别的分类数据,里面有 xx_train.txt, xx_test.txt , xx_trainval.txt, xx_val.txt 文件,xx表示分类,总共20类。
  3. Segmentation:存放可用于分割的数据

我们做目标检测,只需要关注Main文件夹即可。

 

voc 2012

下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

voc 2012 数据集是voc 2007的升级版,一共11530张图片,数据集分为20类(包含背景21)。

人:人

动物:鸟、猫、牛、狗、马、羊

车辆:飞机、自行车、船、巴士、汽车、摩托车、火车

室内:瓶、椅子、餐桌、盆栽植物、沙发、电视/监视器

 

目标检测数据集VOC 2007/2012 整理_第2张图片

voc2012 数据集和2007结构是一样的,文件夹存放的东西也类似:

├── Annotations             # .xml 文件,文件里面是对图片的解释
├── ImageSets               # 里面包含四个文件,文件夹下面存放 .txt文件
│   ├── Action 
│   ├── Layout
│   ├── Main
│   └── Segmentation
├── JPEGImages               # 原图片
├── labels
├── SegmentationClass     # 分割后的图片
└── SegmentationObject    # 分割后的图片

 

ImageSets 目录下:

  1. Action:存放的是人的动作(例如running、jumping等等,这也是VOC challenge的一部分)
  2. Layout:存放的是具有人体部位的数据(人的head、hand、feet等等,这也是VOC challenge的一部分)
  3. Main:存放的是图像物体识别的数据,总共分为20类
  4. Segmentation:存放的是可用于分割的数据

参考:

https://blog.csdn.net/qq_41185868/article/details/79927556

https://blog.csdn.net/weixin_42142612/article/details/83142213

 

 

 

 

 

你可能感兴趣的:(AI)