VOC数据集介绍

1、VOC数据集下载

ubuntu系统下打开终端输入命令即可下载

wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar
wget https://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar
wget http://pjreddie.com/media/files/VOC2012test.tar

VOC数据集的来源详解看详解 VOC 数据集_我是土堆的博客-CSDN博客_voc数据集

总结来说就是VOC是伴随比赛而生的,这个比赛2012年就停止了,所以数据集也只到2012。VOC常用的是2007及2012,因为其他年份数据太少而不常用

2、VOC数据集介绍

前部分详细介绍可以看https://www.jianshu.com/p/ab72f21de665

a、VOC2007

VOC数据集介绍_第1张图片

 Annotations中存放的是图片的标注信息,有图片名称、图片大小、图片包含的object种类及object的boundingbox(bndbox),往后根据bndbox制作目标检测时需要的真值,有的xml中包含人的part字段,part中包含head,head、foot、等(不知道为什么有的人有有的人没有

VOC数据集介绍_第2张图片VOC数据集介绍_第3张图片

 ImageSets

VOC数据集介绍_第4张图片

VOC2007数据集详细分析_大彤小忆的博客-CSDN博客_voc2007

Layout、Main、Segmentation分别是三个任务对应的数据集列表

其中Main是目标检测数据集用的、Layout(不知道是什么任务)、Segmentation(分割)

Main

VOC数据集介绍_第5张图片

共有84个.txt文件,其中4个文件为训练集train.txt、验证集val.txt、训练集和验证集汇总trainval.txt、测试集test.txt,这4个文件里面保存的是图像的ID号;还有20类目标,每个类别有该类的类别名_train.txt、类别名_val.txt、类别名_trainval.txt、类别名_test.txt这4个文本,共80个文件。这80个文件中每一行的图像ID后面还跟了一个数字,要么是-1, 要么是1,有时候也可能会出现0。:-1表示当前图像中,没有该类物体;1表示当前图像中有该类物体;0表示当前图像中,该类物体只露出了一部分。

JPEGImages

原图

SegmentationClass

语义分割标签图(同种类别物体不区分1,2,3)

SegmentationObject

实例分割标签图(同种类别物体区分1,2,3)

b、VOC2012

同样也是2007中的五个文件夹

但是

Annotations

相比2007的xml多了2008、2009、2010、2011、2012的xml,2010-2012的xml文件中多了action的动作

VOC数据集介绍_第6张图片

  ImageSets

VOC数据集介绍_第7张图片

 相比VOC2007多了Action文件夹,Action文件夹中是所有具有Action信息的图像文件名列表,Layout是包含Layout的图像文件名列表,Main中同上

你可能感兴趣的:(深度学习,计算机视觉,目标检测,人工智能)