PASCAL VOC数据集

一、简介

PASCAL: pattern analysis, statistical modelling and computational learning
VOC: visual object classes
该挑战赛的竞赛项目主要包括 图像分类与检测(Classification/Detection Competitions)、图像分割(Segmentation Competition)、人体动作分类(Action Classification Competition)、人体部位检测(Person Layout Taster Competition)等四项主要的视觉挑战赛。

二、PASCAL VOC数据集分类

1、VOC2007

VOC2007:中包含9963张标注过的图片, 由train/val/test三部分组成, 共标注出24,640个物体。 VOC2007的test数据label已经公布, 之后的没有公布(只有图片,没有label)。

2、VOC2012

VOC2012:VOC2012数据集是VOC2007数据集的升级版,一共有11530张图片。对于检测任务,VOC2012的trainval/test包含08-11年的所有对应图片。 trainval有11540张图片共27450个物体。 对于分割任务, VOC2012的trainval包含07-11年的所有对应图片, test只包含08-11。trainval有 2913张图片共6929个物体。

3、VOC2007和VOC2012

数据集分为20类,包括背景为21类,分别如下:
人:人
动物:鸟、猫、牛、狗、马、羊
车辆:飞机、自行车、船、巴士、汽车、摩托车、火车
室内:瓶、椅子、餐桌、盆栽植物、沙发、电视/监视器

4、训练集、验证集、训练验证集、测试集

VOC2007 和 VOC2012 目标检测任务中的训练、验证和测试数据统计如下表所示
PASCAL VOC数据集_第1张图片

具体每一类的数据分布见 PASCAL VOC2007 Database Statistics 和 PASCAL VOC2012 Database Statistics

三、下载

下载镜像
下载的内容包括训练验证集、测试集、开发工具和文档说明

四、组织结构

以 VOC 2007 为例,解压后的文件为:

.
├── Annotations 进行 detection 任务时的标签文件,xml 形式,文件名与图片名一一对应
├── ImageSets 包含三个子文件夹 Layout、Main、Segmentation,其中 Main 存放的是分类和检测的数据集分割文件
├── JPEGImages 存放 .jpg 格式的图片文件
├── SegmentationClass 存放按照 class 分割的图片
└── SegmentationObject 存放按照 object 分割的图片

├── Main
│   ├── train.txt 写着用于训练的图片名称, 共 2501 个
│   ├── val.txt 写着用于验证的图片名称,共 2510 个
│   ├── trainval.txt train与val的合集。共 5011 个
│   ├── test.txt 写着用于测试的图片名称,共 4952

你可能感兴趣的:(PASCAL VOC数据集)