VOC 2007数据集结构

VOC 2007数据集结构

  • 目录
    • 一、数据集介绍
    • 二、数据集文件结构
      • (一)总结构
      • (二)Annotations
      • (三)ImageSets
        • 1、Layout
        • 2、Main
        • 3、Segmentation
      • (四)JPEGImages
      • (五)SegmentationClass
      • (六)SegmentationObject
    • 参考

目录

一、数据集介绍

  • Pascal VOC challenge是一个非常流行的数据集,用于构建和评估用于图像分类、对象检测和分割的算法。
  • 这个挑战的目标是在现实场景中从大量的可视对象类中识别对象(即不是预先分割的对象)。有20个对象类:

    VOC 2007数据集结构_第1张图片

  • 有两个主要任务:
    • 分类
    • 检测

    VOC 2007数据集结构_第2张图片

  • 两个可尝试的额外任务:
    • 分割

    VOC 2007数据集结构_第3张图片

  • 全称
    The PASCAL Visual Object Classes Challenge 2007 (VOC2007)
    • PASCAL:pattern analysis,statistical modelling and computationallearning
    • VOC:visual object classes

二、数据集文件结构

(一)总结构

  • Annotations
  • ImageSets
    • Layout
    • Main
    • Segmentation
  • JPEGImages
  • SegmentationClass
  • SegmentationObject
    VOC 2007数据集结构_第4张图片
    VOC 2007数据集结构_第5张图片

(二)Annotations

这个文件夹放置的是对每一张图片的标注,为XML文件。
JPEGImages文件夹中的每张图片都在此有对应的XML文件,文件命名格式为:<图片编号.xml>。
VOC 2007数据集结构_第6张图片
我们以000001.xml为例进行说明。

  • 000001.jpg:
    VOC 2007数据集结构_第7张图片
  • 000001.xml:

	VOC2007
	
	000001.jpg
	
	
		The VOC2007 Database
		PASCAL VOC2007
		flickr
		341012865
	
	
	
		Fried Camels
		Jinky the Fruit Bat
	
	
	
		353
		500
		3
	
	
	0
	
	
		
		dog
		
		Left
		
		1
		
		0
		
		
			48
			240
			195
			371
		
	
	
		person
		Left
		1
		0
		
			8
			12
			352
			498
		
	

VOC 2007数据集中图片的bounding box的四个坐标分别为左上角和右下角的x,y坐标 ( x m i n , y m i n , x m a x , y m a x ) (x_{min}, y_{min}, x_{max}, y_{max}) (xmin,ymin,xmax,ymax),且图片是1-base的,即图片左上角的点坐标为(1, 1)。
官方文档:The PASCAL Visual Object Classes Challenge
2007 (VOC2007) Development Kit,page:20
VOC 2007数据集结构_第8张图片
注释:照我们正常的理解来说,bndbox中表示的应当是矩形框的左下角和右上角坐标,但实际上这里使用的是以左上角为原点的屏幕坐标系,图示如下:
VOC 2007数据集结构_第9张图片
参考:屏幕坐标系,世界坐标系

(三)ImageSets

ImageSets存放的是每一种类型的challenge对应的图像数据。

  • _train.txt 训练样本集
  • _val.txt 验证样本集
  • _trainval.txt 训练与测试样本汇总
  • _test.txt 测试样本集

1、Layout

Layout下存放的是具有人体部位的数据(人的head、hand、feet等等,这也是VOC challenge的一部分)。
VOC 2007数据集结构_第10张图片

  • test.txt
    VOC 2007数据集结构_第11张图片

2、Main

Main下存放的是图像物体识别的数据,总共分为20类。
VOC 2007数据集结构_第12张图片

  • car_train.txt
    前面是图像编号,后面是正/负样本,其中1表示正样本,-1表示负样本。
    注:还存在0,个人认为是无法判断是正样本还是负样本。
    VOC 2007数据集结构_第13张图片
  • 001057.jpg:1
    VOC 2007数据集结构_第14张图片
  • 000987.jpg:0
    VOC 2007数据集结构_第15张图片
  • 000964.jpg:-1
    VOC 2007数据集结构_第16张图片

3、Segmentation

Segmentation下存放的是可用于分割的数据。
VOC 2007数据集结构_第17张图片
在这里插入图片描述

(四)JPEGImages

这个文件夹主要放置数据的原始图片,共9963张图片,文件命名格式为:<图片编号.jpg>。

(五)SegmentationClass

按类别进行图像分割,同一类别的物体会被标注为相同颜色。
VOC 2007数据集结构_第18张图片

  • 000032.png
    VOC 2007数据集结构_第19张图片

(六)SegmentationObject

按对象进行图像分割,即使是同一类别的物体会被标注为不同的颜色。
VOC 2007数据集结构_第20张图片

  • 000032.png
    VOC 2007数据集结构_第21张图片

参考

计算机视觉标准数据集整理—PASCAL VOC数据集
VOC2007数据集解析
Pascal VOC Dataset Mirror
数据集:Pascal VOC 2007数据集分析

你可能感兴趣的:(计算机视觉)