[ 数据集 ] VOC 2012 数据集介绍


Author :Horizon Max

编程技巧篇:各种操作小结

机器视觉篇:会变魔术 OpenCV

深度学习篇:简单入门 PyTorch

神经网络篇:经典网络模型

算法篇:再忙也别忘了 LeetCode


文章目录

  • VOC 2012
    • 分类 / 检测
    • 分割
  • VOC 2012 文件夹介绍
    • 1)Annotations
    • 2)ImageSets
      • Action
      • Layout
      • Main
      • Segmentation
    • 3)JPEGImages
    • 4)SegmentationClass
    • 5)SegmentationObject

VOC 2012

它从根本上说是一个有监督的学习问题,提供了一组标记图像的训练集。

包括二十个对象类别:

Person :person
Animal :bird, cat, cow, dog, horse, sheep
Vehicle :aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor :bottle, chair, dining table, potted plant, sofa, tv/monitor

有三个主要的对象识别竞赛:分类检测分割

[ 数据集 ] VOC 2012 数据集介绍_第1张图片

官方链接 :VOC 2012
下载链接 : training / validation data
官方文档 : (VOC2012) 开发套件


分类 / 检测

(1)分类 :对于 20 个类中的每一个,预测测试图像中该类示例的存在/不存在 ;
(2)检测 :从测试图像中的 20 个目标类别中预测每个对象的边界框和标签 ;

[ 数据集 ] VOC 2012 数据集介绍_第2张图片


分割

(1)分割:生成逐像素分割,给出在每个像素处可见的对象类别,否则为“背景” ;

[ 数据集 ] VOC 2012 数据集介绍_第3张图片


VOC 2012 文件夹介绍

VOC 2012 文件夹下一共包括 5 个子文件夹
[ 数据集 ] VOC 2012 数据集介绍_第4张图片

1)Annotations

文件为 XML格式 的图片标注信息

[ 数据集 ] VOC 2012 数据集介绍_第5张图片

以其中一个为例:

[ 数据集 ] VOC 2012 数据集介绍_第6张图片

里面包含的信息有:图像数据的 名称、地址,目标的种类、位置等 ;


2)ImageSets

ImageSets 下有 4 个子文件夹

[ 数据集 ] VOC 2012 数据集介绍_第7张图片

train.txt:训练集相关数据
val.txt:验证集相关数据
trainval.txt:训练集与验证集合并后的相关数据

Action

1、Action:与人体动作相关的数据,包括三个部分(train.txt、trainval.txt、val.txt),对应的动作有 jumping、phoning 等 ;

[ 数据集 ] VOC 2012 数据集介绍_第8张图片

用于 人体动作分类竞赛 (Action Classification Competition)

[ 数据集 ] VOC 2012 数据集介绍_第9张图片

Layout

2、Layout:与人体部位相关的数据,包括三个部分(train.txt、trainval.txt、val.txt),对应的部位有 head、hand、feet 等 ;

[ 数据集 ] VOC 2012 数据集介绍_第10张图片

用于 人体部位检测竞赛 (Person Layout Taster Competition)

[ 数据集 ] VOC 2012 数据集介绍_第11张图片

Main

3、Main:与目标检测相关的数据,包括三个部分(train.txt、trainval.txt、val.txt),一共包括 20 个类别 ;

[ 数据集 ] VOC 2012 数据集介绍_第12张图片

用于 图像分类 / 检测竞赛 (Classification/Detection Competitions)

[ 数据集 ] VOC 2012 数据集介绍_第13张图片

Segmentation

4、Segmentation:与图像分割相关的数据,包括三个部分(train.txt、trainval.txt、val.txt)

在这里插入图片描述

用于 图像分割竞赛 (Segmentation Competition)

[ 数据集 ] VOC 2012 数据集介绍_第14张图片


3)JPEGImages

VOC 2012 数据集提供的所有的 .jpg 格式的图片,训练集和测试集一共 17125 张 ;

命名格式:“年份_编号.jpg”,与 1)Annotations 中的标签相对应,图片的像素尺寸不相同 ;

[ 数据集 ] VOC 2012 数据集介绍_第15张图片


4)SegmentationClass

语义分割标注掩模图,一共 2913 张 ;

[ 数据集 ] VOC 2012 数据集介绍_第16张图片


5)SegmentationObject

实例分割标注掩模图,一共 2913 张 ;

[ 数据集 ] VOC 2012 数据集介绍_第17张图片


以其中一张 2007_000129.jpg 为例,将 原始图像语义分割图像实例分割图像 放在一起进行比较 :

[ 数据集 ] VOC 2012 数据集介绍_第18张图片

原始图像(JPEGImages) :数据标签都存放在 Annotations 文档内 ;

语义分割图像(SegmentationClass) :同一物体类别颜色一样,不同物体类别颜色不同 ;

实例分割图像 (SegmentationObject) :同一物体类别 和 不同物体类别颜色都不同 ;

2007_000129.jpg 对应的 Annotations 文件:
[ 数据集 ] VOC 2012 数据集介绍_第19张图片
:图片尺寸 width、height、depth ;

:图片内的目标 (bicycle、person 各有三个 object );

:目标名称,对应着 bicycle、person ;

:拍摄角度

:目标检测框是否被截断(1为是,0为否);

:目标是否难以识别(1为是,0为否);

:bounding box 目标框的位置,对应着 左上角 和 右下角 的两个坐标 ;



你可能感兴趣的:(经典网络模型,人工智能,深度学习,数据集,VOC,2012)