目标检测(1)— 数据集介绍

本文主要介绍目标检测领域常用的三个数据集PASCAL VOC、ImageNet、COCO.

1.PASCAL VOC

1.1 数据集简介

PASCAL VOC挑战在2005-2012年之间展开。该数据集包含11530张用来训练和测试的图片,其中标定了27450个感兴趣区域。该数据集在8年之间由原始的4个分类发展至最终的20个分类:

  • 人: 人
  • 动物:鸟、猫、狗、牛、马、羊
  • 运载工具:飞机、自行车、船、巴士、汽车、摩托车、火车、
  • 物品:瓶子、椅子、餐桌、盆栽、沙发、电视机等。

在整个数据集中,平均每张图片有2.4个目标。
目标检测(1)— 数据集介绍_第1张图片

1.2 数据集结构目录

目标检测(1)— 数据集介绍_第2张图片
Annotations:此文件中放置的是图像对应的标注文件,即,xml文件。
ImageSets文件夹中是标注类别的每个文件列表信息,此文件中会有你划分的训练集图片和测试集图片的名称列表。
JPEGImages中存放的是所有的原始图片,为.JPEG格式。
SegmentationCllass存放所有分割图像的标注。
SegmentationObject存放分割图像的标注文件。

2.ImageNet

ImageNet 是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。

  • ImageNet拥有用于分类、定位和检测任务评估的数据。
  • 与分类数据类似,定位任务有1000个类别。准确率是根据Top 5检测结果计算出来的。
  • 对200个目标的检测问题有470000个图像,平均每个图像有1.1个目标。

3.COCO数据集

MS COCO的全称是Microsoft Common Objects in Context,起源于是微软于2014年出资标注的Microsoft COCO数据集,与ImageNet 竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。在ImageNet竞赛停办后,COCO竞赛就成为是当前目标识别、检测等领域的一个最权威、最重要的标杆,也是目前该领域在国际上唯一能汇集Google、微软、Facebook以及国内外众多顶尖院校和优秀创新企业共同参与的大赛。

  • COCO(Common Objects in Context)数据集包含20万个图像
  • 80个类别中有超过50万个目标标注。它是最广泛公开的目标检测数据库
  • 平均每个图像有7.2个目标
    目标检测(1)— 数据集介绍_第3张图片

你可能感兴趣的:(目标检测,1024程序员节)