目标检测训练数据集资料汇总

在做目标检测方面的神经网络开发时,不可避免需要用到训练数据。目前在目标检测中比较有名的数据集是:

PASCAL VOC,MS COCO,ImageNet.

我收集汇总了常见的一些数据集的地址方便以后使用。

1. PASCALVOC

http://host.robots.ox.ac.uk/pascal/VOC/

VOC数据集是目标检测经常用的一个数据集,从05年到12年都会举办比赛(比赛有task:Classification 、Detection(将图片中所有的目标用bounding box框出来)、Segmentation(将图片中所有的目标分割出来)、Person Layout).

有VOC2007和VOC2012两个数据集。

包含约10,000张带有边界框的图片用于训练和验证。含有20个类别。具体包括

Person: person

Animal: bird, cat, cow, dog, horse,sheep

Vehicle: aeroplane, bicycle, boat,bus, car, motorbike, train

Indoor: bottle, chair, dining table,potted plant, sofa, tv/monitor

注:由于类别仅20个,因此被看成目标检测方向的一个基准数据集

关于数据集:

- 所有的标注图片都有Detection需要的label, 但只有部分数据有SegmentationLabel。

- VOC2007中包含9963张标注过的图片, 由train/val/test三部分组成, 共标注出24,640个物体。

- VOC2007的test数据label已经公布, 之后的没有公布(只有图片,没有label)

- 对于检测任务,VOC2012的trainval/test包含08-11年的所有对应图片。trainval有11540张图片共27450个物体。

数据集下载完后会有5个文件夹。Annotations、ImageSets、JPEGImages、SegmentationClass、SegmentationObject。

2.MSCOCO数据集:

是微软公司建立的数据集。对于目标检测任务,COCO包含80个类别,每年大赛的训练和和验证集包含120,000张图片,超过40,000张测试图片。下面是这个数据集中的80个类别:

Person#1:person

Vehicle#8:bicycle,car,motorcycle,airplane,bus,train,truck,boat

Outdoor#5:traffic light, firhydrant, stop sign, parking meter, bench

Animal#10:bird,cat, dog,horse, sheep, cow, elephant, bear, zebra, giraffe

Accessory#5:backpack, umbrella,handbag, tie, suitcase

Sport#10:frisbee, skis,snowboard, sports ball, kite, baseball bat , baseball glove, skateboard, surfboard, tennisracket

Kitchen#7:bottle, wine glass,cup, fork, knife, spoon, bowl

Food#10:banana, apple,sandwich, orange, broccoli, carrot, hot dog, pizza, donut, cake

Furniture#6: chair, couch, potted plant,bed, dining table, toilet

Electronic#6:tv, laptop, mouse,remote, keyboard, cell phone

Appliance#5:microwave, oven,toaster, sink, refrigerator

Indoor#7:book, clock, vase,scissors, teddy bear, hair drier, toothbrus

MS COCO数据集介绍以及下载链接:

http://cocodataset.org/#home

3.ImageNet数据集:

是一个计算机视觉系统识别项目,是目前世界上图像识别最大的数据库,是美国斯坦福的计算机科学家,模拟人类的识别系统建立的。ImageNet数据集是按照WordNet架构组织的大规模带标签图像数据集。大约1500万张图片,2.2万类,每张都经过严格的人工筛选与标记。ImageNet类似于图片所有引擎。

其中,包括边界框的目标检测数据集,训练数据集包括500,000张图片,属于200类物体。由于数据集太大,训练所需计算量很大;类别数较多;造成了很少使用和目标检测的难度也很大。

ImageNet数据集介绍以及下载链接:

http://www.image-net.org/

4. 其它更多分类数据集:

https://blog.csdn.net/u010429424/article/details/72171476#gesture

这里包括了以下种类的数据集:行动数据库,属性识别,自主驾驶

生物/医药,相机校准,脸和眼/虹膜数据库,指纹,一般图像,一般RGBD和深度数据集,一般视频,手,掌握,手动和手势数据库,图像,视频和形状数据库检索,对象数据库,人(静),人体姿势,人员检测和跟踪数据库(另见监控),遥感,场景或地点分割或分类,分割,同时本地化和映射,监视和跟踪(另见人物),纹理,城市数据集,其他收藏页,杂项主题

5. 关于数据集的博客:

https://blog.csdn.net/liuxiao214/article/details/80552026

https://blog.csdn.net/liuxiao214/article/details/80552026

https://blog.csdn.net/qq_23565519/article/details/85331104

你可能感兴趣的:(目标检测训练数据集资料汇总)