常见数据集

有几个数据集常常听到,但时间一长就容易混淆忘记,现记录如下。持续更新。

Pascal VOC

全称The PASCAL Visual Object Classes,也可简称VOC。

网址:http://host.robots.ox.ac.uk/pascal/VOC/

主题:目标分类

版本:

  • The VOC2012 Challenge
  • The VOC2011 Challenge
  • The VOC2010 Challenge
  • The VOC2009 Challenge
  • The VOC2008 Challenge
  • The VOC2007 Challenge
  • The VOC2006 Challenge
  • The VOC2005 Challenge

该竞赛现已结束


COCO

网址:http://cocodataset.org 

主题:识别、分割

版本:

常见数据集_第1张图片

介绍:

首先是每年的竞赛:coco竞赛从2015年开始,最初的竞赛内容是detection和captioning,2016年加入keypoints,17年加入stuff,18年加入panotic。其中stuff的意思就是图像中的stuff class(grass, wall, sky),因为以前着重的都是thing class(person, car, elephant)。而panotic则是全景分割,即既要理解thing stuff,又要理解thing class。

常见数据集_第2张图片

然后是各个竞赛对应的标注:

常见数据集_第3张图片

表中可以看出每年的各个竞赛所使用的数据集,后面蓝色字是竞赛内容和年份,前面是对应的数据集及标注。举个例子,1819年的keypoint标注都可以在17年的annotation中找到,没有改变过。

coco api用法:

2017的标注分这些文件,里面是标注信息,分别对应着caption、detection和keypoint三个任务。

cocoanno

以python为例,导入api的库:

from pycocotools.coco import COCO

# 导入annoFile文件
dataDir='..'
dataType='val2017'
annFile='{}/annotations/instances_{}.json'.format(dataDir,dataType)
coco=COCO(annFile)


# getCatIds是一个filter,用于获得符合条件的类别的Id
# loadCats的参数对象是类别的ID,返回值是ID对应的类别。
# 每个类别标注有两类:name和supercategory,用coco.loadCats获取所有cats后访问。
cats = coco.loadCats(coco.getCatIds())
nms=[cat['name'] for cat in cats]
print('COCO categories: \n{}\n'.format(' '.join(nms)))

nms = set([cat['supercategory'] for cat in cats])
print('COCO supercategories: \n{}'.format(' '.join(nms)))

 

Cityscapes

网址:https://www.cityscapes-dataset.com

主题:场景理解(分割)

版本:版本唯一,出自CVPR2016


RID & RIS

网址:https://github.com/lsy17096535/Single-Image-Deraining

主题:雨天场景下的目标检测

介绍:RID是rain in driving,RIS是rain in surveilance


 

 

你可能感兴趣的:(Research,深度学习)