目标检测数据集

参考:You Only Look Once:Unified, Real-Time Object Detection-你只看一次:统一的实时对象检测-CVPR-2016

1、PASCAL VOC: PASCAL VOC 数据集是目标检测领域最常用的数据集之一,由于其轻量性,被广泛应用于目标检测、图像分类和图像分割任务。PASCAL VOC 包含 20 个类别的物体,可以分为四大种类,每张图片都有相应的 XML 文件对应,文件包含图片物体的位置和类别。常用的 PASCAI VOC 数据集有:VOC2007(Everingham,2010)和VOC2012 (Shetty,2016)。其中,VOC2007 数据集包含9963张图片,由train/val/test 三部分组成,而VOC2012 数据集包含 11530张图片,由train/test两部分组成。现在常用的训练方法包含两种:一种是使用07_train+12_ train作为训练集,用07_test 作为测试集,另一种是使用 07_train+07_test+12_train作为训练集,用12_test 作为测试集。

2、MS COCO: Microsoft COCO数据集 (Lin,2014)发布于 2014 年,是目标检测、语义分割、人体关键点检测任务较为权威的重要数据集。它包含了91 个物体类别、328,000 张图片和2,500,000 个标签。该数据集使用JSON 格式的标注文件给出每张图片中目标像素级别的分割信息,而且数据集中共包含 80 个对象类别的待检测目标,目标间的尺度变化大,具有较多的小目标物体。

3、ImageNet: ImageNet 数据集(Russakovsky 等,2015) 是计算机视觉领域的一个大型数据库,被广泛应用于图像分类、目标检测等任务,包含1400多万张图片,2 万多个类别。其中 103 万张图片可以用于目标检测任务,包含 200 个物体类别,有明确的类别标注和物体的位置标注。

4、Open Image:Open Image数据集(Kuznetsova等,2018)是由谷歌团队发布的具有对象位置注释的现有最大的数据集合,包含 190 万张图像,600个种类,1540 万个边界框标注。

你可能感兴趣的:(计算机视觉论文阅读,目标检测,人工智能,计算机视觉)