【计算机视觉】INRIA 行人数据集 (INRIA Person Dataset)

官网: http://pascal.inrialpes.fr/data/human/
下载地址: ftp://ftp.inrialpes.fr/pub/lear/douze/data/INRIAPerson.tar

INRIA 数据集是一组有标记的站立或行走的人的图像,是 Navneet Dalal 在图像和视频中检测直立的行人的研究工作中收集的。该研究详见 Dalal 的博士毕业论文以及 Dalal 2005 2005 2005 年在 CVPR 上发表的一篇论文——“Histograms of Oriented Gradients for Human Detection”,也是在这篇论文中 DalalTriggs 提出了 HOG+SVM 行人检测算法。

INRIA 数据集中训练集有正样本 614 614 614 张(包含 1237 1237 1237 个行人),负样本 1218 1218 1218 张;测试集有正样本 288 288 288 张(包含 589 589 589 个行人),负样本 453 453 453 张。图片中人体大部分为站立姿势且高度大于 100 100 100 个象素,部分标注可能不正确。图片主要来源于 GRAZ-01、个人照片及 google,因此图片的清晰度较高。

对于下载的文件(INRIAPerson.tar),由于用到了软连接,在 Windows 上直接解压会有问题,使用 WSL(Windows Subsystem for Linux) 可以解决,解压命令:

tar xvf INRIAPerson.tar

具体地,下载下来的 INRIA 数据集内有6个文件夹:
【计算机视觉】INRIA 行人数据集 (INRIA Person Dataset)_第1张图片
‘./Train’‘./Test’ 文件夹分别对应于原始训练图像和测试图像。这两个文件夹的每个文件夹内都有三个子文件夹: /pos(正样本图像)、/neg(负样本图像)、/annotations(Pascal Challenge格式的正样本的注释文件)。
文件夹 ‘./train_64x128_H96’‘./test_64x128_H96’ 对应于标准化(标准化的意思是图像有相同的分辨率)的数据集。两个文件夹中都有子文件夹:/pos、/neg。‘/pos’ 文件夹中的图像实际为根目录下 ‘/96X160H96’‘/70X134H96’ 文件夹下的图片,是以人为中心左右镜像的标准化正训练或测试图像,使用的是软连接,‘/neg’ 文件夹也是如此,实际上是原始图像 ‘./Train/neg’ 和 ‘./Test/neg’ 中的图像。所以根目录下虽然有六个文件夹,但是实际上只有四个文件夹有图像。

数据集文件夹 Tree 目录及每个目录图像数目如下所示:

  • ./INRIAPerson
    • /Train – 1832
    • /Test – 741
    • /train_64x128_H96
      • /pos – 2416
      • /neg – 1218
    • /test_64x128_H96
      • /pos – 1126
      • /neg – 453

你可能感兴趣的:(计算机视觉,数据集,计算机视觉,数据集)