http://robustsystems.coe.neu.edu/sites/robustsystems.coe.neu.edu/files/systems/projectpages/reiddataset.html
下面将对主要的行人重识别数据集进行介绍:
百度云链接 提取码:8fd5 。
原始数据集地址(http://vision.cs.duke.edu/DukeMTMC/) ,为行人跟踪数据集。
原始数据集包含了85分钟的高分辨率视频,采集自8个不同的摄像头。并且提供了人工标注的bounding box。
该数据集一共 36,411张图像。其中有1,404个人出现在大于两个摄像头下,有408个人只出现在一个摄像头下。
随机采样了 702 个人作为训练集,702个人作为测试集。
在测试集中,我们采样了每个ID的每个摄像头下的一张照片作为查询图像(query)。剩下的图像加入测试的搜索库(gallery),并且将之前的 408人作为干扰项,也加到 gallery中。
最终,训练集中,DukeMTMC-reID 包含了 16,522张训练图片(来自702个人),测试集中: 2,228个查询图像(来自另外的702个人),以及 17,661 张图像的搜索库(gallery)。并提供切割后的图像供下载。
另外,DukeMTMC-reID还提供了23种属性数据标注 DukeMTMC-attribute供下载。 https://github.com/vana77/DukeMTMC-attribute
"0005_c2_f0046985.jpg", "0005" 代表行人的身份. "c2"代表这张图像来自第二个摄像头. "f0046985" 代表来自摄像头2的 第46985帧。
链接:https://pan.baidu.com/s/1M5Q1j3895SG86DgmTwk2wg 提取码:nfw5
Market-1501数据集收集共使用了六台摄像机。该数据集包含32,668个带有1,501个身份的带注释的边界框。确保每个带注释的标识出现在至少两个摄像机中,以便可以执行跨摄像机搜索。
我们的数据集采用 Deformable Part Model (DPM) 作为行人检测器。每个识别可以在每个相机下具有多个图像。在跨摄像机搜索期间,每个身份都有多个queries 和多个ground truths 。
该软件包包含四个文件夹。
1)“bounding_box_test”。此文件夹中有19,732个图像用于测试。
2)“bounding_box_train”。此文件夹中有12,936个图像用于训练。
3)“query” 。有750个身份。我们为每个摄像机随机选择一个查询图像。因此,身份的最大query 图像数为6。总共有3,368个query 图像在此文件夹中。
4)“gt_query”。此文件夹包含ground truth annotations。对于每个查询,相关图像被标记为“好”或“垃圾”。“垃圾”对搜索准确性没有任何影响。“垃圾”图像还包括与query相同的相机中的图像。
5)“gt_bbox”。我们还提供手绘边框。它们用于判断DPM边界框是否良好。
在bbox“0001_c1s1_001051_00.jpg”中,“c1”是第一个摄像头(共有6个摄像头)。
“s1”是摄像机1的序列1。这里的序列是由摄像机自动定义的。我们假设相机无法存储相当大的整个视频,因此它将视频分成同样大的序列。两个序列,即“c1s1”和“c2s1”并不完全同时发生。这主要是因为6台摄像机的启动时间不完全相同(打开它们需要时间)。但是,“c1s1”和“c2s1”大致处于同一时期。
“001051”是序列“c1s1”中的第1051帧。帧速率为每秒25帧。
与最后两位数字一样,请记住我们使用DPM检测器。然后,对于标识“0001”,在帧“c1s1_001051”中可能存在多个检测到的边界框。换句话说,图像中的行人可以通过DPM具有多个bbox。因此,“00”表示此边界框是几个中的第一个。
链接:https://pan.baidu.com/s/1cX-laIWGNNaRoqK1tUwI-Q 提取码:ovmd
CUHK01数据集包含来自每个摄像机的每个身份的两个图像。该数据集具有一对不相交的相机,并且该数据集的图像质量相对较好。
971个身份,3884个图像,手动裁剪
2个视角,view A 主要捕获人的正面和背面,view B捕获侧面。每个人有4张图像,每个视角下有2张图像。
http://www.ee.cuhk.edu.hk/~xgwang/CUHK_identification.html
CUHK02是CUHK01的扩展数据集。除了CUHK01中的相机对外,它还有四个相机对设置。
1816个身份,7264个图像,手动裁剪
取自5个不同的户外camera对,共1816人。5个camera对分别有971,306,107,193,239人,大小160*60. 每个人在每个摄像机下的不同时间内取两张图片。大多数人都有负重(背包,手提包,皮带包,行李)。
链接:https://pan.baidu.com/s/11tZoxusQsOU629iTWXQ8BA 提取码:tegi
CUHK03是第一个足以进行深度学习的重新识别数据集。它提供从 Deformable Part Model (DPM)检测到的边界框和手动标记。对于该数据集,人物检测质量相对较好。
1467 个身份,13164个图像,手动裁剪+自动检测
"detected" means the bounding boxes are estimated by pedestrian detector
- "labeled" means the bounding boxes are labeled by human
- "testsets" contains the testing protocols
"detected" and "labeled"
------------------------
5 x 1 cells and each contains the data collected from a pair of camera views.
Each pair of camera views consists of M x 10 cells, where M is the number of
identities. For each identity, cell 1-5 are images from one camera and cell 6-10
are images from another camera. However, some identities may have less than 10
images.
"testsets"
----------
20 x 1 cells and each contains the identities used for testing. They are
represented as a 100 x 2 matrix A, where A(i, 1) is the index of camera pair and
A(i, 2) is the index of identity.
链接:https://pan.baidu.com/s/1XgdC0MuX1QNtQI81hdb3Xg 提取码:e80b
该数据集包含两个摄像头,每个摄像头每人捕获一个图像。它还提供每个图像的视点角度。虽然它已经过许多研究人员的测试,但它仍然是最具挑战性的数据集之一。632人,2个户外摄像头,有多种姿态,视角和光照变化。每个人在每个摄像机下有一张图像,尺度为128*48。提供的角度0度(front),45度,90度(right),135度,180(back)
链接:https://pan.baidu.com/s/1cmuyHFXplnnw9OHZuHXgNw 提取码:exuf
iLIDS-VID数据集涉及在公共开放空间中的两个不相交的摄像机视图中观察到的300个不同的行人。包含两个版本:基于静态图像(参见名为“ILIDS-VID \ images”的文件夹)和基于图像序列(参见名为“ILIDS-VID \ sequences”的文件夹)。
取自监控航空接站大厅,从2个不相交摄像机创建该数据集。随机为300个人采样了600个视频,每人有来自两个视觉的一对视频。每个视频有23~192帧,平均73帧。相似的衣服、光照和视觉改变,复杂的背景和严重的遮挡,很具挑战性。
链接:https://pan.baidu.com/s/1sZ1GCbCL08pd7chn0xSZdg 提取码:0imv
QMUL iLIDS基于iLIDS MCTS,这是一个在繁忙时间由多摄像机闭路电视系统在机场收集的数据集。几乎每个身份都有四个来自两个非重叠相机的图像。该数据集具有重度遮挡和姿势变化的情形。
采样了119个人479张图像。size:128*64。每个人平均有4个张图像。有大的照明 改变和遮挡。
https://files.icg.tugraz.at/f/6ab7e8ce8f/?raw=1
提供了2个不同静止监控摄像机下的多个人的轨迹,监控人行航道和人行道。cam A 下385人,cam B 下749人,有200人同时出现在两个视角。每个视频有5到675帧,平均100帧。该数据集是在不拥挤的户外场景下采集的,有相对简单和干净的背景,较少的遮挡。
前两个人出现在两个摄像机视图中,即,视图A的人0001对应于视图B的人0001,视图A的人0002对应于视图B的人0002,等等。每个摄像机视图中的其余人(即,视图A中的人0201至0385和视图B中的人0201至0749)完成相应视图的图库集。
收集了8个不相交的户外摄像机,监控校园的不同地方。不同于iLIDS和PRID,它提供了完整的监控视频序列:提供了6个视频对集合,15 frame/s,分辨率704*576。一共193个行人。