行人重识别(ReID)数据集大全详细说明

DukeMTMC-reID

数据集简介

  DukeMTMC 数据集是一个大规模标记的多目标多摄像机行人跟踪数据集。它提供了一个由 8 个同步摄像机记录的新型大型高清视频数据集,具有 7,000 多个单摄像机轨迹和超过 2,700 多个独立人物,DukeMTMC-reID 是 DukeMTMC 数据集的行人重识别子集,并且提供了人工标注的bounding box。

目录结构

DukeMTMC-reID
  ├── bounding_box_test
       ├── 0002_c1_f0044158.jpg
       ├── 3761_c6_f0183709.jpg
       ├── 7139_c2_f0160815.jpg
  ├── bounding_box_train
       ├── 0001_c2_f0046182.jpg
       ├── 0008_c3_f0026318.jpg
       ├── 7140_c4_f0175988.jpg
  ├── query
       ├── 0005_c2_f0046985.jpg
       ├── 0023_c4_f0031504.jpg
       ├── 7139_c2_f0160575.jpg
  └── CITATION_DukeMTMC.txt
  └── CITATION_DukeMTMC-reID.txt
  └── LICENSE_DukeMTMC.txt
  └── LICENSE_DukeMTMC-reID.txt
  └── README.md

目录介绍

从视频中每 120 帧采样一张图像,得到了 36,411 张图像。一共有 1,404 个人出现在大于两个摄像头下,有 408 个人 (distractor ID) 只出现在一个摄像头下。

1) “bounding_box_test”——用于测试集的 702 人,包含 17,661 张图像(随机采样,702 ID + 408 distractor ID)

2) “bounding_box_train”——用于训练集的 702 人,包含 16,522 张图像(随机采样)

3) “query”——为测试集中的 702 人在每个摄像头中随机选择一张图像作为 query,共有 2,228 张图像

命名规则

以 0001_c2_f0046182.jpg 为例

1) 0001 表示每个人的标签编号;

2) c2 表示来自第二个摄像头(camera2),共有 8 个摄像头;

3) f0046182 表示来自第二个摄像头的第 46182 帧。

数据分布

DukeMTMC-reID训练集的图像分布。我们注意到每个ID的图像中值为20。但有些ID可能包含大量图像,这可能会影响某些算法。(例如,ID 5388包含426个图像。)

 

MSMT17

CVPR2018会议上,提出了一个新的更接近真实场景的大型数据集MSMT17,即Multi-Scene Multi-Time,涵盖了多场景多时段。

论文地址:https://arxiv.org/pdf/1711.08565.pdf

 

MSMT17对比之前数据的优点

1)数目更多的行人、包围框、摄像头数:MSMT17包含126,441个边界框,4101个身份,比以前的数据集大很多。

2)复杂的场景和背景:MSMT17包含的摄像机数量最多,即,15个摄像头被放置在不同的地方。它还由室内和室外的视频构成,这在以前的数据集中没有考虑到。这些考虑导致复杂的背景和场景变化,也使MSMT17更有吸引力和挑战性。

3)涵盖多时段,因此有复杂的光照变化:收集MSMT17有12个时间段,即四天后是上午、中午和下午。它比以前的数据集更好地模拟真实场景,但带来了严重的照明变化。

4)更可靠的bouning box探测器:与手工标注和DMP标注相比, Faster RCNN在实际应用中为提供了更快的选择,如更容易实现和更准确。

 

MSMT17数据集描述

        数据集采用了安防在校园内的15个摄像头网络,其中包含12个户外摄像头和3个室内摄像头。为了采集原始监控视频,在一个月里选择了具有不同天气条件的4天。每天采集3个小时的视频,涵盖了早上、中午、下午三个时间段。因此,总共的原始视频时长为180小时。

        基于Faster RCNN作为行人检测器,三位人工标注员用了两个月时间查看检测到的包围框和标注行人标签。最终,得到4101个行人的126441个包围框。

 

评估协议

        按照训练-测试为1:3的比例对数据集进行随机划分,而不是像其他数据集一样均等划分。这样做的目的是鼓励高效率的训练策略,由于在真实应用中标注数据的昂贵。

        最后,训练集包含1041个行人共32621个包围框,而测试集包括3060个行人共93820个包围框。对于测试集,11659个包围框被随机选出来作为query,而其它82161个包围框作为gallery.

        测试指标为CMC曲线和mAP. 对于每个query, 可能存在多个正匹配。

 

 

你可能感兴趣的:(计算机视觉,人工智能,深度学习)