【论文笔记】MOT2015数据集

论文: MOTChallenge 2015: Towards a Benchmark for Multi-Target Tracking

Data Format

MOT15数据集的文档组织格式,所有视频被按帧分为图像,图像统一采用jpeg格式,命名方式为6位数字如:000001.jpg,目标和轨迹信息标注文件为CSV格式。每行代表一个对象实例,它包含10个值,如Tab2所示。

【论文笔记】MOT2015数据集_第1张图片

目标信息文件和轨迹信息文件每行都代表一个目标的相关信息,每行都包含10个数值。

目标检测文件:det.txt

目标检测文件中内容见下图,第一个值表示目标出现在第几帧,第二个值表示目标运动轨迹的ID号,在目标信息文件中都为-1,第三到第六个值为标注bounding box的坐标尺寸值,第七个值为目标检测表示的confidence score,最后三个数字表示行人实际坐标中的3D位置。 这个位置代表人的脚。 在2D追踪的情况下,这些值将被忽略并可以保留为-1。

An example of such a detection 2D file is:

【论文笔记】MOT2015数据集_第2张图片

目标注释文件:gt.txt

An example of such an annotation 2D file is:

【论文笔记】MOT2015数据集_第3张图片

在这种情况下,在序列的第一帧中有2名行人,身份标签为1,2。第三名行人太小,因此没有考虑,用标志值(第7个值)表示为0。 第二帧,我们可以看到行人1仍然在场景中。 请注意,由于这是一个2D注释文件,因此行人的3D位置将被忽略,因此设置为-1。 注意,包括边界框的所有值都是基于1的,即左上角对应于(1,1)。

你可能感兴趣的:(数据)