多目标跟踪MOT简要概述

单目标跟踪(SOT),目标出现时先验的
多目标跟踪(MOT)则需要一个检测步骤来识别出能够离开或进入场景的目标。

论文结构:
首先描述MOT算法的一般结构和最常用的度量和数据集。
再探讨了MOT算法的四个步骤中的每一个步骤中的各种基于DL的模型和算法。
之后对所提出的算法进行了数值比较,指出了当前方法的共同趋势和模式,以及一些局限性和未来可能的研究方向。
最后,总结了前几节的研究结果,并提出了一些最后的评论。

MOT算法简介
MOT算法中使用的标准方法是逐检测跟踪:从视频帧中提取一组检测(即识别图像中目标的边界框),用于指导跟踪过程,通常通过将它们关联起来,以便为包含相同目标的边界框分配相同的ID。

MOT算法也可以分为批处理方法和在线方法。

**批处理方法:**在尝试确定某个帧中的对象身份时,允许使用未来信息(即来自未来帧的信息)。它们经常利用全局信息,从而提高跟踪质量。
**在线方法:**只能使用当前和过去的信息来预测当前帧。 (相较于批处理方法,在线方法的性能更差,因为他们无法使用将来的信息修复过去的错误)

MOT算法一般步骤:

检测阶段:目标检测算法分析每个输入帧,使用边界框来识别属于目标类的对象。
特征提取/运动预测阶段:一个或多个特征提取算法分析检测和/或轨迹,以提取外观、运动和/或交互特征。根据需要情况,运动预测器预测每个跟踪目标的下一个位置
亲和力阶段:特征和运动预测用于计算成对检测和/或轨迹之间的相似性/距离分数;
•关联阶段:相似性/距离度量用于关联属于同一目标的检测和轨迹,方法是将同一ID分配给识别同一目标的检测。
多目标跟踪MOT简要概述_第1张图片
MOT算法的一般工作流程:给定视频的原始帧(1),运行对象检测器来获取对象(2)的边界框。然后,对于每个检测到的对象,计算不同的特征,通常是视觉特征和运动特征(3)。然后,关联计算步骤计算属于同一目标(4)的两个对象的概率,最后关联步骤为每个对象(5)分配一个数字ID。

度量
经典度量:主要突出了MOT算法可能产生的不同类型的错误。(该方法主要计算下面这几个方面)
主要跟踪(MT)轨迹:在至少80%的帧中正确跟踪的地面真实轨迹数。
碎片:假设轨迹最多覆盖地面真实轨迹的80%。观察到一个真实的轨迹可以被多个碎片覆盖。
大部分丢失(ML)轨迹:在不到20%的帧中正确跟踪的地面真实轨迹数。
虚假轨迹:与真实物体(即地面真实轨迹)不一致的预测轨迹。
ID开关:正确跟踪对象,但对象的关联ID被错误更改的次数。

CLEAR MOT metrics

MOTA(多目标跟踪准确度)

MOTP(多目标跟踪精度)

ID scores

数据集

MOTChallenge(最常用)
还有:MOT15、MOT16/17、MOT19、KITTI

你可能感兴趣的:(目标跟踪,数据集,算法,机器学习)