《Extending IOU Based Multi-Object Tracking by Visual Information》


    • 1、简介
    • 2、方法
      • IOU 跟踪器
      • 视觉跟踪扩展
    • 参考文献


近些年目标检测算法效果的显著提升,出现了一些精度相当高的检测算法如:Faster/Mask R-CNN【11】【12】【24】FCN【20】SSD【19】
SORT【5】使用卡尔曼滤波运动模型和匈牙利算法来解决关联问题。这一方法后来被拓展到deepsort【30】通过使用深度特征来处理长时间遮挡的问题。与SORT相似的时IOU Tracker依赖于检测而不是图像信息。这个简单的跟踪器不使用运动模型,并以贪婪的方式将检测与跟踪联系起来。因此,IOU跟踪器可以以每秒数千帧的速度运行(假设所需的检测可用),同时优于更复杂的先进方法【21】。.这种简单方法的一个主要缺点是需要对底层检测器进行高召回。由于一次或几次检测不到而造成的每个间隔不仅会导致假阴性,还会导致轨迹的终止和重新启动,从而导致高频率的轨迹碎片和身份转换。



IOU 跟踪器

IOU跟踪器仅仅根据IOU信息来关联检测结果,采用一种贪心的方式:一个检测结果与上一帧IOU最大的track关联。尽管没有优化,但是这里启发式的方法非常高效。或者说,这也可以被当作一个线性分配问题利用匈牙利算法求解。在真实世界中FP/FN检测结果会干扰跟踪的过程。因此跟踪结果必须有一定的过滤规则,比如每个track必须包含一个高置信度的检测结果 ( ≥ σ h ) \left( \geq \sigma_{h}\right) (σh),以及每个track至少有一个最小的跟踪时间 t min ⁡ t_{\min } tmin。这样有效的规则能够排除一些导致跟踪失败的FP。同时FN会导致一些track迅速地结束,由于IOU跟踪器不会传播上一次检测结果,因此将在下一个可用的检测结果上创建一个新的track。这些因素导致了高频率地身份转换和轨迹碎片。


《Extending IOU Based Multi-Object Tracking by Visual Information》_第1张图片
图 1.扩展IOU跟踪器的基本原理:由于检测缺失会导致轨迹碎片化(a)。可以用视觉跟踪器来弥补缺失的部分(b)。最终的跟踪结果的碎片化程度减少(c)

视觉跟踪在两个方向执行:第一,如果没有detection满足【6】中的IOU匹配阈值 σ I O U \sigma_{I O U} σIOU,那么就在最后一个已知的位置(上一帧detection的位置)初始化一个视觉跟踪器,并用来跟踪目标一段时间(最多 t t l t t l ttl帧)。如果一个新的detection在 t t l t t l ttl帧内满足 σ I O U \sigma_{I O U} σIOU匹配的阈值,则停止视觉跟踪,继续IOU跟踪;否则停止跟踪。这通常足以可靠地补偿少量缺失的detection。
然而,随着视觉跟踪帧数的增加,视觉跟踪器更有可能跟丢原先目标或跳到另一个目标。为了限制仅通过视觉线索跟踪对象的连续帧的数量,我们还针对每个新的track向后通过最后的 t t l t t l ttl帧执行视觉跟踪。如果对于现有的完成轨道满足重叠标准,则合并它们。 通过这种方式,可以关联长度最多为2· t t l t t l ttl帧的间隙,而单个视觉对象跟踪器仅用于最多 t t l t t l ttl帧。


