StrongSORT:Make DeepSORT Great Again

1北京邮电大学2中国网络系统与网络文化北京市重点实验室

摘要。

现有的多目标跟踪( Multi-Object Tracking,MOT )方法大致可以分为基于检测的跟踪和联合检测关联两种范式。虽然后者引起了更多的关注,并显示出与前者相当的性能,但我们声称,在跟踪精度方面,检测跟踪范式仍然是最佳解决方案。在本文中,我们重新审视了经典的DeepSORT跟踪器,并从检测、嵌入和关联等多个方面对其进行了升级。生成的跟踪器称为Strong SORT,在MOT17和MOT20上设置新的HOTA和IDF1记录。我们还提出了两种轻量级和即插即用的算法来进一步优化跟踪结果。首先,提出一种无外观链接模型( AFLink )将短轨迹关联到完整轨迹。据我们所知,这是第一个没有外观信息的全局链接模型。其次,我们提出了高斯平滑插值( GSI )来补偿漏检。GSI不是像线性插值那样忽略运动信息,而是基于高斯过程回归算法,可以实现更精确的定位。此外,AFLink和GSI可以插入到各种跟踪器中,额外的计算成本( MOT17上分别为591.9和140.9 Hz)可以忽略不计。通过将StrongSORT与这两个算法集成,最终的StrongSORT + +在HOTA和IDF1指标上在MOT17和MOT20上排名第一,并以1.3 - 2.2超越第二名。代码将很快发布。

关键字:多目标跟踪,检测跟踪,轻量级

1引言

多目标跟踪( MOT )在视频理解中起着至关重要的作用。它旨在逐帧检测和跟踪对象的所有特定类。在过去的几年中,tracking-by-detection[ 3、4、36、62、69]范式主导了多目标追踪任务。它执行每帧检测,并将MOT问题描述为数据关联任务。 它执行每帧检测&#x

你可能感兴趣的:(多目标跟踪,目标跟踪,人工智能,计算机视觉)