AAAI 2020 | GlobalTrack:简单又强大!视频长期目标跟踪新基线

点击我爱计算机视觉标星,更快获取CVML新技术


今日新出论文GlobalTrack: A Simple and Strong Baseline for Long-term Tracking,提出一种全新的使用全局搜索思路的视频长期目标跟踪方法GlobalTrack,使用极其简单的架构,按照作者的说法“没有运动模型,没有在线学习,没有位置或尺度变化的惩罚,没有尺度平滑和轨迹改进,因此没有累积误差”,特别适合于目标长期跟踪。

该文作者信息:

AAAI 2020 | GlobalTrack:简单又强大!视频长期目标跟踪新基线_第1张图片

作者团队来自中科院和中科院大学。

目标跟踪问题中,为了更好的利用前一帧甚至前几帧的信息,往往会对模型做很多假设,包括目标的运动、位置变化、尺度变化等,而这也带来了模型的累计误差,在长期跟踪时,这样的累计误差往往会使得后期的目标跟踪结果差很多。

作者在文中给出的一些例子:

AAAI 2020 | GlobalTrack:简单又强大!视频长期目标跟踪新基线_第2张图片

面对目标的尺度变化、遮挡、消失重现等问题,该文提出的算法GlobalTrack和其他SOTA的比较结果。因为 GlobalTrack 对视频每一帧的跟踪完全不依赖相邻帧,没有累计误差使得它在长期跟踪问题中准确率保持稳定。

重头戏来了!

作者使用的算法网络架构:

AAAI 2020 | GlobalTrack:简单又强大!视频长期目标跟踪新基线_第3张图片

有意思的是,作者是在二阶段目标检测器Faster R-CNN启发下发明了 GlobalTrack 算法。

作者完全把目标跟踪看为全局实例搜索问题,即在给定第一帧目标包围框后,对后续每一帧的跟踪过程都是一样的。

其最大的创新点在于Query-Guided RPNQuery-Guided RCNN模块。


查询图像和搜索图像经过骨干网后,进入Query-Guided RPN,仿照Faster R-CNN,它用于生成目标候选框,不同的是它是一个根据特定查询图生成特定目标候选框的网络结构,故称“查询引导的 RPN”,具体做法是在特征调和时,将ROI特征和搜索图特征进行卷积计算相关。

而 Query-Guided RCNN 则是对候选目标位置进行更精细的分类和定位,同样其也使用了特征调和模块。跟踪时直接使用置信度最高的候选目标包围框作为最终结果。

下图是作者举的一个例子:

AAAI 2020 | GlobalTrack:简单又强大!视频长期目标跟踪新基线_第4张图片

车牌在长期跟踪过程中消失了一段时间,当车牌再次出现的时候其他跟踪算法就再也无法恢复跟踪了,而没有累计误差的 GlobalTrack不受前面的影响立刻跟踪到了目标。

下面是在一些主流数据集上与其他算法的比较:

AAAI 2020 | GlobalTrack:简单又强大!视频长期目标跟踪新基线_第5张图片

AAAI 2020 | GlobalTrack:简单又强大!视频长期目标跟踪新基线_第6张图片

AAAI 2020 | GlobalTrack:简单又强大!视频长期目标跟踪新基线_第7张图片

AAAI 2020 | GlobalTrack:简单又强大!视频长期目标跟踪新基线_第8张图片

AAAI 2020 | GlobalTrack:简单又强大!视频长期目标跟踪新基线_第9张图片

从比较结果看,在没有使用任何后处理等步骤的前提下,GlobalTrack 取得了SOTA的结果,而且非常值得一提的是,作者认为,测评数据集中的视频长度越长,GlobalTrack 的表现越好!

作者称代码将很快开源,期望这种简单又强大的长期目标跟踪基线算法能启发更多优秀的工作!

论文地址

https://arxiv.org/abs/1912.08531v1

在我爱计算机视觉公众号后台回复“GlobalTrack”,即可收到论文下载地址。

代码地址

https://github.com/huanglianghua/GlobalTrack

(代码暂未开源)


目标跟踪交流群

关注最新最前沿目标跟踪技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

请务必注明:跟踪

喜欢在QQ交流的童鞋,可以加52CV官方QQ群805388940

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

你可能感兴趣的:(AAAI 2020 | GlobalTrack:简单又强大!视频长期目标跟踪新基线)