[RGBT-VOT1](2022TCSVT)SiamCDA: Complementarity- and Distractor-Aware RGB-T Tracking

Abstract

近些年因为Siamese在RGB跟踪中的优秀表现,其在RGB-T跟踪中也逐渐流行。尽管Siamese网络可以达到实时跟踪更快的速度,但像比如其他RGB-T跟踪器来说,现存的Siamese网络的精度仍然较低且鲁棒性较差。

为了解决以上问题,本文提出了a new complementarity- and distractor-aware RGB-T tracker based on Siamese network, 称为SiamCDA。其中几个重要模块包括:

  1. FPN (feature pyramid network) 捕获单模态内特征的cross-level信息;
  2. CA-MF (a complementarity-aware multi-modal feature fusion module) 捕获两种模态间的跨模态信息;
  3. DAS (a distractor-aware region prposal selection module) 用于在边界框选择阶段进一步增强tracker的鲁棒性。

I. Introduction

目标跟踪现状:VOT旨在一段视频序列中估计一个任意目标的位置,这个目标仅在第一帧给出他的定位。VOT是CV中一个基础的研究任务,可用于大量实际应用中如视频监控、无人驾驶和人机交互等。随着数学建模技术的探索,尤其是深度学习,近期先进的跟踪方法聚焦于使用大量带标签的视频数据集以离线的方式训练一个端到端的网络

你可能感兴趣的:(目标跟踪,计算机视觉,目标跟踪,深度学习)