随记(8):CVPR2021关于Tracking的论文速读(2)-11篇

快放假了,心情顺畅,读论文也很“流畅”

Learning Dynamics via Graph Neural Networks for Human Pose Estimation and Tracking
    1.提出了一种新的在线学习姿态动力学的方法,该方法独立于当前帧的姿态检测,因此可以结合当前帧的检测结果做出更优化的姿态估计
    2.通过显式地考虑时空和视觉信息的图形神经网络(GNN)来推导这种动力学预测。模型将历史姿势轨迹作为输入,并直接预测每个轨迹在下一帧中的相应姿势。然后,预测的姿势将与检测到的姿势(如果有的话)在同一帧中聚合,从而产生最终姿势,潜在地恢复估计器遗漏的遮挡关节
    3.致力于解决tracking-by-detection范式中严重依赖检测结果从而易受到遮挡,影响效果的问题
    4.图网络相关

Learning to Filter: Siamese Relation Network for Robust Tracking
    1.通过引入Relation Detector (RD) 和 Refinement Module (RM)两个模块以及对比训练策略来提升基于暹罗网络做跟踪任务的性能
    2.RD模块是元学习的形式;RM就是两个并行的分类和回归CNN模块,放在RD模块后;既然存在少样本学习和元学习的相应模块,一般地也就会有对比学习存在

Learning to Fuse Asymmetric Feature Maps in Siamese Trackers
    1.基于暹罗的跟踪器通常采用深度互相关(DW-XCorr)从两个特征映射(目标和搜索区域)获得多通道相关信息。但DW-XCorr在基于暹罗的跟踪中有几个局限性:它很容易被干扰物干扰(欺骗、混淆),激活的通道较少,并且对对象边界的辨别能力较弱。此外,DW-XCorr是一个手工制作的无参数模块,不能完全受益于大规模数据的离线学习。
    2.提出了一个可学习的模块,称为非对称卷积(ACM),它在大规模数据的离线训练中学习更好地捕捉语义关联信息。
    3.与DW-XCorr及其前身(XCorr)将单个特征映射作为卷积核不同,该ACM将拼接的特征映射上的卷积运算分解为两个数学上等价的运算,从而避免了拼接时特征映射的大小(宽度和高度)相同的要求。ACM可以将有用的先验信息(如边界框大小)与标准视觉功能结合起来。此外,ACM可以很容易地集成到现有的基于DW-XCorr或XCorr的暹罗追踪器中。

LightTrack: Finding Lightweight Neural Networks for Object Tracking via One-Shot Architecture Search
    NAS的工作先不做过多了解

MeanShift++: Extremely Fast Mode-Seeking With Applications to Segmentation and Object Tracking
    1.意在升级MeanShift算法
    2.使用基于网格的方法来加速Mean Shift步骤,用相邻网格单元的密度加权平均值代替计算量较大的邻居搜索
    3.更重要的证明这种基于网格的方法是科学的,并给出了理论证明

Multiple Object Tracking with Correlation Learning
    1.提出利用局部相关模块来建模目标与周围环境之间的拓扑关系,从而增强了模型在拥挤场景中的分辨能力
    2.可分为三个阶段:(1)一般特征提取,(2)从时空相关性中学习相关性并同时预测检测,(3)进行数据关联,将检测分配到它们最可能的轨迹,其中阶段(1)和阶段(2)是可区分的,并组成端到端可训练的体系结构
    3.是一种DeepSORT框架和Transformer注意力机制的结合
    4.同时也是在Patch based feature extraction基础上的工作

Online Multiple Object Tracking with Cross-Task Synergy
    1.是Trackor++的改进工作
    2.通常的预测方法很少考虑物体之间的相互作用,因此在处理遮挡问题时,位置预测本身就不够强大。在遮挡较重的情况下进行预测通常会导致边界框漂移,即目标的预测位置开始跟随邻近对象。然后,由于错误预测的边界框,提取的用于关联的嵌入恶化。这可能导致在连续帧上传播的关联错误。在这种情况下,预测会损害关联嵌入,而不是帮助。同时,单独改进嵌入只能减少关联阶段的误差,这无助于直接防止位置预测误差。
    3.将这两项任务协同优化
    4.通过使用注意力机制完成

Polygonal Point Set Tracking
    1.提出了一种新的基于学习的多边形点集跟踪方法。与现有的传播像素化对象掩码信息的视频对象分割方法不同的是,该文在帧上传播多边形点集
    2.与追踪人体关键点有些不同

Probabilistic Tracklet Scoring and Inpainting for Multiple Object Tracking
    1.引入了一种概率自回归运动模型,通过直接测量轨迹提案的可能性来对其进行评分
    2.通过训练模型来学习自然轨迹的基本分布来实现的。
    3.这样的模型不仅允许将新的检测分配给现有的轨迹,而且还允许在对象长时间丢失(例如,由于遮挡)时,通过采样轨迹来填充轨迹,以填补错误检测造成的空白
    4.比较有意思的是还可以从轨迹的角度去反馈跟踪方法本身

Progressive Unsupervised Learning for Visual Object Tracking
    1.提出一种用于跟踪的渐进式无监督学习框架
    2.步骤是:对比学习->学习一种背景判别模型->挖掘连续帧中的时间对应补丁->抗躁损失函数->学习时间对应关系->主干用暹罗网络

Quasi-Dense Similarity Learning for Multiple Object Tracking
    1.提出密集相似性学习
    2.以前的方法只使用稀疏的ground truth作为训练目标,而忽略了图像上的大部分信息区域
    3.除了稀疏分布在图像上的地面事实和检测到的包围盒之外,许多可能的目标区域可以提供有价值的训练监督。它们要么接近真实边界框以提供更多正面训练示例,要么在背景作为负面示例。
    4.因此提出准密集相似学习,它在一对图像上密集地匹配数百个感兴趣的区域进行对比学习。准密集样本可以覆盖图像上的大部分信息区,提供更多的box样本和hard negatives。

你可能感兴趣的:(磕磕绊绊)