目标跟踪|论文笔记分享|ICCV-2篇

大家好,这里是【来一块葱花饼】,这次带来了目标跟踪的论文分享,与你分享~

之前做了一段时间的目标跟踪算法(以单目标跟踪SOT为主)的研究,学习了四十多篇顶会论文。所以,我新成立了专栏目标跟踪(SOT)|顶会论文|学习笔记,论文笔记与大家分享,方便大家快速了解目标跟踪的进展,掌握不同算法思想。欢迎大家讨论,在评论区写出自己的想法~

本文是ICCV-2篇的目标跟踪论文笔记,与大家分享。具体论文分析笔记,见专栏中的其他文章,欢迎关注。

具体论文分析笔记,见专栏中的其他文章,欢迎大家关注,链接如下:
目标跟踪|近三年|45篇顶会论文整理
目标跟踪|七大数据集|整理
目标跟踪|论文笔记分享|ICCV-6篇
目标跟踪|论文笔记分享|ICCV-2篇
目标跟踪|论文笔记分享|ECCV-6篇
目标跟踪|论文笔记分享|CVPR-12篇
目标跟踪|论文笔记分享|CVPR-10篇(1)
目标跟踪|论文笔记分享|CVPR-10篇(2)

文章目录

  • 一.论文题目
  • 二.主要思想
  • 三.具体文章
    • Learning Discriminative Model Prediction for Tracking
    • GradNet: Gradient-Guided Network for Visual Object Tracking

一.论文题目

论文题目
Learning Discriminative Model Prediction for Tracking
GradNet Gradient-Guided Network for Visual Object Tracking

二.主要思想

主要想法:实现端到端的跟踪;利用梯度信息来更新模板

三.具体文章

Learning Discriminative Model Prediction for Tracking

学习判别模型预测跟踪

本文感觉用处不大

就是使用了特征提取模块、模型预测模块,在推理过程中充分利用目标和背景的外观信息进行目标模型预测

是一个端到端的目标跟踪结构

目前,端到端可训练的计算机视觉系统给视觉跟踪任务带来了重大挑战。与大多数其他视觉问题不同,跟踪需要在推理阶段在线学习一个健壮的目标特定外观模型。为了实现端到端可训练,目标模型的在线学习因此需要嵌入到跟踪体系结构本身。由于这些挑战,流行的Siamese范式只是简单地预测目标特征模板,而在推断过程中忽略背景外观信息。因此,预测模型的目标背景可分辨性有限。

我们开发了一个端到端的跟踪体系结构,能够充分利用目标和背景的外观信息进行目标模型预测。我们的架构是通过设计一个专门的优化过程,能够在几次迭代中预测一个强大的模型,从而获得了一个有区别的学习损失

此外,我们的方法能够了解区别损失本身的关键方面。该跟踪器在6个跟踪基准上设置了一种新的先进水平,在VOT2018上实现了0.440分的EAO得分,同时运行在40fps以上。代码和模型可在

在这项工作中,我们引入了一个可选的跟踪体系结构,以端到端方式训练,它直接解决了前面提到的所有限制。在我们的设计中,我们从最近的追踪器中成功应用的有区别的在线学习程序中获得了灵感[6,9,29]。我们的方法是基于一个目标模型预测网络,它是通过应用一个迭代优化过程得到的一个判别学习损失。该体系结构经过精心设计,以实现有效的端到端训练,同时最大限度地提高预测模型的识别能力。这是通过通过两个关键的设计选择确保最小数量的优化步骤来实现的。首先,我们采用基于最陡下降的方法,在每次迭代中计算最优步长。其次,我们集成了一个有效初始化目标模型的模块。此外,通过学习区别学习损失本身,我们在最终架构中引入了很大的灵活性。
目标跟踪|论文笔记分享|ICCV-2篇_第1张图片

我们跟踪体系结构中的目标分类分支的概述。给定一个带注释的训练集(左上),我们使用一个骨干网络和一个额外的卷积块(Cls Feat)提取深度特征图。然后将特征映射输入到模型predictorD中由初始化器和循环优化器模块组成。模型预测器输出卷积层的权值,卷积层对测试框架提取的特征图进行目标分类

GradNet: Gradient-Guided Network for Visual Object Tracking

用于视觉目标跟踪的梯度引导网络

本文对siamese算法的模板进行更新,是第一次尝试利用梯度中的信息来更新基于暹罗的跟踪器

为了更好地利用梯度信息,避免过拟合,提出了一种模板泛化训练方法

可以学习这种动态模板方法,但是估计效果不是很好

基于模板匹配的全卷积连体网络在视觉跟踪中显示出巨大的潜力。在测试过程中,模板与初始目标特征固定,性能完全依赖于暹罗网络的总体匹配能力

过程中,模板与初始目标特征固定,性能完全依赖于暹罗网络的总体匹配能力

然而,这种方法不能捕获目标或背景杂波的时间变化。在这项工作中,我们提出了一种新的梯度引导网络,利用梯度中的鉴别信息,并通过前馈和向后操作更新siamese网络中的模板。具体来说,该算法可以利用梯度的信息来更新当前帧中的模板。此外,为了更好地利用梯度信息,避免过拟合,提出了一种模板泛化训练方法。据我们所知,这项工作是第一次尝试利用梯度中的信息来更新基于暹罗的跟踪器。在最近的基准测试中进行的大量实验表明,我们的方法比其他最先进的跟踪器获得了更好的性能。

之后我将在专栏目标跟踪(SOT)|顶会论文|学习笔记中,分享近三年的四十多篇顶会文章的详细笔记,方便大家快速入门。

感兴趣的同学点赞+收藏+关注,直接进入专栏进行学习~你们的支持就是我最大的动力~
感兴趣的同学点赞+收藏+关注,直接进入专栏进行学习~你们的支持就是我最大的动力~
感兴趣的同学点赞+收藏+关注,直接进入专栏进行学习~你们的支持就是我最大的动力~

你可能感兴趣的:(目标跟踪,论文阅读,计算机视觉,人工智能,深度学习)