(论文阅读21/100)DeepTrack: Learning Discriminative Feature Representations Online for Robust Visual Trac

文献阅读笔记

简介

题目

DeepTrack: Learning Discriminative Feature Representations Online for Robust Visual Tracking

作者

Hanxi Li, Yi Li, Fatih Porikli

原文链接

arXiv:1503.00072.

关键词

Object tracking algorithm

研究问题

Object tracking algorithm

研究方法

使用单个卷积神经网络( CNN )来学习目标对象的有效特征表示,以纯粹的在线方式。

方式:我们采用了一种基于检测的跟踪策略:一个四层的CNN模型来区分目标物体和周围的背景。我们的CNN对给定帧中物体位置(物体状态)的所有可能假设生成分数。然后选择得分最高的假设作为当前帧中物体状态的预测。我们以纯粹的在线方式更新这个CNN模型。也就是说,所提出的跟踪器只基于感兴趣目标的视频帧进行学习,不需要额外的信息或离线训练。

随机梯度下降法:优化cnn参数

应对偶尔检测到的假阳性:temporal sampling mechanism时间采样机制。object patches停留时间比background时间长。

目标位置的不确定性看作是标签噪声问题。

建议在时间变量(帧索引)和样本类的联合分布中对训练数据进行抽样。在这里,计算样本类的条件概率,给定帧索引,基于该帧中跟踪质量的新度量。

使用多个图像线索(低级图像特征,如归一化灰度图像和图像梯度)作为独立通道作为网络输入

通过迭代地独立训练每个通道来更新CNN参数,然后在融合层上进行联合训练,该融合层替换来自多个通道的最后一个完全连接层。

cnn模型只有在物体发生重大外观变化时才会更新。

研究结论

introduce a novel truncated structural loss function:引进新的截断损失函数。保持更多样本损失并且减少累积误差。

增强了CNN训练中的普通随机梯度下降方法:通过稳健的样本选择机制。采样机制从不同的时间分布中随机产生正负样本,这些样本是通过考虑时间关系和标签噪声而产生的。

为CNN训练设计了一种懒惰但有效的更新方案:对视觉跟踪中长期存在的一些困难如遮挡或错误检测具有鲁棒性,而不会丢失对显著外观变化的有效适应。

超过了所有比较的先进方法。

创新不足

还没看出来

额外知识

drift problem:偏移问题。之所以会产生这个问题是因为干扰不足也就是负样本不足,造成网络对目标和背景没有很高的辨别能力。这里告诉我们负样本对于训练也很重要。

你可能感兴趣的:(计算机视觉,人工智能,论文阅读,目标跟踪)