【小白笔记】目标跟踪LADCF(VOT2018)

文章目录

  • 1. 主要贡献
  • 2. 方法
      • 2.1模型
      • 2.2优化
      • 2.3 跟踪框架
  • 3 实验

这是VOT18比赛中获得优异成绩的一个算法,在short-term中EAO为第一,但是奇怪的为什么没有把第一颁给他,难道是作者为主办方之一,从代码上来看使用的是BACF的框架,但是核心程序加密,不免有些疑惑,因为算法上来看感觉不会有如此大的提升,下面来看看这篇论文, 论文项目地址, VOT项目地址, 论文地址,有不对的地方欢迎讨论。

1. 主要贡献

  1. 对滤波器的约束用一范取代二范;
  2. 正则项中加入历史模型,期望得到的滤波器保留历史的特性;
  3. 以上两点不算特别新,但是其中还有一个重要的设计,就是仅保留得到滤波器的5%到20%的参数,构成稀疏性,这样不仅能加速求解,更能除去大部分干扰,使滤波器关注于目标部分从而可以使用更大的搜索域,但是我对此方法的性能表示怀疑。

2. 方法

2.1模型

我认为作者极大程度受到BACF的影响,BACF使用了固定的MASK对特征进行了选择,所以这里类似的使用了自适应的MASK,即空域上能量大的位置的特征被保留,其余都为0,作者设置仅保留5%~20%的空域位置,由于滤波器使用了线性核所以对特征选择即对滤波器模板 θ \theta θ选择,接着由于要进行稀疏选择,那么一范正则无疑是比二范更好的存在,因为一范约束能够是最优解落在更稀疏的位置,具体大家可以看看机器学习一范正则的相关介绍。另一改动则是引入历史模型 θ m o d e l {\theta}_{model} θmodel,这个没有什么新奇的,很多人都用过, θ m o d e l {\theta}_{model} θmodel即上一帧更新后的滤波器。稀疏选择的部分没有在最终的目标方程中体现出来,而是算完 θ \theta θ后人工选择了滤波器5%~20%的空域位置。下面给出目标函数
tuyi

2.2优化

使用的手工特征包括HOG和CN等,设共有L层特征通道,那么可以将上面的目标函数拓展到多通道上,如下所示
【小白笔记】目标跟踪LADCF(VOT2018)_第1张图片
因为有一范的存在,所以ADMM算法是最合适的求解算法,首先引入松弛变量如下
【小白笔记】目标跟踪LADCF(VOT2018)_第2张图片
然后引入增广拉格朗日乘子去掉约束项如下
【小白笔记】目标跟踪LADCF(VOT2018)_第3张图片
这个L是凸的,直接应用ADMM迭代求解
【小白笔记】目标跟踪LADCF(VOT2018)_第4张图片
其中H是 η i \eta_i ηi多通道的组合。
下面迭代的过程的求解可以利用FFT加速的方法频域求解,具体的公式就不贴了。作者隐藏的部分代码中就包含了 θ \theta θ的更新过程,我也简单复现了ADMM部分求解的代码如下:

theta_N_f = bsxfun(@times, model_xf, conj(yf)) + lambda2 * theta_model_f + 1/2 * miu * thetap_f - 1/2 * H_f;
theta_D_f = model_xf .* conj(model_xf) + lambda2 + 1/2 * miu;
theta_f = theta_N_f ./ theta_D_f;
theta = real(ifft2(theta_f));
g = theta + H / miu; 
temp = 1 - lambda1./(miu * sum(g.*g,3));
temp(temp<0) = 0;         
thetap = bsxfun(@times, temp, g);
thetap_f = fft2(thetap);
H = H + miu * (theta - thetap);
H_f = fft2(H);
miu = min(rio * miu, miu_max);

2.3 跟踪框架

整体的跟踪框架和BACF类似,只是在滤波器求解上有区别,而且第一帧使用BACF的方法求解得到最初的 θ m o d e l \theta_{model} θmodel,然后按照上一节的方法计算得到 θ \theta θ,再对空域位置的每一个点(包括了该点对应的所有通道的值)计算二范,即每个点处的能量,令能量小的都为0,这样相当于对应的特征位置也为0,从而实现了特征选择,然后按照传统的CF滤波器更新方法进行更新 θ m o d e l = ( 1 − α ) θ m o d e l + α θ {\theta}_{model} = (1-\alpha){\theta}_{model} +\alpha \theta θmodel=(1α)θmodel+αθ
在尺度更新上作者选择了fDSST的方法,且仅有5层,这点很奇怪,因为从实验上看fDSST使用15层以上才会有可以接受的性能,而且VOT代码中使用了SAMF的尺度估计方法和论文中有出入。

3 实验

大部分的参数和BACF保持一致,比如5倍搜索域,对手工特征选择了前5%,对深度特征选择了前20%。
实验效果看十分惊人,手工特征的版本和深度特征的版本在速度和精度上都全面超过了ECO,消融实验中仅仅使用HOG特征的LADCF在OTB100上也达到了惊人的64.3%,这已经超过了ECO-HC,最后贴上结果,希望作者能早日公开全部代码。

【小白笔记】目标跟踪LADCF(VOT2018)_第5张图片
【小白笔记】目标跟踪LADCF(VOT2018)_第6张图片

你可能感兴趣的:(目标跟踪,目标跟踪)