C-COT 【目标跟踪】个人理解

论文 : Beyond Correlation Filters:Learning Continuous Convolution Operators for Visual Tracking

该文章的主要思想是将传统手工特征换成了 vgg的特征

但是由于特征层的分辨率不同,故通过插值将每层特征转到 【0,T) 空间,公式如下


其中 xd是d层特征,Nd为每层的特征行列数,bd为事先计算的权重,插值可以将特征点精确到亚像素级别

随后将各个特征图和滤波器进行卷起操作,类似于svm求解相应的方式。公式如下:


sf 为 样本x的相应值。然后在该相应图中寻找minMaxLoc,得到最后的置信度。

滤波器的求解方式如下:


其中yi为label ,具体没注意,不过参考kcf的话,可以是gauss分布

aj是训练样本的权重

由于本人数学较差,看不懂部分的公式推导,在文章中,E(f)最小化可以等价于器相对每格滤波器

f的傅里叶系数的最小化。最后又等价于最小平方问题



该公式的最小值可以通过求解一下正规方程获得:


跟踪框架:

   1. 提取样本,以中心点扩大区域,设置样本权重 aj = a(j-1)/(1-λ) λ = 0.0075 权重归一化,

最多存储 m个样本。 迭代时更换权重最小的样本来更新

文章使用5个尺度,比例因子1.02,通过如上的5次计算,获得最佳尺度。


你可能感兴趣的:(相关滤波)