MOSSE

            MOSSE(Minimum Output Sum of Squared Error filter)是将相关滤波引入视觉跟踪领域的开创性文章,后续有很多跟踪算法基于相关滤波,在本文对MOSSE相关原理做详细介绍,便于后续理解其他相关滤波算法,本文涉及公式推导的详细过程,便于加深对相关滤波的理解。

motivation——相关性定义

两个信号 f f i i 在时刻 τ τ 的相关性(correlation)(即:在时刻 τ τ 的相似程度)在信号处理学中定义为:

(fi)(τ)=f(t)i(t+τ)dt ( f ⊗ i ) ( τ ) = ∫ − ∞ ∞ f ∗ ( t ) i ( t + τ ) d t

离散形式为:
(fi)(n)=f[m]i(m+n) ( f ⊗ i ) ( n ) = ∑ − ∞ ∞ f ∗ [ m ] i ( m + n )

迁移——与跟踪任务相结合

            在object tracking中引入correlation filter,的基本思路是:用初始帧中的目标训练跟踪器(也就是correlation filter),得到参数矩阵h(后文会做详细解释),在下一帧中通过下式计算得到g,目标bounding box的确定规则:the location corresponding to the maximum value in the correlation output indicates the new position of the target,也就是说输出矩阵g中的最大值对应着目标在下一帧的位置。

g=fh g = f ⊗ h

根据 卷积定理,上式可写成如下形式:
G=FH G = F ⊙ H ∗

其中: F=F(f) F = F ( f )   f:输入图像的特征矩阵
                H=F(h) H = F ( h )   h:tracker的参数矩阵
                :Element-wise multiplication
                :卷积
                    :The complex conjugate
而在跟踪中,主要是计算H:滤波器参数矩阵,H可以通过下式计算得到:

H=GF H ∗ = G F

最小二乘法的引入

理想情况下是,实际上H为目标本身的特征,但是该方法在实际应用中是行不通的,由于下一帧的目标和当前帧的目标特征矩阵不可能完全相同,因此,为了提高跟踪器的鲁棒性,采用最小二乘模型,即MOSSE,因此,H自然成为滤波器参数矩阵(此处的h的含义是在最小二乘中的含义,是更上层的含义,与直观的目标本身的特征不同,它代表的是与待跟踪目标最相似的群体的特征的集合的综合表示,可以这么理解,整数表示所用整数型数字的集合,集合中的数字,相当于特定的目标特征矩阵,而整数代表H参数模型),引入MOSSE模型如下,尽可能使预测的结果矩阵和标签矩阵接近:

mHini|FiHGi|2 m H ∗ i n ∑ i | F i ⊙ H ∗ − G i | 2

通过元素级别的计算来优化H

引用作者原文中的解释:MOSSE finds a filter H that minimizes the sum of squared error between the actual output of the convolution and the desired output of the convolution.
由于上式均为元素级别的运算,因此,可通过分别计算H的每个元素 Hwv H w v 来优化H,下式与上式等价:

mHini|FwviHwvGwvi|2 m H ∗ i n ∑ i | F w v i H w v ∗ − G w v i | 2

其中:i:第i个训练样本;
               
Fwvi F w v i
:第i个训练样本特征矩阵的w行v列的元素,是一个标量;
               
Hwv H w v
:参数矩阵的w行v列的元素,是一个标量,由于参数矩阵是从m个样本中训练出来的,因此,参数矩阵只有一个。
               
Gwvi G w v i
:第i个训练样本的标签矩阵(此处与KCF中略有不同)的w行v列的元素,是一个标量;
因此,以下求导都是常量(涉及到复数)求导
0=Hwvi=1m|FwviHwvGwvi|2=Hwvi=1m[(FwviHwvGwvi)(FwviHwvGwvi)]=Hwvi=1m[(FwviHwv)(FwviHwv)FwviHwvGwviGwvi(FwviHwv)+GwviGwvi]=Hwvi=1m(FwviHwvHwvFwviFwviHwvGwviGwviHwvFwvi+GwviGwvi)=i=1m(FwviHwvFwviFwviGwvi)(86)(87)(88)(89)(90) (86) 0 = ∂ ∂ H w v ∗ ∑ i = 1 m | F w v i H w v ∗ − G w v i | 2 (87) = ∂ ∂ H w v ∗ ∑ i = 1 m [ ( F w v i H w v ∗ − G w v i ) ( F w v i H w v ∗ − G w v i ) ∗ ] (88) = ∂ ∂ H w v ∗ ∑ i = 1 m [ ( F w v i H w v ∗ ) ( F w v i H w v ∗ ) ∗ − F w v i H w v ∗ G w v i ∗ − G w v i ( F w v i H w v ∗ ) ∗ + G w v i G w v i ∗ ] (89) = ∂ ∂ H w v ∗ ∑ i = 1 m ( F w v i H w v ∗ H w v F w v i ∗ − F w v i H w v ∗ G w v i ∗ − G w v i H w v F w v i ∗ + G w v i G w v i ∗ ) (90) = ∑ i = 1 m ( F w v i H w v F w v i ∗ − F w v i G w v i ∗ )

解得:

Hwv=iFwviGwviiFwviFwvi H w v = ∑ i F w v i G w v i ∗ ∑ i F w v i F w v i ∗

H=iFwvGwviFwvFwv H = ∑ i F w v ⊙ G w v ∗ ∑ i F w v ⊙ F w v ∗

这个式子似乎有一定的规律:the numerator is the correlation between the input and the desired output and the denominator is the energy spectrum of the input.

正则项的添加

学习率更新规则

你可能感兴趣的:(Tracking)