论文题目:High-Speed Tracking with Kernelized Correlation Filters
作者主页:http://www.robots.ox.ac.uk/~joao/circulant/
在线性条件下,利用循环矩阵,最终的解为
w^=x^∗⊙y^x^∗⊙x^+λ(1) (1) w ^ = x ^ ∗ ⊙ y ^ x ^ ∗ ⊙ x ^ + λ
即为论文原文的(12)式,其中:
(1) x^ x ^ 即 F(x) F ( x ) ,表示 x x 的离散傅里叶变换
(2)字母右上角的星号表示共轭矩阵
下面是该公式的推导过程。
首先在傅里叶域,岭回归的解如下所示:
w=(XHX+λI)−1XHy(2) (2) w = ( X H X + λ I ) − 1 X H y
由于我们已经限定了前提条件: X X 是循环矩阵,而循环矩阵又拥有如下特性:
X=Fdiag(x^)FH(3) (3) X = F d i a g ( x ^ ) F H
其中:
(1) F F 是离散傅里叶变换矩阵,它是一个常量;
(2) x x 是生成向量,它用于表示人们感兴趣的图像块
(3) X X 是根据上述 x x 生成的循环矩阵
(4) XH X H 表示 X X 的共轭转置矩阵,即对 XH X H 先进行共轭再进行转置
(5) x^ x ^ 即 F(x) F ( x ) ,表示 x x 的离散傅里叶变换
由(3)式,我们有
XHX=[Fdiag(x^)FH]HFdiag(x^)FH=Fdiag(x^∗)FHFdiag(x^)FH=Fdiag(x^∗)diag(x^)FH(1)(2)(3)(4) (4) (1) X H X = [ F d i a g ( x ^ ) F H ] H F d i a g ( x ^ ) F H (2) = F d i a g ( x ^ ∗ ) F H F d i a g ( x ^ ) F H (3) = F d i a g ( x ^ ∗ ) d i a g ( x ^ ) F H
又因为对对角矩阵的操作都是元素级别的,因此
XHX=Fdiag(x^∗⊙x^)FH(5) (5) X H X = F d i a g ( x ^ ∗ ⊙ x ^ ) F H
其中,符号 ⊙ ⊙ 表示矩阵元素级的乘法,即位置相同的各元素分别相乘
再利用傅里叶变换矩阵的幺正性(unitarity),即: FFH=I F F H = I ,因此上述(2)式可以改写为
w=[Fdiag(x^∗⊙x^)FH+λI]−1XHy=[Fdiag(x^∗⊙x^)FH+λFIFH]−1XHy=[Fdiag(x^∗⊙x^)FH+Fdiag(λ)FH]−1XHy=[Fdiag(x^∗⊙x^+λ)FH]−1XHy=[Fdiag(x^∗⊙x^+λ)−1FH]XHy=[Fdiag(1x^∗⊙x^+λ)FH]XHy(4)(5)(6)(7)(8)(9)(6) (6) (4) w = [ F d i a g ( x ^ ∗ ⊙ x ^ ) F H + λ I ] − 1 X H y (5) = [ F d i a g ( x ^ ∗ ⊙ x ^ ) F H + λ F I F H ] − 1 X H y (6) = [ F d i a g ( x ^ ∗ ⊙ x ^ ) F H + F d i a g ( λ ) F H ] − 1 X H y (7) = [ F d i a g ( x ^ ∗ ⊙ x ^ + λ ) F H ] − 1 X H y (8) = [ F d i a g ( x ^ ∗ ⊙ x ^ + λ ) − 1 F H ] X H y (9) = [ F d i a g ( 1 x ^ ∗ ⊙ x ^ + λ ) F H ] X H y
将(3)式代入(6)式,得
w=[Fdiag(1x^∗⊙x^+λ)FH][Fdiag(x^)FH]Hy=[Fdiag(1x^∗⊙x^+λ)FH][Fdiag(x^∗)FH]y=[Fdiag(1⋅x^∗x^∗⊙x^+λ)FH]y=Fdiag(x^∗x^∗⊙x^+λ)FHy(10)(11)(12)(13)(7) (7) (10) w = [ F d i a g ( 1 x ^ ∗ ⊙ x ^ + λ ) F H ] [ F d i a g ( x ^ ) F H ] H y (11) = [ F d i a g ( 1 x ^ ∗ ⊙ x ^ + λ ) F H ] [ F d i a g ( x ^ ∗ ) F H ] y (12) = [ F d i a g ( 1 ⋅ x ^ ∗ x ^ ∗ ⊙ x ^ + λ ) F H ] y (13) = F d i a g ( x ^ ∗ x ^ ∗ ⊙ x ^ + λ ) F H y
这里得到的(7)式即论文原文中的(56)式,现在继续推导。
根据(3)式所描述的循环矩阵特性,以及循环矩阵的构建法则,我们有
C(x)=Fdiag(x^)FH(8) (8) C ( x ) = F d i a g ( x ^ ) F H
又因为 x^ x ^ 表示 x x 的离散傅里叶变换,它的另一种表达式是 F(x) F ( x ) ,因此有 x=F−1(x^) x = F − 1 ( x ^ ) ,则
C(x)=C(F−1(x^))(9) (9) C ( x ) = C ( F − 1 ( x ^ ) )
综合(8)式和(9)式的等式右半边部分,有
Fdiag(x^)FH=C(F−1(x^))(10) (10) F d i a g ( x ^ ) F H = C ( F − 1 ( x ^ ) )
观察(7)式最后一行,将小括号中的 x^∗x^∗⊙x^+λ x ^ ∗ x ^ ∗ ⊙ x ^ + λ 看作一个整体,再结合上述(10)式,可得
w=C[F−1(x^∗x^∗⊙x^+λ)]y(11) (11) w = C [ F − 1 ( x ^ ∗ x ^ ∗ ⊙ x ^ + λ ) ] y
现在利用循环矩阵卷积性质1
F(Xy)=F[C(x)y]=x^∗⊙y^=F∗(x)⊙F(y)(14)(15)(16)(12) (12) (14) F ( X y ) = F [ C ( x ) y ] (15) = x ^ ∗ ⊙ y ^ (16) = F ∗ ( x ) ⊙ F ( y )
现在观察(11)式,将 F−1(x^∗x^∗⊙x^+λ) F − 1 ( x ^ ∗ x ^ ∗ ⊙ x ^ + λ ) 看作一个整体,有
Fw=F{C[F−1(x^∗x^∗⊙x^+λ)]y}=F∗[F−1(x^∗x^∗⊙x^+λ)]⊙F(y)=(x^∗x^∗⊙x^+λ)∗⊙F(y)=(x^∗x^∗⊙x^+λ)∗⊙y^(17)(18)(19)(20)(13) (13) (17) F w = F { C [ F − 1 ( x ^ ∗ x ^ ∗ ⊙ x ^ + λ ) ] y } (18) = F ∗ [ F − 1 ( x ^ ∗ x ^ ∗ ⊙ x ^ + λ ) ] ⊙ F ( y ) (19) = ( x ^ ∗ x ^ ∗ ⊙ x ^ + λ ) ∗ ⊙ F ( y ) (20) = ( x ^ ∗ x ^ ∗ ⊙ x ^ + λ ) ∗ ⊙ y ^
观察(13)式,由于 x^∗ x ^ ∗ 与 x^ x ^ 是共轭关系,因此 x^∗⊙x^ x ^ ∗ ⊙ x ^ 中的每个元素都是实数,对这样的矩阵取共轭,元素值不发生任何改变,因此(12)式可以继续推导,有
Fw=(x^∗)∗⊙y^(x^∗⊙x^+λ)∗=x^⊙y^x^∗⊙x^+λ(21)(22)(14) (14) (21) F w = ( x ^ ∗ ) ∗ ⊙ y ^ ( x ^ ∗ ⊙ x ^ + λ ) ∗ (22) = x ^ ⊙ y ^ x ^ ∗ ⊙ x ^ + λ
根据离散傅里叶变换的定义, Fw F w 即 w^ w ^ ,两者仅仅只是记法的不同,因此
w^=x^⊙y^x^∗⊙x^+λ(15) (15) w ^ = x ^ ⊙ y ^ x ^ ∗ ⊙ x ^ + λ
注意:此处的(15)式对应论文原文中的(12)式,但分子的表达式稍有出入,此处目前存在争议,国内有研究人员认为当属于论文错误。2
本文的公式推导,离不开博主shenxiaolu1984、博主mhz9123、博主zwlq1314521等人的贡献,在此表示感谢!
下接推导笔记(2)——非线性滤波器、快速检测及快速核相关
更多内容,请扫码关注“视觉边疆”微信订阅号