科研问题中,我们经常遇到各种各样的矩阵求导问题,归纳起来主要有这两类:
1. 数量函数对矩阵变量的求导
2. 矩阵值函数对矩阵变量的求导
(注:遇到点乘等问题时,通过转置等手段转换为矩阵问题)
latex 符号参考:
http://www.mohu.org/info/symbols/symbols.htm
http://zhidao.baidu.com/link?url=For6yUOPJuqgZMpSpSZB_RYkIUTQo9tvLunp9WwNWS6K7xHoYAgZJ4io3qMyo2V938KbUbk0bxO_bOSQmLxiCVRy3oC19e6u9MqvGk-9E8i 矩阵的输入
设 f(X) 是以矩阵 X=(xij)m×n 为自变量的 mn 元函数,且 ∂f∂xij(i=1,2,⋯,n) 都存在,规定 f 对 X d 导数 dfdX 为
【例1】设 a=(a1,a2,⋯,an)T 为给定的向量, x=(x1,x2,⋯,xn)T 是向量变量,且
【例2】设 A=(aij)n×n 为给定的矩阵, x=(x1,⋯,xn)T 是向量变量, f(x)=xTAx ,求 dfdx
解: xT=(x1,⋯,xn)
设 X=(xij)m×n .由mn元函数 fij(x)(i=1,2,⋯,r;j=1,2,⋯,s) 定义的矩阵值函数 F(X)=(fij(X))r×s 对矩阵X的导数为:
【例3】设 x=(x1,x2,⋯,xn) , n 元函数 fj(x)=fj(x1,x2,⋯,xn)(j=1,2,⋯,n) ,令
(注:迹为矩阵主对角线的个元素之和)
【例4】 设 X 为 n×m 的矩阵, A,B 分别为 n×n 和 m×n 的常数矩阵,证明:
(1) ddX(tr(BX))=ddX(tr(XTBT))=BT
(2) ddX(tr(XTAX))=(A+AT)X
证明:(1) tr(BX)=∑nk=1∑ms=1bksxsk
所以 ddxij(tr(BX))=bji,(i=1,2,⋯,n;j=1,2,⋯,m)
ddX(tr(BX))=BT
又由于 tr(BX)=tr((BX)T)=tr(XTBT)
所以上式成立
(2)
1.对矩阵的求导和对数的求导一样满足相应的加减乘除的性质
2.在解决矩阵的求导问题时,我们经常先化为对矩阵元素的求导问题,再进行组合
3. 注意相关下标符号的选取,比如我们要求 ∂f∂xij ,在求解的过程中对 f 的表示我们一般用 xks ,这样便于符号的区分