矩阵定理复习记录

矩阵复习

矩阵导数定理

若A是一个如下矩阵:
A = [ a 11 a 12 a 21 a 22 ] A= \begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix} A=[a11a21a12a22]
y是一个向量矩阵:
y ⃗ = [ y 1 y 2 ] \vec{y}=\begin{bmatrix}y_1\\y_2\end{bmatrix} y =[y1y2]
则可得 text 定理:
δ A ∗ y ⃗ δ y ⃗ = A T \frac{δA*\vec{y}}{δ\vec{y}} = A^T δy δAy =AT
δ y ⃗ T ∗ A δ y ⃗ = δ A T ∗ y ⃗ δ y ⃗ = A \frac{δ\vec{y}^T*A}{δ\vec{y}} = \frac{δA^T*\vec{y}}{δ\vec{y}} = A δy δy TA=δy δATy =A
也就是对A*y的矩阵,求偏导y,结果为A的转置矩阵;

还可得另一个定理:
δ y ⃗ T ∗ A y ⃗ δ y ⃗ = A y ⃗ + A T y ⃗ \frac{δ\vec{y}^T*A\vec{y}}{δ\vec{y}} = A\vec{y}+ A^T\vec{y} δy δy TAy =Ay +ATy
若A是一个对称矩阵,也就是 A T = A A^T=A AT=A,则上面的还会等于
2 A y ⃗ 2A\vec{y} 2Ay

δ符号表示求导, y ⃗ 表示一个向量 \vec{y}表示一个向量 y 表示一个向量

这部分的推导过程可参考此篇视频

矩阵平方定理

若矩阵A满足相乘原则,则有定理:
A 2 = A T ∗ A A^2 = A^T*A A2=ATA

单位矩阵

是一种恒等矩阵,对角线上全为1,其余全为0,如下:
I = [ 1 0 0 0 1 0 0 0 1 ] I = \begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix} I= 100010001
任何矩阵与单位矩阵相乘等于本身:
A ∗ I = I ∗ A = A A*I = I * A = A AI=IA=A

逆矩阵

注意逆矩阵不是转置矩阵,若两个矩阵A和B,n*n的方阵,且满足:
A ∗ B = I A*B=I AB=I
也就是矩阵相乘等于单位矩阵,也说明A就是B的逆矩阵,A是可逆的,记:B=A^-1

最小二乘法

若输入量为 x 1 , x 2 . . . x n x_1,x_2...x_n x1,x2...xn,输出量为 y 1 , y 2 . . . y n y_1,y_2...y_n y1,y2...yn,为了你和一条函数曲线,是的输入为 x i x_i xi,输出为 y i y_i yi,我们假定它是一个多项式函数如 y i = a x i 2 + b x i + c y_i = ax_i^2 + bx_i + c yi=axi2+bxi+c,x和y都有观察数据,求 a , b , c a,b,c a,b,c,因为数据又多组,带入矩阵中运算:
[ x 1 2 x 1 1 x 2 2 x 2 1 . . . . . . . . . x n 2 x n 2 1 ] [ a b c ] = [ y 1 y 2 . . . y n ] \begin{bmatrix}x_1^2 & x_1&1\\x_2^2&x_2&1\\...&...&...\\x_n^2&x_n^2&1\end{bmatrix}\begin{bmatrix}a\\b\\c\end{bmatrix}= \begin{bmatrix}y_1\\y_2\\...\\y_n\end{bmatrix} x12x22...xn2x1x2...xn211...1 abc = y1y2...yn
进而用X,A,Y替换:
X ∗ A = Y X*A=Y XA=Y
A矩阵就是我们要求取的未知参数,往往信号观察是在由噪声的环境中的,假设噪声为V,且噪声的均值为0,也就是正和负噪声,则推导公式:
X ∗ A = Y + V X*A=Y+V XA=Y+V
为了使误差最小,使用最小二乘法,二乘差值平方,也就是:
( Y − X ∗ A ) 2 = ( Y − X ∗ A ) T ( Y − X ∗ A ) (Y-X*A)^2 = (Y-X*A)^T(Y-X*A) (YXA)2=(YXA)T(YXA)
对上面的式子A求偏导:
δ ( Y − X ∗ A ) T ( Y − X ∗ A ) δ A \frac{δ(Y-X*A)^T(Y-X*A)}{δA} δAδ(YXA)T(YXA)
推导过程可参考此视频最小二乘法讲解,求出后领偏导函数等于0求极值,也就是误差最小值,得到定理:
A = ( X T X ) − 1 X T Y A = (X^TX)^{-1}X^TY A=(XTX)1XTY

你可能感兴趣的:(算法,矩阵,线性代数)