主成分分析降维的数学推导

一、迹运算

(1)迹(trace)是用来表示矩阵主对角元素和的概念:
Tr ⁡ ( A ) = ∑ i A i , i \operatorname{Tr}(\boldsymbol{A})=\sum_{i} \boldsymbol{A}_{i, i} Tr(A)=iAi,i
例如 A = [ a 11 a 12 a 21 a 22 ] A=\begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix} A=[a11a21a12a22],则 T r ( A ) = a 11 + a 22 Tr(A)=a_{11}+a_{22} Tr(A)=a11+a22.

(2)若不使用求和符号 ∑ \sum ,有些矩阵运算很难描述,而通过矩阵乘法和迹运算符号可以清楚地表示。例如,Frobenius范数 ∥ A ∥ F = ∑ i , j A i , j 2 \quad\|A\|_{F}=\sqrt{\sum_{i, j} A_{i, j}^{2}}\quad AF=i,jAi,j2 的另一种表示方式可以是:
∥ A ∥ F = Tr ⁡ ( A A ⊤ ) \|A\|_{F}=\sqrt{\operatorname{Tr}\left(A A^{\top}\right)} AF=Tr(AA)
这其实不难证明:
同样利用上面的矩阵 A A A A A T = [ a 11 a 12 a 21 a 22 ] [ a 11 a 21 a 12 a 22 ] = [ a 11 2 + a 12 2 ⋯ ⋯ a 21 2 + a 22 2 ] AA^{T}=\begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix}\begin{bmatrix}a_{11}&a_{21}\\a_{12}&a_{22}\end{bmatrix}=\begin{bmatrix}a_{11}^2+a_{12}^2&\cdots\\\cdots&a_{21}^2+a_{22}^2\end{bmatrix} AAT=[a11a21a12a22][a11a12a21a22]=[a112+a122a212+a222]

显然, Tr ⁡ ( A A ⊤ ) = a 11 2 + a 12 2 + a 21 2 + a 22 2 = ∥ A ∥ F \sqrt{\operatorname{Tr}\left(A A^{\top}\right)}=\sqrt{a_{11}^2+a_{12}^2+a_{21}^2+a_{22}^2}=\|A\|_{F} Tr(AA) =a112+a122+a212+a222 =AF,得证。

(3)迹运算的一些性质:

  • Tr ⁡ ( A ) = Tr ⁡ ( A T ) \operatorname{Tr}(\boldsymbol{A})=\operatorname{Tr}\left(\boldsymbol{A}^{T}\right) Tr(A)=Tr(AT)
  • Tr ⁡ ( A B C ) = Tr ⁡ ( C A B ) = Tr ⁡ ( B C A ) \operatorname{Tr}(A B C)=\operatorname{Tr}(C A B)=\operatorname{Tr}(B C A) Tr(ABC)=Tr(CAB)=Tr(BCA)
  • a = Tr ⁡ ( a ) a=\operatorname{Tr}(a) a=Tr(a)

二、主成分分析

主成分分析降维的数学推导_第1张图片
主成分分析降维的数学推导_第2张图片
通过数学归纳法可证:
  更一般的,当希望得到主成分的基时,矩阵 D D D由其前 l l l 个特征值对应的特征向量组成。


三、由PCA公式推导学到的

  1. 常见目标:最小化 / 最大化
  2. 为简化问题可适当增加约束条件,或者减少分析的维数(例如上面先令 l = 1 l=1 l=1
  3. 使用迹运算与化局部 x ( i ) x^{(i)} x(i)为整体 X X X,代替求和符号 ∑ \sum
  4. 熟练运用:若向量相乘为标量,标量转置等于自身
  5. 熟练运用: ∥ A ∥ F = Tr ⁡ ( A A ⊤ ) \|A\|_{F}=\sqrt{\operatorname{Tr}\left(A A^{\top}\right)} AF=Tr(AA)
  6. 熟练运用:迹运算的各种性质

你可能感兴趣的:(机器学习)