矩阵的特征分解是比较基础的知识了,但是应用却十分广泛,比如主成分分析、矩阵分解之类的。现在回顾一下矩阵特征值的相关知识。
定义:对于n阶实方阵 A A A,如果存在非零向量 x x x使得 A x = λ x , λ ∈ R Ax=\lambda x,\lambda \in R Ax=λx,λ∈R,则称 λ \lambda λ是矩阵 A A A的一个特征值, x x x是 A A A的属于 λ \lambda λ的特征向量。
以上数学定义比较简单但是不够直观。从几何上更容易理解:矩阵乘法实际上是对向量的线性变换(也就是对向量旋转和伸缩),特征向量就是经过线性变换后方向不变的向量,特征值就是伸缩量。
A x = λ x ( λ E − A ) x = 0 矩 阵 方 程 有 非 零 解 , 说 明 ( λ E − A ) 是 奇 异 矩 阵 ∣ λ E − A ∣ = 0 Ax=\lambda x \\ (\lambda E- A) x = 0 \\ \quad \\ 矩阵方程有非零解,说明(\lambda E- A)是奇异矩阵\\ \quad \\ |\lambda E- A|=0 Ax=λx(λE−A)x=0矩阵方程有非零解,说明(λE−A)是奇异矩阵∣λE−A∣=0
∣ λ E − A ∣ |\lambda E- A| ∣λE−A∣是矩阵 A A A的特征多项式,求解得到 A A A的所有特征值,然后将特征值带回 A x = λ x Ax=\lambda x Ax=λx得到对应的特征向量。
不同特征值的特征向量是线性无关的,证明如下:
A x 1 = λ 1 x 1 A x 2 = λ 2 x 2 如 果 x 1 , x 2 线 性 相 关 , 则 存 在 非 全 零 k 1 , k 2 使 得 k 1 x 1 + k 2 x 2 = 0 x 1 = − k 2 x 2 / k 1 − A k 2 x 2 / k 1 = − λ 1 k 2 x 2 / k 1 A x 2 = λ 1 x 2 这 样 x 2 就 是 λ 1 的 特 征 向 量 了 , 与 题 设 矛 盾 , 得 证 Ax_1=\lambda_1 x_1 \\ Ax_2=\lambda_2 x_2 \\ \quad \\ 如果x_1,x_2线性相关,则存在非全零k_1,k_2使得 \\ \quad \\ k_1x_1+k_2x_2 = 0 \\ x_1 = -k_2x_2/k_1 \\ -Ak_2x_2/k_1=-\lambda_1k_2x_2/k_1 \\ Ax_2=\lambda_1 x_2 \\ \quad \\ 这样x_2就是\lambda_1的特征向量了,与题设矛盾,得证 Ax1=λ1x1Ax2=λ2x2如果x1,x2线性相关,则存在非全零k1,k2使得k1x1+k2x2=0x1=−k2x2/k1−Ak2x2/k1=−λ1k2x2/k1Ax2=λ1x2这样x2就是λ1的特征向量了,与题设矛盾,得证
同一特征值的不同特征向量,可能相关也可能无关,取决于代入特征值后,齐次线性方程组对应矩阵的秩。
n阶矩阵A能够特征分解的充要条件是,A有n个线性无关的特征向量。
求出矩阵所有特征值和特征向量后:
A x 1 = λ 1 x 1 A x 2 = λ 2 x 2 A x 3 = λ 3 x 3 A [ x 1 , x 2 , x 3 ] = [ λ 1 x 1 , λ 2 x 2 , λ 3 x 3 ] = [ x 1 , x 2 , x 3 ] d i a g [ λ 1 , λ 2 , λ 3 ] A = [ x 1 , x 2 , x 3 ] d i a g [ λ 1 , λ 2 , λ 3 ] [ x 1 , x 2 , x 3 ] − 1 A = X Λ X − 1 Ax_1=\lambda_1 x_1 \\ Ax_2=\lambda_2 x_2 \\ Ax_3=\lambda_3 x_3 \\ A[x_1,x_2,x_3]=[\lambda_1 x_1, \lambda_2 x_2, \lambda_3 x_3] \\ = [x_1,x_2,x_3]diag[\lambda_1,\lambda_2, \lambda_3] \\ A = [x_1,x_2,x_3]diag[\lambda_1,\lambda_2, \lambda_3] [x_1,x_2,x_3]^{-1} \\ \quad \\ A=X\Lambda X^{-1} Ax1=λ1x1Ax2=λ2x2Ax3=λ3x3A[x1,x2,x3]=[λ1x1,λ2x2,λ3x3]=[x1,x2,x3]diag[λ1,λ2,λ3]A=[x1,x2,x3]diag[λ1,λ2,λ3][x1,x2,x3]−1A=XΛX−1
以上就是特征分解的过程。
如果元素全是实数并且 A = A T A=A^T A=AT,则A是实对称矩阵。
实对称矩阵具有几个有用的性质:
性质1.特征值和特征向量都是在实数域内。
性质2.不同特征值对应的特征向量正交。
性质3.n重特征值有n个线性无关的特征向量。
性质4.实对称矩阵一定能够特征分解。
矩阵的特征值和特征向量给出了一种可能的将矩阵分解的方法:特征分解(矩阵对角化)。下一次将介绍矩阵的另一种特性:奇异值与奇异分解。