AI笔记: 数学基础之特征值与特征向量

特征值和特征向量

  • A为n阶矩阵,若数 λ \lambda λ和n维非0列向量x满足 A x = λ x Ax=\lambda x Ax=λx, 那么数 λ \lambda λ称为A的特征值,x称为A的对应于特征值 λ \lambda λ的特征向量。并且 ∣ λ E − A ∣ |\lambda E - A| λEA叫做A的特征多项式。
  • 当特征多项式等于0的时候,称为A的特征方程,特征方程是一个齐次线性方程组,求解特征值的过程其实就是求解特征方程的解。
  • A x = λ x ⇒ A x = λ E x ⇒ ( λ E − A ) x = 0 Ax = \lambda x \Rightarrow Ax = \lambda Ex \Rightarrow (\lambda E - A)x = 0 Ax=λxAx=λEx(λEA)x=0
  • ∣ λ E − A ∣ = ∣ λ − a 11 − a 12 ⋯ − a 1 n − a 21 λ − a 22 ⋯ − a 2 n ⋯ ⋯ ⋯ ⋯ − a n 1 − a n 2 ⋯ λ − a n n ∣ |\lambda E - A| =\left |\begin{array}{cccc}\lambda - a_{11} & -a_{12} & \cdots & -a_{1n} \\-a_{21} & \lambda - a_{22} & \cdots & -a_{2n} \\\cdots & \cdots & \cdots & \cdots \\-a_{n1} & -a_{n2} &\cdots & \lambda - a_{nn}\end{array} \right | λEA=λa11a21an1a12λa22an2a1na2nλann
  • α \alpha α 是矩阵A的属性特征值 λ 0 \lambda_0 λ0的特征向量,则对任意常数 k ≠ 0 , k α k \neq 0, k \alpha k=0,kα 也是A的属于 λ 0 \lambda_0 λ0的特征向量
  • α , β \alpha, \beta α,β都是A的属于特征值 λ 0 \lambda_0 λ0的特征向量,则 k α + l β k\alpha + l\beta kα+lβ (k,l不全为零) 也是A的属于 λ 0 \lambda_0 λ0的特征向量

特征值和特征向量求解

例1

  • A = ( 3 − 1 − 1 3 ) A =\left (\begin{array}{cccc}3 & -1 \\-1 & 3\end{array} \right ) A=(3113)的特征值和特征向量
  • 分析
    • A的特征多项式为: ∣ A − λ E ∣ = ∣ 3 − λ − 1 − 1 3 − λ ∣ = ( 3 − λ ) 2 − 1 = 8 − 6 λ + λ 2 = ( 4 − λ ) ( 2 − λ ) |A - \lambda E| = \left |\begin{array}{cccc}3 - \lambda & -1 \\-1 & 3 - \lambda\end{array} \right | =(3 - \lambda)^2 - 1 = 8 - 6\lambda + \lambda^2 = (4-\lambda)(2-\lambda) AλE=3λ113λ=(3λ)21=86λ+λ2=(4λ)(2λ)
    • ∣ A − λ E ∣ = 0 |A - \lambda E| = 0 AλE=0 得A的特征值为: λ 1 = 2 , λ 2 = 4 \lambda_1 = 2, \lambda_2 = 4 λ1=2,λ2=4
    • λ 1 = 2 \lambda_1 = 2 λ1=2时,对应的特征向量应满足:
    • ( 3 − 2 − 1 − 1 3 − 2 ) ( x 1 x 2 ) = ( 0 0 ) \left (\begin{array}{cccc}3 - 2 & -1 \\-1 & 3 - 2\end{array} \right )\left (\begin{array}{cccc}x_1 \\x_2\end{array}\right ) =\left (\begin{array}{cccc} 0 \\ 0 \end{array} \right ) (321132)(x1x2)=(00)
    • 即: { x 1 − x 2 = 0 − x 1 + x 2 = 0 \left \{\begin{array}{cccc}x_1 - x_2 = 0 \\-x_1 + x_2 = 0\end{array} \right. {x1x2=0x1+x2=0
    • 解得: x 1 = x 2 x_1 = x_2 x1=x2, 所以对应的特征向量可取为: p 1 = ( 1 1 ) p_1 = \left (\begin{array}{cccc}1 \\1\end{array} \right ) p1=(11)
    • λ 2 = 4 \lambda_2 = 4 λ2=4时,由
    • ( 3 − 4 − 1 − 1 3 − 4 ) ( x 1 x 2 ) = ( 0 0 ) \left (\begin{array}{cccc}3 - 4 & -1 \\-1 & 3 - 4\end{array} \right ) \left (\begin{array}{cccc}x_1 \\x_2\end{array} \right ) =\left (\begin{array}{cccc}0 \\0\end{array} \right ) (341134)(x1x2)=(00)
    • 即: ( − 1 − 1 − 1 − 1 ) ( x 1 x 2 ) = ( 0 0 ) \left (\begin{array}{cccc}-1 & -1 \\-1 & -1\end{array} \right ) \left (\begin{array}{cccc}x_1 \\x_2\end{array} \right ) = \left (\begin{array}{cccc}0 \\ 0 \end{array} \right ) (1111)(x1x2)=(00)
    • 解得: x 1 = − x 2 x_1 = -x_2 x1=x2, 所以对应的特征向量可取为: p 2 = ( − 1 1 ) p_2 = \left (\begin{array}{cccc} -1 \\ 1 \end{array} \right ) p2=(11)
    • 得对应于特征值的全部特征向量为: c 1 p 1 , c 2 p 2     ( c 1 c 2 ≠ 0 ) c_1p_1, c_2p_2 \ \ \ (c_1c_2 \neq 0) c1p1,c2p2   (c1c2=0)

例2

  • 求矩阵 A = ( − 1 1 0 − 4 3 0 1 0 2 ) A=\left (\begin{array}{cccc}-1 & 1 & 0 \\-4 & 3 & 0 \\1 & 0 & 2\end{array} \right ) A=141130002的特征值和特征向量
  • 分析
    • A的特征多项式为: ∣ A − λ E ∣ = ∣ − 1 − λ 1 0 − 4 3 − λ 0 1 0 2 − λ ∣ = ( 2 − λ ) ( 1 − λ ) 2 |A - \lambda E| = \left | \begin{array}{cccc} -1 -\lambda & 1 & 0 \\ -4 & 3 - \lambda & 0 \\ 1 & 0 & 2 - \lambda \end{array} \right | = (2 - \lambda)(1 - \lambda)^2 AλE=1λ4113λ0002λ=(2λ)(1λ)2
    • ∣ A − λ E ∣ = 0 |A - \lambda E| = 0 AλE=0 得A的特征值为: λ 1 = 2 , λ 2 = λ 3 = 1 \lambda_1 = 2, \lambda_2 = \lambda_3 = 1 λ1=2,λ2=λ3=1
    • λ 1 = 2 \lambda_1 = 2 λ1=2时,解方程 ( A − 2 E ) x = 0 (A - 2E)x = 0 (A2E)x=0
    • 由: A − 2 E = ( − 3 1 0 − 4 1 0 1 0 0 ) ∼ ( 1 0 0 0 1 0 0 0 0 ) A - 2E = \left ( \begin{array}{cccc} -3 & 1 & 0 \\ -4 & 1 & 0 \\ 1 & 0 & 0 \end{array} \right ) \sim \left ( \begin{array}{cccc} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{array} \right ) A2E=341110000100010000
    • 得基础解系: p 1 = ( 0 0 1 ) p_1 = \left ( \begin{array}{cccc} 0 \\ 0 \\ 1 \end{array} \right ) p1=001
    • 所以 k 1 p 1 ( k 1 ≠ = 0 ) k_1p_1 (k_1 \neq = 0) k1p1(k1==0)是对应于 λ 1 = 2 \lambda_1 = 2 λ1=2的全部特征向量
    • λ 2 = λ 3 = 1 \lambda_2 = \lambda_3 = 1 λ2=λ3=1时,解方程 ( A − E ) x = 0 (A - E)x = 0 (AE)x=0
    • 由: A − E = ( − 2 1 0 − 4 2 0 1 0 1 ) ∼ ( 1 0 1 0 1 2 0 0 0 ) A - E = \left (\begin{array}{cccc}-2 & 1 & 0 \\-4 & 2 & 0 \\1 & 0 & 1\end{array} \right ) \sim \left (\begin{array}{cccc}1 & 0 & 1 \\0 & 1 & 2 \\0 & 0 & 0\end{array} \right ) AE=241120001100010120
    • 得基础解系: p 2 = ( − 1 − 2 1 ) p_2 = \left (\begin{array}{cccc} -1 \\ -2 \\ 1 \end{array} \right ) p2=121
    • 所以 k 2 p 2     ( k 2 ≠ 0 ) k_2p_2 \ \ \ (k_2 \neq 0) k2p2   (k2=0) 是对应于 λ 2 = λ 3 = 1 \lambda_2 = \lambda_3 = 1 λ2=λ3=1的全部特征向量

例3

  • A = ( − 2 1 1 0 2 0 − 4 1 3 ) A = \left (\begin{array}{cccc}-2 & 1 & 1 \\0 & 2 & 0 \\-4 & 1 & 3\end{array} \right ) A=204121103, 求A的特征值与特征向量
  • 分析
    • ∣ A − λ E ∣ = ∣ − 2 − λ 1 1 0 2 − λ 0 − 4 1 3 − λ ∣ = − ( λ + 1 ) ( λ − 2 ) 2 |A - \lambda E| =\left |\begin{array}{cccc}-2 - \lambda & 1 & 1 \\0 & 2 - \lambda & 0 \\-4 & 1 & 3 - \lambda\end{array} \right | = -(\lambda+ 1)(\lambda - 2)^2 AλE=2λ0412λ1103λ=(λ+1)(λ2)2
    • − ( λ + 1 ) ( λ − 2 ) 2 = 0 -(\lambda + 1) (\lambda - 2)^2 = 0 (λ+1)(λ2)2=0
    • 得A的特征值为: λ 1 = − 1 , λ 2 = λ 3 = 2 \lambda_1 = -1, \lambda_2 = \lambda_3 = 2 λ1=1,λ2=λ3=2
    • λ 1 = − 1 \lambda_1 = -1 λ1=1时,解方程 ( A + E ) x = 0 (A + E)x = 0 (A+E)x=0.
    • A + E = ( − 1 1 1 0 3 0 − 4 1 4 ) ∼ ( 1 0 − 1 0 1 0 0 0 0 ) A + E = \left ( \begin{array}{cccc} -1 & 1 & 1 \\ 0 & 3 & 0 \\ -4 & 1 & 4 \end{array} \right ) \sim \left ( \begin{array}{cccc} 1 & 0 & -1 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{array} \right ) A+E=104131104100010100
    • 得基础解系 p 1 = ( 1 0 1 ) p_1 = \left ( \begin{array}{cccc} 1 \\ 0 \\ 1 \end{array} \right ) p1=101
    • 故对应于 λ 1 = − 1 \lambda_1 = -1 λ1=1的全体特征向量为: k 1 p 1     ( k 1 ≠ 0 ) k_1 p_1 \ \ \ (k_1 \neq 0) k1p1   (k1=0)
    • λ 2 = λ 3 = 2 \lambda_2 = \lambda_3 = 2 λ2=λ3=2时,解方程 ( A − 2 E ) x = 0 (A - 2E)x = 0 (A2E)x=0
    • 由: A − 2 E = ( − 4 1 1 0 0 0 − 4 1 1 ) ∼ ( − 4 1 1 0 0 0 0 0 0 ) A - 2E = \left ( \begin{array}{cccc} -4 & 1 & 1 \\ 0 & 0 & 0 \\ -4 & 1 & 1 \\ \end{array} \right ) \sim \left ( \begin{array}{cccc} -4 & 1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \\ \end{array} \right ) A2E=404101101400100100
    • 得基础解系为: p 2 = ( 0 1 − 1 ) , p 3 = ( 1 0 4 ) p_2 = \left ( \begin{array}{cccc} 0 \\ 1 \\ -1 \end{array} \right ), p_3 = \left ( \begin{array}{cccc} 1 \\ 0 \\ 4 \end{array} \right ) p2=011,p3=104
    • 所以对应于 λ 2 = λ 3 = 2 \lambda_2 = \lambda_3 = 2 λ2=λ3=2的全部特征向量为: k 2 p 2 + k 3 p 3 k_2p_2 + k_3p_3 k2p2+k3p3 ( k 2 , k 3 k_2, k_3 k2,k3)不同时为0

特征值的性质

  • n阶方阵 A = ( a i j ) A=(a_{ij}) A=(aij)的所有特征根 λ 1 、 λ 2 . . . λ n \lambda_1、\lambda_2 ... \lambda_n λ1λ2...λn,则有
  • λ 1 + λ 2 + . . . + λ n = ∑ i = 1 n a i i     λ 1 λ 2 . . . λ n j = ∣ A ∣ \lambda_1 + \lambda_2 + ... + \lambda_n = \sum_{i=1}^n a_{ii} \ \ \ \lambda_1\lambda_2...\lambda_nj = |A| λ1+λ2+...+λn=i=1naii   λ1λ2...λnj=A
  • λ \lambda λ是可逆矩阵A的一个特征根,x为对应的特征向量
    • 1 λ \frac{1}{\lambda} λ1是矩阵 A − 1 A^{-1} A1的一个特征根,x仍为对应的特征向量。
    • λ m \lambda^m λm是矩阵 A m A^m Am的一个特征根,x仍为对应的特征向量
  • λ 1 , λ 2 . . . λ n \lambda_1, \lambda_2... \lambda_n λ1,λ2...λn是方阵A的互不相同的特征值, x i x_i xi λ i \lambda_i λi的特征向量,则 x 1 , x 2 . . . x n x_1, x_2...x_n x1,x2...xn线性无关,即不相同特征值的特征向量线性无关

可对角化矩阵

  • 如果一个n阶方阵A相似于对角矩阵,也就是,如果存在一个可逆矩阵P使得 P − 1 P^{-1} P1AP是对角矩阵,则称矩阵A为可对角化矩阵,并且最终对角矩阵的特征值就是矩阵A的特征值。 P − 1 A P = A P^{-1}AP = A P1AP=A
  • 可逆矩阵P实际上就是A的全部特征向量按列构成的矩阵。
  • 矩阵对角化在PCA(主成分分析)、白化(去相关性)等机器学习领域应用的比较多。
  • 对于矩阵是否可以对角化,判断如下:
    • (1) 由 ∣ A − λ E ∣ = 0 ⇒ |A - \lambda E| = 0 \Rightarrow AλE=0 求出所有的特征值 λ i \lambda_i λi
    • (2) 若所有的特征值都是单根,则A一定能对角化
    • (3) 若A的特征值有重根,则对每个 λ i \lambda_i λi,求齐次方程组 ( A − λ i E ) X = 0 (A - \lambda_i E)X = 0 (AλiE)X=0的基础解系,如果基础解析所含向量的个数等于 λ i \lambda_i λi的重根数或等于 n − R ( A − λ i E ) n-R(A - \lambda_iE) nR(AλiE), 则A可以对角化且这些基础解析排成的矩阵为相似变换矩阵

例1

  • A = ( 4 6 0 − 3 − 5 0 − 3 − 6 1 ) A =\left (\begin{array}{cccc}4 & 6 & 0 \\-3 & -5 & 0 \\-3 & -6 & 1\end{array} \right ) A=433656001, A能否对角化? 若能对角化,则求出可逆矩阵P, 使 P − 1 A P P^{-1}AP P1AP为对角阵
  • 分析
    • ∣ A − λ E ∣ = ∣ 4 − λ 6 0 − 3 − 5 − λ 0 − 3 − 6 1 − λ ∣ = − ( λ − 1 ) 2 ( λ + 2 ) |A - \lambda E| = \left |\begin{array}{cccc}4 - \lambda & 6 & 0 \\-3 & -5-\lambda & 0 \\-3 & -6 & 1 - \lambda\end{array} \right | = - (\lambda - 1)^2(\lambda + 2) AλE=4λ3365λ6001λ=(λ1)2(λ+2)
    • 所以A的全部特征值为: λ 1 = λ 2 = 1 , λ 3 = − 2 \lambda_1 = \lambda_2 = 1, \lambda_3 = -2 λ1=λ2=1,λ3=2
    • λ 1 = λ 2 = 1 \lambda_1 = \lambda_2 = 1 λ1=λ2=1 代入 ( A − λ E ) x = 0 (A - \lambda E)x = 0 (AλE)x=0 得方程组 { − 3 x 1 + 6 x 2 = 0 − 3 x 1 − 6 x 2 = 0 − 3 x 1 − 6 x 2 = 0 \left \{\begin{array}{cccc}-3x_1 + 6x_2 = 0 \\-3x_1 - 6x_2 = 0 \\-3x_1 - 6x_2 = 0\end{array} \right. 3x1+6x2=03x16x2=03x16x2=0
    • 解之得基础解系 ξ 1 = ( − 2 1 0 ) , ξ 2 = ( 0 0 1 ) , \xi_1 = \left (\begin{array}{cccc}-2 \\1 \\0\end{array} \right ), \xi_2 = \left (\begin{array}{cccc}0 \\0 \\1\end{array} \right ), ξ1=210,ξ2=001,
    • λ 3 = − 2 \lambda_3 = -2 λ3=2 代入 ( A − λ E ) x = 0 (A - \lambda E)x = 0 (AλE)x=0, 得方程组的基础解系: ξ 3 = ( − 1 , 1 , 1 ) T \xi_3 = (-1, 1, 1)^T ξ3=(1,1,1)T
    • 由于 ξ 1 , ξ 2 , ξ 3 \xi_1, \xi_2, \xi_3 ξ1,ξ2,ξ3线性无关,所以A可对角化.
    • P ( ξ 1 , ξ 2 , ξ 3 ) = ( − 2 0 − 1 1 0 1 0 1 1 ) P(\xi_1, \xi_2, \xi_3)= \left (\begin{array}{cccc}-2 & 0 & -1 \\1 & 0 & 1 \\0 & 1 & 1\end{array} \right ) P(ξ1,ξ2,ξ3)=210001111
    • 则有: P − 1 A P = ( 1 0 0 0 1 0 0 0 − 2 ) P^{-1}AP =\left (\begin{array}{cccc}1 & 0 & 0 \\0 & 1 & 0 \\0 & 0 & -2\end{array} \right ) P1AP=100010002
    • 注意:
      • P = ( ξ 1 , ξ 2 , ξ 3 ) = ( − 1 0 − 2 1 0 1 1 1 0 ) P=(\xi_1, \xi_2, \xi_3) = \left (\begin{array}{cccc}-1 & 0 & -2 \\1 & 0 & 1 \\1 & 1 & 0\end{array} \right ) P=(ξ1,ξ2,ξ3)=111001210
      • 则有 P − 1 A P = ( − 2 0 0 0 1 0 0 0 1 ) P^{-1}AP = \left (\begin{array}{cccc}-2 & 0 & 0 \\0 & 1 & 0 \\0 & 0 & 1\end{array} \right ) P1AP=200010001
      • 即矩阵P的列向量和对角矩阵中国特征值的位置要相互对应

正定矩阵

  • 对于n阶方阵A,若任意n阶向量x, 都有 x T A x > 0 x^TAx > 0 xTAx>0, 则称矩阵A为正定矩阵
  • x T A x ≥ 0 x^TAx \geq 0 xTAx0, 则矩阵A为半正定矩阵

奇异矩阵

  • 若方阵A的行列式的值等于0,那么方阵A叫做奇异矩阵,否则叫做非奇异矩阵
  • 可逆矩阵就是非奇异矩阵,非奇异矩阵也是可逆矩阵
  • 若A为奇异矩阵,则Ax = 0有无穷解,Ax=b 有无穷解或无解
  • 若A为非奇异矩阵,则Ax=0有且只有唯一零解,Ax=b有唯一解

你可能感兴趣的:(AI,Mathematics,AI,数学,特征值,特征工程)