LA@特征值和特征向量基本概念和计算方法

文章目录

    • 特征值理论
      • 特征值和特征向量定义
      • 特征多项式
      • 特征方程
      • 征值的计算(行列式计算)
        • 特征值的个数
      • 计算方阵的特征向量(齐次线性方程组的解)
      • 特征值和特征向量的数量关系
      • 例:计算方阵的特征值及其对应的特征向量

特征值理论

  • 工程技术中的一些问题,例如振动和稳定性问题,常归结为:求解一个方阵的特征值和特征向量问题
    • 常常需要寻求数 λ \lambda λ非零向量 α \alpha α,使得 A α = λ α , ( α ≠ 0 ) \bold{A\alpha=\lambda\alpha,(\alpha\neq{0})} Aα=λα,(α=0)
      • 一般特征值和特征向量是成对存在的,在概念上,是相互依赖地同时定义出来
  • 数学中的方阵对角化和解微分方程组等问题也需要用到特征值理论

特征值和特征向量定义

  • A \bold A A n n n阶方阵,若存在 λ \lambda λ n n n非零列向量 α ( α ≠ 0 ) \alpha(\alpha\neq{0}) α(α=0),满足 A α = λ α A\alpha=\lambda\alpha Aα=λα(1),则 λ \lambda λ称为 A \bold{A} A的特征值,非零向量 α \bold{\alpha} α称为 A \bold{A} A对应于 λ \lambda λ的一个特征向量

  • 其中,方程(1)可以改写为:

    • λ α − A α = 0 \bold{\lambda\alpha-A\alpha=0} λαAα=0,即 ( λ E − A ) α = 0 \bold{(\lambda{E}-A)\alpha=0} (λEA)α=0(2)
    • 或者 A α − λ E = 0 \bold{A\alpha-\lambda{E}=0} AαλE=0即: ( A − λ E ) α = 0 \bold{(A-\lambda{E})\alpha=0} (AλE)α=0(2.1)
    • 显然,方程(2)两边同时乘以 − 1 -1 1,即得到 ( 2.1 ) (2.1) (2.1)
    • 两个方程的系数矩阵的关系为分别为 B 1 = λ E − A \bold{B_1=\lambda{E}-A} B1=λEA, B 2 = A − λ E \bold{B_2=A-\lambda{E}} B2=AλE, − B 1 = B 2 \bold{-B_1=B_2} B1=B2, ∣ − B 1 ∣ = ∣ B 2 ∣ \bold{|-B_1|=|B_2|} B1=B2, ( − 1 ) n ∣ B 1 ∣ = ∣ B 2 ∣ (-1)^{n}\bold{|B_1|=|B_2|} (1)nB1=B2
    • B 1 x = 0 \bold{B_1x=0} B1x=0有非零解的条件是 ∣ B 1 ∣ = 0 |\bold{B}_1|=0 B1=0,这等价于 ∣ B 2 ∣ = 0 |\bold{B}_2|=0 B2=0,还等价于 B 2 x = 0 \bold{B_2x=0} B2x=0有非零解
    • 因此只需要任意选择(2),(2.1)中的一个研究即可,效果等价
  • 例如选择方程(2)进行研究,其可以抽象为一个齐次线性方程: ( λ E − A ) x = 0 (\bold{\lambda{E}-A})\bold{x}=\bold{0} (λEA)x=0(3)

  • 但是实际上求解特征值和特征向量时,我推荐用: ( A − λ E ) = 0 (\bold{A-\lambda{E}})=\bold{0} (AλE)=0(4),特别是 A \bold{A} A的阶数较大时.

  • 为了全面性,下面分别用(3),(4)推理和求解相关问题

特征多项式

  • 方程 ( 3 ) (3) (3)是一个含 n n n个未知数和 n n n个方程的齐次线性方程组,它有非零解的充要条件是 ∣ λ E − A ∣ = 0 |\bold{\lambda{E}-A}|=0 λEA=0

    • 记系数矩阵为 f ( λ ) = ∣ λ E − A ∣ f(\lambda)=|\bold{\lambda{E}-A}| f(λ)=λEA

    • 若记 B = λ E − A \bold{B=\lambda{E}-A} B=λEA,则方程(4)可以作 f ( λ ) = ∣ B ∣ = 0 f(\lambda)=|\bold B|=0 f(λ)=B=0

    • n n n阶方阵 A = ( a i j ) A=(a_{ij}) A=(aij),则 f ( λ ) f(\lambda) f(λ)可以展开为:

      • − A = ( − a 11 − a 12 ⋯ − a 1 n − a 21 − a 22 ⋯ − a 2 n ⋮ ⋮ ⋮ − a n 1 − a n 2 ⋯ − a n n ) λ E = ( λ 0 ⋯ 0 0 λ ⋯ 0 ⋮ ⋮ ⋮ 0 0 ⋯ λ ) -\bold A=\begin{pmatrix} -a_{11}& -a_{12}& \cdots&-a_{1n} \\ -a_{21}& -a_{22}& \cdots&-a_{2n} \\ \vdots& \vdots& &\vdots \\ -a_{n1}& -a_{n2}& \cdots&-a_{nn} \\ \end{pmatrix} \\ \lambda{\bold E}= \begin{pmatrix} \lambda& 0& \cdots&0 \\ 0& \lambda& \cdots&0 \\ \vdots& \vdots& &\vdots \\ 0& 0& \cdots&\lambda \\ \end{pmatrix} A= a11a21an1a12a22an2a1na2nann λE= λ000λ000λ

      • f ( λ ) = ∣ λ E − A ∣ = ∣ λ − a 11 − a 12 ⋯ − a 1 n − a 21 λ − a 22 ⋯ − a 2 n ⋮ ⋮ ⋮ − a n 1 − a n 2 ⋯ λ − a n n ∣ f(\lambda)=|\bold{\lambda{E}-A}|= \begin{vmatrix} \lambda-a_{11}& -a_{12}& \cdots&-a_{1n} \\ -a_{21}& \lambda-a_{22}& \cdots&-a_{2n} \\ \vdots& \vdots& &\vdots \\ -a_{n1}& -a_{n2}& \cdots&\lambda-a_{nn} \\ \end{vmatrix} f(λ)=λEA= λa11a21an1a12λa22an2a1na2nλann

      • f ( λ ) f(\lambda) f(λ) A \bold{A} A特征多项式,它是关于 λ \lambda λ n n n次多项式

特征方程

  • A \bold A A特征方程可以写作: f ( λ ) = 0 f(\lambda)=0 f(λ)=0(4)

征值的计算(行列式计算)

  • 显然, A \bold{A} A的特征值就是特征方程的解;(有 n n n个复数解,重根按重数计)

特征值的个数

  • 代数学基本定理:任何一个非零的一元n次复系数多项式,都正好有 n n n个复数根(重根视为多个根)
  • 根据代数学基本定理,特征方程在复数范围内的解个数为方程的次数 n n n(若有重根则累计重数)
  • 因此 n n n阶矩阵 A \bold{A} A在复数范围内有 n n n个特征值

计算方阵的特征向量(齐次线性方程组的解)

  • 设解特征方程 f ( λ ) = 0 f(\lambda)=0 f(λ)=0的全部根为 λ i , i = 1 , 2 , ⋯   , n \lambda_i,i=1,2,\cdots,n λi,i=1,2,,n

  • 对于每个 λ i \lambda_i λi,构造并求解对应的齐次线性方程组 ( λ i E − A ) x = 0 \bold{(\lambda}_{i}\bold{{E-A})x=0} (λiEA)x=0

    • 不妨记方阵 B i = λ i E − A \bold{B}_i=\lambda_{i}\bold{E-A} Bi=λiEA,便于讨论
    • 特征向量齐次线性方程 B i x = 0 \bold{B_{i}x=0} Bix=0(5)一组基础解系: S i = α 1 , α 2 , ⋯   , α s i S_i=\alpha_1,\alpha_2,\cdots,\alpha_{s_i} Si=α1,α2,,αsi, s i = n − r i s_i=n-r_i si=nri其中 r i r_i ri是方程(5)的系数矩阵的 B i B_i Bi的秩
    • 则方阵A关于 λ i \lambda_i λi的全部特征向量表示为 ∑ j = 1 s i k j α j \sum\limits_{j=1}^{s_i}k_j\alpha_j j=1sikjαj

特征值和特征向量的数量关系

  1. 特征向量与其对应的特征值数量关系

    • λ 0 \lambda_0 λ0 A \bold{A} A的特征值,则 A α = λ 0 α \bold A\alpha=\lambda_0\alpha Aα=λ0α

    • 其特征向量线性方程组 ( λ E − A ) x = 0 (\lambda{\bold{E}-A})x=\bold{0} (λEA)x=0的系数矩阵 B = ( λ E − A ) B=(\bold{\lambda{E}-A}) B=(λEA)的行列式 ∣ B ∣ |\bold{B}| B取值是否为0对应不同情况

      • ∣ B ∣ = 0 \bold{|B|}=0 ∣B∣=0时, λ 0 \lambda_0 λ0的特征向量有无穷多个
      • ∣ B ∣ ≠ 0 |\bold{B}|\neq{0} B=0时, λ 0 \lambda_0 λ0对应的特征向量仅一个
  2. 特征值被特征向量唯一确定(一个特征向量只能属于一个特征值)

    • 但这不是说不同的特征向量一定对应于不同的特征值,类似于函数,每一个自变量取值都唯一对应于一个函数值,不同自变量的函数值没有制约关系: f ( x ) = ( x − x 1 ) ( x − x 2 ) f(x)=(x-x_1)(x-x_2) f(x)=(xx1)(xx2), f ( x 1 ) = f ( x 2 ) f(x_1)=f(x_2) f(x1)=f(x2)
    • 证明:
      • 假设对于给定的向量 α 0 \alpha_0 α0,数 λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2,方阵 A \bold{A} A满足: A α 0 = λ i α 0 , i = 1 , 2 \bold{A}\alpha_0=\lambda_i\alpha_0,i=1,2 Aα0=λiα0,i=1,2
      • 显然: λ 1 α 0 = λ 2 α 0 = A α 0 \lambda_1\alpha_0=\lambda_2\alpha_0=\bold{A}\alpha_0 λ1α0=λ2α0=Aα0
      • ( λ 1 − λ 2 ) α 0 = 0 (\lambda_1-\lambda_2)\alpha_0=\bold 0 (λ1λ2)α0=0
        • 又因为 α 0 ≠ 0 \alpha_0\neq{\bold 0} α0=0,所以 λ 1 − λ 2 = 0 \lambda_1-\lambda_2=0 λ1λ2=0
        • 所以 λ 1 = λ 2 \lambda_1=\lambda_2 λ1=λ2
      • 所以给定 α 0 \alpha_0 α0, A \bold{A} A的特征值是唯一确定的

  • ( 3 1 2 2 ) ( 1 1 ) = ( 4 4 ) = 4 ( 1 1 ) \begin{pmatrix} 3&1 \\ 2&2 \end{pmatrix} \begin{pmatrix} 1\\ 1 \end{pmatrix} =\begin{pmatrix} 4 \\ 4 \end{pmatrix} =4\begin{pmatrix} 1 \\ 1 \end{pmatrix} (3212)(11)=(44)=4(11)

  • 上述等式链告诉我们,矩阵

    • A = ( 3 1 2 2 ) 作用在向量 α = ( 1 1 ) 上的效果和常数 4 作用在 α 上的效果在乘法上是一样的 A=\begin{pmatrix} 3&1 \\ 2&2 \end{pmatrix} 作用在向量\alpha=\begin{pmatrix} 1\\ 1 \end{pmatrix} \\上的效果和常数4作用在\alpha上的效果在乘法上是一样的 A=(3212)作用在向量α=(11)上的效果和常数4作用在α上的效果在乘法上是一样的

      • 也就是说,矩阵左乘特征向量的结果和特征向量左乘特征向量的结果一样

  • A 2 = A A^2=A A2=A,证明A的特征值为0或1

    • A α = λ α A 2 α = A ( A α ) = A λ α = λ ( A α ) = λ ( λ α ) = λ 2 α 又 A 2 = A ; A 2 α = A α = λ α A\alpha=\lambda{\alpha} \\A^2\alpha=A(A\alpha)=A\lambda\alpha=\lambda{(A\alpha)}=\lambda(\lambda\alpha)=\lambda^2\alpha \\又A^2=A;A^2\alpha=A\alpha=\lambda\alpha Aα=λαA2α=A(Aα)=Aλα=λ(Aα)=λ(λα)=λ2αA2=A;A2α=Aα=λα

    • ∴ λ 2 α = λ α ( λ 2 − λ ) α = 0 , α ≠ 0 λ 2 − λ = λ ( λ − 1 ) = 0 λ = 0 或 1 \\\therefore \lambda^2\alpha=\lambda\alpha \\(\lambda^2-\lambda)\alpha=\bold{0},\alpha\neq\bold0 \\\lambda^2-\lambda=\lambda(\lambda-1)=0 \\\lambda=0或1 λ2α=λα(λ2λ)α=0,α=0λ2λ=λ(λ1)=0λ=01

  • 方法2:

    • 同时对 A α = λ α 左乘 A : A 2 α = λ ( A α ) A α = λ 2 α λ α = λ 2 α 同时对A\alpha=\lambda\alpha左乘A: \\A^2\alpha=\lambda(A\alpha) \\A\alpha=\lambda^{2}\alpha \\\lambda\alpha=\lambda^2{\alpha} 同时对Aα=λα左乘A:A2α=λ(Aα)Aα=λ2αλα=λ2α

    • 其余和方法1一致

例:计算方阵的特征值及其对应的特征向量

  • 这里使用方程(4)来推理

  • 求矩阵 A = ( 3 − 1 − 1 3 ) \bold{A}=\begin{pmatrix}3&-1\\-1&3\end{pmatrix} A=(3113)的特征值和特征向量

  • 按方程(4)构造特征多项式 f ( λ ) = A − λ E f(\lambda)=\bold{A-\lambda{E}} f(λ)=AλE= ∣ 3 − λ − 1 − 1 3 − λ ∣ \begin{vmatrix}3-\lambda&-1\\-1&3-\lambda\end{vmatrix} 3λ113λ = ( 3 − λ ) 2 − 1 (3-\lambda)^2-1 (3λ)21= ( 4 − λ ) ( 2 − λ ) (4-\lambda)(2-\lambda) (4λ)(2λ)

  • 可知 A \bold{A} A特征值有 λ 1 = 2 \lambda_1=2 λ1=2, λ 2 = 4 \lambda_2=4 λ2=4

  • λ 1 = 2 \lambda_1=2 λ1=2,对应的特征方程: A 1 x = 0 \bold{A_1x=0} A1x=0

    • ∣ 3 − 2 − 1 − 1 3 − 2 ∣ x = 0 \begin{vmatrix}3-2&-1\\-1&3-2\end{vmatrix}\bold{x}=\bold{0} 321132 x=0

    • 解得 x 2 = x 3 x_2=x_3 x2=x3

    • 可取基础解系为 p 2 = ( 1 , 1 ) T \bold{p}_2=(1,1)^T p2=(1,1)T

  • λ 2 = 4 \lambda_2=4 λ2=4,对应的特征方程: A 2 x = 0 \bold{A_2x=0} A2x=0

    • ∣ 3 − 4 − 1 − 1 3 − 4 ∣ x = 0 \begin{vmatrix}3-4&-1\\-1&3-4\end{vmatrix}\bold{x}=\bold{0} 341134 x=0

    • 解得 x 2 = − x 3 x_2=-x_3 x2=x3

    • 可取基础解系为 p 2 = ( − 1 , 1 ) T \bold{p}_2=(-1,1)^T p2=(1,1)T

  • 显然, p i \bold{p_i} pi是矩阵 A \bold{A} A对应于特征值 λ i \lambda_i λi的特征向量,则 k p i ( k ≠ 0 ) k\bold{p}_i(k\neq{0}) kpi(k=0)也是对应于 λ i \lambda_i λi的特征值

你可能感兴趣的:(线性代数,线性代数)