LA@相似对角化判定定理和计算方法

文章目录

  • 方阵相似对角化
    • 引言
      • 相似对角化变换矩阵的性质
      • 构造对角化变换矩阵
    • 方阵可对角化判定定理
      • 推论:无重根特征值的方阵可以对角化
      • 含重根特征值的方阵的对角化判定定理
      • 总结
    • 综合:对角化步骤归纳
        • 特征值计算
        • 构造相似变换阵
        • 下结论

方阵相似对角化

引言

  • 如果方阵 A ∼ Λ \bold{A}\sim{\bold{\Lambda}} AΛ,且 Λ \bold{\Lambda} Λ是一个对角阵(方阵),则称 A \bold{A} A可以相似对角化(简称为对角化)

相似对角化变换矩阵的性质

  • n n n阶矩阵 A \bold{A} A可以被分解为 A = P Λ P − 1 \bold{A=P\Lambda{P^{-1}}} A=P1(1),即 P − 1 A P = Λ \bold{P^{-1}AP=\Lambda} P1AP=Λ(2),不妨将 P \bold{P} P称为相似对角化变换矩阵,简称对角化变换矩阵

  • (2)两边同时作乘 P − 1 \bold{P}^{-1} P1有: A P = P Λ \bold{AP=P\Lambda} AP=(3)

  • P \bold{P} P用其列向量表示为 P = ( p 1 , ⋯   , p n ) \bold{P}=(\bold p_1,\cdots,\bold p_n) P=(p1,,pn), Λ = diag ( λ 1 , ⋯   , λ n ) \bold{\Lambda}=\text{diag}(\lambda_1,\cdots,\lambda_n) Λ=diag(λ1,,λn)代入(3)的两边,即得

    • A ( p 1 , ⋯   , p n ) {\bold A(\bold p_1,\cdots,\bold p_n)} A(p1,,pn)= ( p 1 , ⋯   , p n ) Λ (\bold p_1,\cdots,\bold p_n)\bold{\Lambda} (p1,,pn)Λ(3.1)

    • ( p 1 , ⋯   , p n ) ( λ 1 λ 2 ⋱ λ n ) = ( λ 1 p 1 , ⋯   , λ n p n ) (\bold p_1,\cdots,\bold p_n) \begin{pmatrix} {{\lambda _1}} & {} & {} & {} \cr {} & {{\lambda _2}} & {} & {} \cr {} & {} & \ddots & {} \cr {} & {} & {} & {{\lambda _n}} \cr \end{pmatrix} =(\lambda_1\bold{p}_1,\cdots,\lambda_n{\bold{p}_n}) (p1,,pn) λ1λ2λn =(λ1p1,,λnpn)

  • (3.1)两边化简

    • ( A p 1 , ⋯   , A p n ) (\bold{A}\bold p_1,\cdots,\bold{A}\bold p_n) (Ap1,,Apn)= ( λ 1 p 1 , ⋯   , λ n p n ) (\lambda_1\bold{p}_1,\cdots,\lambda_n{\bold{p}_n}) (λ1p1,,λnpn)(3.2)
  • 于是 A p i = λ i p i \bold{Ap}_i=\lambda_i\bold{p}_i Api=λipi, i = 1 , ⋯   , n i=1,\cdots,n i=1,,n(4)

  • 可见, λ i \lambda_i λi A \bold{A} A的特征值, p i \bold{p}_i pi就是 A \bold{A} A对应于 λ i \lambda_i λi的特征向量

  • 反之,若已知矩阵 Q = ( q 1 , ⋯   , q n ) \bold{Q}=(\bold{q}_1,\cdots,\bold{q}_n) Q=(q1,,qn)的列向量满足: A q i = λ i q i \bold{A}\bold{q}_i=\lambda_i\bold{q}_i Aqi=λiqi, i = 1 , ⋯   , n i=1,\cdots,n i=1,,n则有

    • ( A q 1 , ⋯   , A q n ) (\bold{A}\bold q_1,\cdots,\bold{A}\bold q_n) (Aq1,,Aqn)= ( λ 1 q 1 , ⋯   , λ n q n ) (\lambda_1\bold{q}_1,\cdots,\lambda_n{\bold{q}_n}) (λ1q1,,λnqn),即
    • A ( q 1 , ⋯   , q n ) {\bold A(\bold q_1,\cdots,\bold q_n)} A(q1,,qn)= ( q 1 , ⋯   , q n ) Λ (\bold q_1,\cdots,\bold q_n)\bold{\Lambda} (q1,,qn)Λ
    • A Q = Q Λ \bold{AQ}=\bold{Q\Lambda} AQ=(5)

构造对角化变换矩阵

  • 由于n阶矩阵 A \bold{A} A恰好有 n n n个特征值 λ 1 , ⋯   , λ n \lambda_1,\cdots,\lambda_n λ1,,λn,并且可以对应地求得 n n n个特征向量 Q : q 1 , ⋯   , q n Q:\bold{q}_1,\cdots,\bold{q}_n Q:q1,,qn,所以可以考虑将 Q = ( Q ) \bold{Q}=(Q) Q=(Q)作为对角化变换矩阵候选,此时一定有(5)成立

  • 因为特征值对应的特征向量可能不唯一,所以候选矩阵 Q \bold{Q} Q可能不唯一,甚至可能是复矩阵

  • 而且 Q \bold{Q} Q不一定是可逆方阵,需要添加限制条件: n n n阶矩阵 Q \bold{Q} Q是可逆矩阵,即 Q Q Q是线性无关的

  • 如果满足这个附加条件,对(5)两边同时左乘 Q − 1 \bold{Q}^{-1} Q1,得 Q − 1 A Q = Q − 1 Q Λ \bold{Q}^{-1}\bold{AQ}=\bold{Q}^{-1}\bold{Q\Lambda} Q1AQ=Q1= Λ \bold{\Lambda} Λ(6),也就是说, Q \bold{Q} Q就是 A \bold{A} A得对角化变换矩阵

  • 上述讨论中心是矩阵 A \bold{A} A的特征值和特征向量的计算,我们希望可以建立一条基于 A \bold{A} A的可对角化判定定理和计算对角化变换阵的方法,上述讨论已经给出了这样的定理和条件,归纳如下节

方阵可对角化判定定理

  • n n n阶矩阵 A \bold{A} A和一个对角阵相似的充要条件 A \bold{A} A n n n线性无关特征向量 P : p 1 , ⋯   , p n P:\bold{p}_1,\cdots,\bold{p}_n P:p1,,pn

  • 并且,由上述方法构造的对角化变换阵 P = ( P ) \bold{P}=(P) P=(P) A \bold{A} A变换为由 A \bold{A} A n n n个特征值构成的对角阵 Λ = diag ( λ 1 , ⋯   , λ n ) \bold\Lambda=\text{diag}(\lambda_1,\cdots,\lambda_n) Λ=diag(λ1,,λn);即 P − 1 A P = diag ( λ 1 , ⋯   , λ n ) \bold{P^{-1}AP=\text{diag}(\lambda_1,\cdots,\lambda_n)} P1AP=diag(λ1,,λn)

  • 下面继续推进这个结论,使得条件" n n n个线性无关特征向量"更加具体,有分为两大类情况

推论:无重根特征值的方阵可以对角化

  • 重根特征值:指 A \bold{A} A的特征方程出现重根的那些根对应的特征值
  • 无重根特征值的方阵可以对角化
    • 由于 A \bold{A} A的不同特征值对应的特征向量是线性无关的,所以若 A \bold{A} A的特征向量 λ 1 , ⋯   , λ n \lambda_1,\cdots,\lambda_n λ1,,λn是互不相等的,那么 A \bold{A} A可以对角化

含重根特征值的方阵的对角化判定定理

  • 有重根特征值的方阵不一定可对角化(这对应于重根特征值问题)
    • 事实上, k k k重根特征值对应的特征向量线性无关组中的向量不超过 k k k
    • 所以含有重根特征值的方阵 A \bold{A} A n n n个特征向量向量不一定是线性无关的

总结

  • A \bold{A} A的特征值 λ i \lambda_i λi,( i = 1 , ⋯   , m i=1,\cdots,m i=1,,m, m ⩽ n m\leqslant n mn)的重数为 k i k_i ki, k i ⩾ 1 , ∑ i = 1 m k i = n k_i\geqslant{1},\sum_{i=1}^{m}k_i=n ki1,i=1mki=n;则:方阵 A \bold{A} A可对角化的充要条件是特征值 λ i \lambda_i λi对应的特征向量中有 k i k_i ki个是线性无关的

综合:对角化步骤归纳

对角化问题的求解过程综合运用了矩阵特征值和特征向量等相关知识

  1. 求出方阵 A \bold{A} A所有特征值 λ 1 , ⋯   , λ n \lambda_1,\cdots,\lambda_n λ1,,λn
  2. 求解不同特征值 λ i \lambda_i λi对应的齐次线性方程 ( λ i E − A ) x = 0 \bold{(\lambda}_{i}\bold{E-\bold{A})x=0} (λiEA)x=0<1>的基础解系
    • 判断基础解系中包含的向量个数是否和特征值 λ i \lambda_i λi的重数 n i n_i ni一致
    • 如果所有特征值的重数 n i n_i ni和对应的基础解系向量个数一致,则 A \bold{A} A可以对角化
    • 如果出现不一致,则 A \bold{A} A不可对角化
  3. 如果可对角化,则需要求解出一个可逆矩阵 P \bold{P} P,使得 P − 1 A P = Λ \bold P^{-1}\bold{AP}=\bold\Lambda P1AP=Λ
    • A \bold{A} A n n n个线性无关特征向量为 P : p 1 , ⋯   , p n P:\bold{p}_1,\cdots,\bold{p}_n P:p1,,pn,则
      • P = ( P ) \bold{P}=(P) P=(P)
      • Λ = diag ( λ 1 , ⋯   , λ n ) \bold\Lambda=\text{diag}(\lambda_1,\cdots,\lambda_n) Λ=diag(λ1,,λn)

如果 A \bold{A} A可对角化的话,求 A \bold{A} A的对角化变换阵及其对角化矩阵

  • A = ( 2 − 1 − 1 0 − 1 0 0 2 1 ) A=\begin{pmatrix} 2 & { - 1} & { - 1} \cr 0 & { - 1} & 0 \cr 0 & 2 & 1 \cr \end{pmatrix} A= 200112101

特征值计算

  • ∣ λ E − A ∣ = ( λ − 2 ) ( λ + 1 ) ( λ − 1 ) = 0 |\lambda{E}-A|=(\lambda-2)(\lambda+1)(\lambda-1)=0 λEA=(λ2)(λ+1)(λ1)=0
    • λ 1 = 2 , λ 2 = − 1 , λ 3 = 1 \lambda_1=2,\lambda_2=-1,\lambda_3=1 λ1=2,λ2=1,λ3=1都是单根特征值,显然 A \bold{A} A可以对角化

构造相似变换阵

  • ( λ 1 E − A ) x = 0 (\lambda_1{\bold E}-\bold{A})x=0 (λ1EA)x=0

    • ( 2 E − A ) x = 0 2 E − A = ( 0 1 1 0 3 0 0 − 2 1 ) → ( 0 1 0 0 0 1 0 0 0 ) \bold {(2E-A)x}=0 \\ \bold {2E-A}= \begin{pmatrix} 0 & 1 & 1 \cr 0 & 3 & 0 \cr 0 & { - 2} & 1 \cr \end{pmatrix} \to \begin{pmatrix} 0 & 1 & 0 \cr 0 & 0 & 1 \cr 0 & 0 & 0 \cr \end{pmatrix} (2EA)x=02EA= 000132101 000100010

    • x 2 = 0 x 3 = 0 x 1 可以是任意常数 可以取基础解系为 p = ( 1 , 0 , 0 ) T x_2=0 \\x_3=0 \\ x_1可以是任意常数 \\ 可以取基础解系为\bold{p}=(1,0,0)^T x2=0x3=0x1可以是任意常数可以取基础解系为p=(1,0,0)T

  • ( λ 2 E − A ) x = 0 (\lambda_2\bold E-\bold{A})x=0 (λ2EA)x=0

    • ( − E − A ) x = 0 \bold {(-E-A)x=0} (EA)x=0,取基础解系 p 2 = ( 0 , − 1 , 1 ) T \bold{p}_2=(0,-1,1)^{T} p2=(0,1,1)T
  • ( λ 3 E − A ) x = 0 (\lambda_3\bold E-\bold{A})x=0 (λ3EA)x=0

    • ( E − A ) x = 0 \bold {(E-A)x=0} (EA)x=0,取基础解系 p 3 = ( 1 , 0 , 1 ) T \bold{p}_3=(1,0,1)^T p3=(1,0,1)T

下结论

  • 满足 Λ = P − 1 A P {\bold \Lambda=\bold P^{-1}\bold {AP}} Λ=P1AP的两个矩阵

  • P = ( 1 0 1 0 − 1 0 0 1 1 ) ; Λ = diag ( 2 , − 1 , 1 ) \bold {P}=\begin{pmatrix} 1 & 0 & 1 \cr 0 & { - 1} & 0 \cr 0 & 1 & 1 \cr \end{pmatrix}; \bold \Lambda=\text{diag}(2,-1,1) P= 100011101 ;Λ=diag(2,1,1)

你可能感兴趣的:(线性代数,线性代数)