设 n n n阶矩阵 A \bold{A} A可以被分解为 A = P Λ P − 1 \bold{A=P\Lambda{P^{-1}}} A=PΛP−1(1)
,即 P − 1 A P = Λ \bold{P^{-1}AP=\Lambda} P−1AP=Λ(2)
,不妨将 P \bold{P} P称为相似对角化变换矩阵,简称对角化变换矩阵
由(2)
两边同时作乘 P − 1 \bold{P}^{-1} P−1有: A P = P Λ \bold{AP=P\Lambda} AP=PΛ(3)
设 P \bold{P} P用其列向量表示为 P = ( p 1 , ⋯ , p n ) \bold{P}=(\bold p_1,\cdots,\bold p_n) P=(p1,⋯,pn), Λ = diag ( λ 1 , ⋯ , λ n ) \bold{\Lambda}=\text{diag}(\lambda_1,\cdots,\lambda_n) Λ=diag(λ1,⋯,λn)代入(3)
的两边,即得
A ( p 1 , ⋯ , p n ) {\bold A(\bold p_1,\cdots,\bold p_n)} A(p1,⋯,pn)= ( p 1 , ⋯ , p n ) Λ (\bold p_1,\cdots,\bold p_n)\bold{\Lambda} (p1,⋯,pn)Λ(3.1)
( p 1 , ⋯ , p n ) ( λ 1 λ 2 ⋱ λ n ) = ( λ 1 p 1 , ⋯ , λ n p n ) (\bold p_1,\cdots,\bold p_n) \begin{pmatrix} {{\lambda _1}} & {} & {} & {} \cr {} & {{\lambda _2}} & {} & {} \cr {} & {} & \ddots & {} \cr {} & {} & {} & {{\lambda _n}} \cr \end{pmatrix} =(\lambda_1\bold{p}_1,\cdots,\lambda_n{\bold{p}_n}) (p1,⋯,pn) λ1λ2⋱λn =(λ1p1,⋯,λnpn)
(3.1)
两边化简
(3.2)
于是 A p i = λ i p i \bold{Ap}_i=\lambda_i\bold{p}_i Api=λipi, i = 1 , ⋯ , n i=1,\cdots,n i=1,⋯,n(4)
可见, λ i \lambda_i λi是 A \bold{A} A的特征值, p i \bold{p}_i pi就是 A \bold{A} A对应于 λ i \lambda_i λi的特征向量
反之,若已知矩阵 Q = ( q 1 , ⋯ , q n ) \bold{Q}=(\bold{q}_1,\cdots,\bold{q}_n) Q=(q1,⋯,qn)的列向量满足: A q i = λ i q i \bold{A}\bold{q}_i=\lambda_i\bold{q}_i Aqi=λiqi, i = 1 , ⋯ , n i=1,\cdots,n i=1,⋯,n则有
(5)
由于n阶矩阵 A \bold{A} A恰好有 n n n个特征值 λ 1 , ⋯ , λ n \lambda_1,\cdots,\lambda_n λ1,⋯,λn,并且可以对应地求得 n n n个特征向量 Q : q 1 , ⋯ , q n Q:\bold{q}_1,\cdots,\bold{q}_n Q:q1,⋯,qn,所以可以考虑将 Q = ( Q ) \bold{Q}=(Q) Q=(Q)作为对角化变换矩阵候选,此时一定有(5)
成立
因为特征值对应的特征向量可能不唯一,所以候选矩阵 Q \bold{Q} Q可能不唯一,甚至可能是复矩阵
而且 Q \bold{Q} Q不一定是可逆方阵,需要添加限制条件: n n n阶矩阵 Q \bold{Q} Q是可逆矩阵,即 Q Q Q是线性无关的
如果满足这个附加条件,对(5)
两边同时左乘 Q − 1 \bold{Q}^{-1} Q−1,得 Q − 1 A Q = Q − 1 Q Λ \bold{Q}^{-1}\bold{AQ}=\bold{Q}^{-1}\bold{Q\Lambda} Q−1AQ=Q−1QΛ= Λ \bold{\Lambda} Λ(6)
,也就是说, Q \bold{Q} Q就是 A \bold{A} A得对角化变换矩阵
上述讨论中心是矩阵 A \bold{A} A的特征值和特征向量的计算,我们希望可以建立一条基于 A \bold{A} A的可对角化判定定理和计算对角化变换阵的方法,上述讨论已经给出了这样的定理和条件,归纳如下节
n n n阶矩阵 A \bold{A} A和一个对角阵相似的充要条件是 A \bold{A} A有 n n n个线性无关特征向量 P : p 1 , ⋯ , p n P:\bold{p}_1,\cdots,\bold{p}_n P:p1,⋯,pn
并且,由上述方法构造的对角化变换阵 P = ( P ) \bold{P}=(P) P=(P)将 A \bold{A} A变换为由 A \bold{A} A的 n n n个特征值构成的对角阵 Λ = diag ( λ 1 , ⋯ , λ n ) \bold\Lambda=\text{diag}(\lambda_1,\cdots,\lambda_n) Λ=diag(λ1,⋯,λn);即 P − 1 A P = diag ( λ 1 , ⋯ , λ n ) \bold{P^{-1}AP=\text{diag}(\lambda_1,\cdots,\lambda_n)} P−1AP=diag(λ1,⋯,λn)
下面继续推进这个结论,使得条件" n n n个线性无关特征向量"更加具体,有分为两大类情况
对角化问题的求解过程综合运用了矩阵特征值和特征向量等相关知识
<1>
的基础解系
如果 A \bold{A} A可对角化的话,求 A \bold{A} A的对角化变换阵及其对角化矩阵
( λ 1 E − A ) x = 0 (\lambda_1{\bold E}-\bold{A})x=0 (λ1E−A)x=0
( 2 E − A ) x = 0 2 E − A = ( 0 1 1 0 3 0 0 − 2 1 ) → ( 0 1 0 0 0 1 0 0 0 ) \bold {(2E-A)x}=0 \\ \bold {2E-A}= \begin{pmatrix} 0 & 1 & 1 \cr 0 & 3 & 0 \cr 0 & { - 2} & 1 \cr \end{pmatrix} \to \begin{pmatrix} 0 & 1 & 0 \cr 0 & 0 & 1 \cr 0 & 0 & 0 \cr \end{pmatrix} (2E−A)x=02E−A= 00013−2101 → 000100010
x 2 = 0 x 3 = 0 x 1 可以是任意常数 可以取基础解系为 p = ( 1 , 0 , 0 ) T x_2=0 \\x_3=0 \\ x_1可以是任意常数 \\ 可以取基础解系为\bold{p}=(1,0,0)^T x2=0x3=0x1可以是任意常数可以取基础解系为p=(1,0,0)T
( λ 2 E − A ) x = 0 (\lambda_2\bold E-\bold{A})x=0 (λ2E−A)x=0
( λ 3 E − A ) x = 0 (\lambda_3\bold E-\bold{A})x=0 (λ3E−A)x=0
满足 Λ = P − 1 A P {\bold \Lambda=\bold P^{-1}\bold {AP}} Λ=P−1AP的两个矩阵
P = ( 1 0 1 0 − 1 0 0 1 1 ) ; Λ = diag ( 2 , − 1 , 1 ) \bold {P}=\begin{pmatrix} 1 & 0 & 1 \cr 0 & { - 1} & 0 \cr 0 & 1 & 1 \cr \end{pmatrix}; \bold \Lambda=\text{diag}(2,-1,1) P= 1000−11101 ;Λ=diag(2,−1,1)