如果存在非奇异的矩阵 P P P ,使得 P − 1 A P = B P^{-1}AP=B P−1AP=B,则称矩阵 A A A、 B B B相似。
知道相似有什么意义呢?当然不是为了花里胡哨好看,而是为了使得问题简化。特别地,如果 B B B 刚好为对角矩阵 Λ \Lambda Λ,问题就很简单了,简单在哪里呢?幂函数、指数等简单,跟一个数的运算很相似。
以二阶方阵计算指数说明问题,若
Λ = [ λ 1 0 0 λ 2 ] \Lambda = \left [ \begin {array}{ccc} \lambda_1 \quad 0 \\ 0 \quad \lambda_2 \end {array} \right ] Λ=[λ100λ2]
则
e Λ t = [ e λ 1 0 0 e λ 2 ] e^{\Lambda t} = \left [ \begin {array}{ccc} e^{\lambda_1} \quad 0 \\ 0 \quad e^{\lambda_2} \end {array} \right ] eΛt=[eλ100eλ2]
换句话说,对于对角阵,计算指数就是直接对对角元素进行指数运算。这样,问题就接踵而至:
对于问题1,不是数序问题,简单提一下个人涉及内容,目前学线性系统理论,系统的转移矩阵实际上就是矩阵的指数运算。
对于问题2,答案是否定的,n 阶矩阵需要有 n 个线性无关的特征向量才能对角化,具体在第二节说明。
对于问题3,矩阵不能对角化,但一定能化成若当(Jordan)标准形,也是方便计算指数函数的,对角阵只是特殊的若当标准形。具体第三节说明。
若存在一个非奇异的矩阵 P P P 和一个对角阵 Λ \Lambda Λ,使得 n × n n\times n n×n 矩阵 A A A 满足 P − 1 A P = Λ P^{-1} A P = \Lambda P−1AP=Λ则称 A A A 为可对角化的。
那 P P P、 Λ \Lambda Λ 存在吗,如果存在怎么找?羊毛出在羊身上, A A A 应该决定了 P P P、 Λ \Lambda Λ 。实际上, Λ \Lambda Λ 就是特征值构成的对角阵,而 T T T 就是 A A A 的特征值对应的特征向量组成的矩阵。
例如矩阵:
A = [ 2 − 3 2 − 5 ] A= \left [ \begin {array}{ccc} 2 & -3 \\ 2 & -5 \end {array} \right ] A=[22−3−5]
有两个特征根 λ 1 = 1 \lambda_1 = 1 λ1=1 和 λ 2 = − 4 \lambda_2 = -4 λ2=−4,并且对应的特征向量分别为 α 1 = ( 3 , 1 ) T \alpha_1 = (3, 1)^T α1=(3,1)T, α 2 = ( 1 , 2 ) T \alpha_2= (1, 2)^T α2=(1,2)T ,则:
P = [ 3 1 1 2 ] Λ = [ 1 0 0 − 4 ] P= \left [ \begin {array}{cc} 3& 1\\ 1 & 2 \end {array} \right ]\quad \Lambda=\left [ \begin {array}{cc} 1& 0 \\ 0 & -4 \end {array} \right ] P=[3112]Λ=[100−4]
满足 P − 1 A P = Λ P^{-1}AP=\Lambda P−1AP=Λ
如果计算 e A t e^{At} eAt,则
e A t = P e Λ t P − 1 = P exp ( 1 0 0 − 4 ) P − 1 = P ( e t 0 0 e − 4 t ) P − 1 e^{At}= Pe^{\Lambda t}P^{-1}=P \exp \left ( \begin {array}{cc} 1& 0\\ 0 & -4 \end {array} \right ) P^{-1} = P\left ( \begin {array}{cc} e^t& 0\\ 0 & e^{-4t} \end {array} \right )P^{-1} eAt=PeΛtP−1=Pexp(100−4)P−1=P(et00e−4t)P−1
如果矩阵
A = [ 2 1 0 2 ] A= \left [ \begin {array}{ccc} 2 & 1 \\ 0 & 2 \end {array} \right ] A=[2012]
则矩阵 A A A 有一个特征值 λ = 2 \lambda=2 λ=2 (2重),一个线性无关特征向量 α = [ 1 , 0 ] T \alpha =[ 1, 0]^T α=[1,0]T(所有特征向量为 k α , k ≠ 0 k\alpha,k\neq 0 kα,k=0)。如果依旧取两个特征向量作为对角化矩阵 P P P,如令:
P = [ 1 2 0 0 ] P= \left [ \begin {array}{ccc} 1 & 2 \\ 0 & 0 \end {array} \right ] P=[1020]
那么矩阵 P P P 是奇异的,其逆不可计算。追溯原因,是由于二阶方阵 A A A 只有一个线性无关的特征向量 α \alpha α。这世界无奇不有,不可对角化就不可对角化,没什么大不了的,但是,如果还是要计算矩阵的指数怎么办呢?若当标准形应运而生。
任何一个复数域上的 n n n 阶方阵都可以找到唯一的(不考虑顺序)Jordan标准形与之相似。Jordan标准形是准对角矩阵,非零元素只出现在对角线上或对角线上方一行,在对角线上方一行时为1。例如:
[ 1 1 0 2 ] [ 1 1 0 0 2 0 0 0 1 ] [ 1 0 0 0 2 0 0 0 1 ] \left [ \begin {array}{ccc} 1 & 1 \\ 0 & 2 \end {array} \right ] \quad \left [ \begin {array}{ccc} 1 & 1 & 0\\ 0 & 2 & 0 \\ 0 & 0 & 1 \end {array} \right ]\quad \left [ \begin {array}{ccc} 1 & 0 & 0\\ 0 & 2 & 0 \\ 0 & 0 & 1 \end {array} \right ] [1012]⎣⎡100120001⎦⎤⎣⎡100020001⎦⎤
以下则不是若当标准形:
[ 1 2 0 2 ] [ 1 0 1 0 2 0 0 0 1 ] [ 1 0 0 1 2 1 0 0 1 ] \left [ \begin {array}{ccc} 1 & 2 \\ 0 & 2 \end {array} \right ] \quad \left [ \begin {array}{ccc} 1 & 0 & 1\\ 0 & 2 & 0 \\ 0 & 0 & 1 \end {array} \right ]\quad \left [ \begin {array}{ccc} 1 & 0 & 0\\ 1 & 2 & 1 \\ 0 & 0 & 1 \end {array} \right ] [1022]⎣⎡100020101⎦⎤⎣⎡110020011⎦⎤
若非奇异矩阵 P P P 与若当标准形 J J J 满足:
P − 1 A P = J P^{-1}AP = J P−1AP=J
则:
e A t = P e J t P − 1 e^{At} = Pe^{Jt}P^{-1} eAt=PeJtP−1
其中,
e J t = [ 1 t 1 2 ! t 2 . . . 1 ( p − 1 ) ! t p − 1 0 1 t . . . 1 ( p − 2 ) ! t p − 2 ⋮ ⋮ ⋮ ⋮ 0 0 0 . . . 1 ] e λ t e^{Jt}=\left [ \begin {array}{ccccc} 1 & t & \frac{1}{2!}t^2 & ... & \frac{1}{(p-1)!}t^{p-1}\\ 0 & 1 & t & ... & \frac{1}{(p-2)!}t^{p-2} \\ \vdots & \vdots &\vdots& & \vdots \\ 0 & 0 & 0 & ... & 1 \end {array} \right ] e^{\lambda t} eJt=⎣⎢⎢⎢⎡10⋮0t1⋮02!1t2t⋮0.........(p−1)!1tp−1(p−2)!1tp−2⋮1⎦⎥⎥⎥⎤eλt
不要感觉复杂,举个栗子就一下子清晰了。
若
A = [ 2 1 0 2 ] A= \left [ \begin {array}{ccc} 2 & 1 \\ 0 & 2 \end {array} \right ] A=[2012]
可见, A A A 已经是若当标准形, P = P − 1 = I 2 P=P^{-1} = I_2 P=P−1=I2 (二阶单位阵)即可, J = A J=A J=A
e J t = [ 1 t 0 1 ] e 2 t = [ e 2 t t e 2 t 0 e 2 t ] e^{Jt}= \left [ \begin {array}{ccc} 1 & t \\ 0 & 1 \end {array} \right ]e^{2t} = \left [ \begin {array}{ccc} e^{2t} & te^{2t} \\ 0 & e^{2t} \end {array} \right ] eJt=[10t1]e2t=[e2t0te2te2t]
再来一个梨子:
J = [ 2 1 0 0 2 0 0 0 3 ] J= \left [ \begin {array}{ccc} 2 & 1 & 0\\ 0 & 2 & 0 \\ 0 & 0 & 3 \end {array} \right ] J=⎣⎡200120003⎦⎤
分成两个若当块,一个二阶,特征值为2;一个一阶,特征值为3,易得:
e J t = [ e 2 t t e 2 t 0 0 e 2 t 0 0 0 e 3 t ] e^{Jt} = \left [ \begin {array}{ccc} e^{2t} & te^{2t} & 0\\ 0 & e^{2t} & 0 \\ 0 & 0 & e^{3t} \end {array} \right ] eJt=⎣⎡e2t00te2te2t000e3t⎦⎤
其他的就依葫芦画瓢,不再赘述。
对角阵中, P P P 是由线性无关的特征向量组成, Λ \Lambda Λ 由特征值组成。那么,若当标准形中的 P P P、 J J J 如何计算呢?
这里比较繁琐,难打公式,以后再写。