若当标准形与对角阵、特征值与特征向量、矩阵指数运算


一、相似矩阵


如果存在非奇异的矩阵 P P P ,使得 P − 1 A P = B P^{-1}AP=B P1AP=B,则称矩阵 A A A B B B相似。

知道相似有什么意义呢?当然不是为了花里胡哨好看,而是为了使得问题简化。特别地,如果 B B B 刚好为对角矩阵 Λ \Lambda Λ,问题就很简单了,简单在哪里呢?幂函数、指数等简单,跟一个数的运算很相似。

以二阶方阵计算指数说明问题,若
Λ = [ λ 1 0 0 λ 2 ] \Lambda = \left [ \begin {array}{ccc} \lambda_1 \quad 0 \\ 0 \quad \lambda_2 \end {array} \right ] Λ=[λ100λ2]

e Λ t = [ e λ 1 0 0 e λ 2 ] e^{\Lambda t} = \left [ \begin {array}{ccc} e^{\lambda_1} \quad 0 \\ 0 \quad e^{\lambda_2} \end {array} \right ] eΛt=[eλ100eλ2]

换句话说,对于对角阵,计算指数就是直接对对角元素进行指数运算。这样,问题就接踵而至:

  1. 对矩阵做指数运算有什么意义或价值
  2. 所有的矩阵都可以对角化吗
  3. 矩阵不能对角化时,怎样计算指数函数

对于问题1,不是数序问题,简单提一下个人涉及内容,目前学线性系统理论,系统的转移矩阵实际上就是矩阵的指数运算。

对于问题2,答案是否定的,n 阶矩阵需要有 n 个线性无关的特征向量才能对角化,具体在第二节说明。

对于问题3,矩阵不能对角化,但一定能化成若当(Jordan)标准形,也是方便计算指数函数的,对角阵只是特殊的若当标准形。具体第三节说明。


二、对角化


2.1 可对角化

若存在一个非奇异的矩阵 P P P 和一个对角阵 Λ \Lambda Λ,使得 n × n n\times n n×n 矩阵 A A A 满足 P − 1 A P = Λ P^{-1} A P = \Lambda P1AP=Λ则称 A A A 为可对角化的。

P P P Λ \Lambda Λ 存在吗,如果存在怎么找?羊毛出在羊身上, A A A 应该决定了 P P P Λ \Lambda Λ 。实际上, Λ \Lambda Λ 就是特征值构成的对角阵,而 T T T 就是 A A A 的特征值对应的特征向量组成的矩阵。

例如矩阵:

A = [ 2 − 3 2 − 5 ] A= \left [ \begin {array}{ccc} 2 & -3 \\ 2 & -5 \end {array} \right ] A=[2235]

有两个特征根 λ 1 = 1 \lambda_1 = 1 λ1=1 λ 2 = − 4 \lambda_2 = -4 λ2=4,并且对应的特征向量分别为 α 1 = ( 3 , 1 ) T \alpha_1 = (3, 1)^T α1=(3,1)T α 2 = ( 1 , 2 ) T \alpha_2= (1, 2)^T α2=(1,2)T ,则:

P = [ 3 1 1 2 ] Λ = [ 1 0 0 − 4 ] P= \left [ \begin {array}{cc} 3& 1\\ 1 & 2 \end {array} \right ]\quad \Lambda=\left [ \begin {array}{cc} 1& 0 \\ 0 & -4 \end {array} \right ] P=[3112]Λ=[1004]

满足 P − 1 A P = Λ P^{-1}AP=\Lambda P1AP=Λ

如果计算 e A t e^{At} eAt,则

e A t = P e Λ t P − 1 = P exp ⁡ ( 1 0 0 − 4 ) P − 1 = P ( e t 0 0 e − 4 t ) P − 1 e^{At}= Pe^{\Lambda t}P^{-1}=P \exp \left ( \begin {array}{cc} 1& 0\\ 0 & -4 \end {array} \right ) P^{-1} = P\left ( \begin {array}{cc} e^t& 0\\ 0 & e^{-4t} \end {array} \right )P^{-1} eAt=PeΛtP1=Pexp(1004)P1=P(et00e4t)P1


2.2 不可对角化

如果矩阵
A = [ 2 1 0 2 ] A= \left [ \begin {array}{ccc} 2 & 1 \\ 0 & 2 \end {array} \right ] A=[2012]

则矩阵 A A A 有一个特征值 λ = 2 \lambda=2 λ=2 (2重),一个线性无关特征向量 α = [ 1 , 0 ] T \alpha =[ 1, 0]^T α=[1,0]T(所有特征向量为 k α , k ≠ 0 k\alpha,k\neq 0 kα,k=0)。如果依旧取两个特征向量作为对角化矩阵 P P P,如令:

P = [ 1 2 0 0 ] P= \left [ \begin {array}{ccc} 1 & 2 \\ 0 & 0 \end {array} \right ] P=[1020]

那么矩阵 P P P 是奇异的,其逆不可计算。追溯原因,是由于二阶方阵 A A A 只有一个线性无关的特征向量 α \alpha α。这世界无奇不有,不可对角化就不可对角化,没什么大不了的,但是,如果还是要计算矩阵的指数怎么办呢?若当标准形应运而生。


三、若当标准形


3.1 若当标准形定义

任何一个复数域上的 n n n 阶方阵都可以找到唯一的(不考虑顺序)Jordan标准形与之相似。Jordan标准形是准对角矩阵,非零元素只出现在对角线上或对角线上方一行,在对角线上方一行时为1。例如:

[ 1 1 0 2 ] [ 1 1 0 0 2 0 0 0 1 ] [ 1 0 0 0 2 0 0 0 1 ] \left [ \begin {array}{ccc} 1 & 1 \\ 0 & 2 \end {array} \right ] \quad \left [ \begin {array}{ccc} 1 & 1 & 0\\ 0 & 2 & 0 \\ 0 & 0 & 1 \end {array} \right ]\quad \left [ \begin {array}{ccc} 1 & 0 & 0\\ 0 & 2 & 0 \\ 0 & 0 & 1 \end {array} \right ] [1012]100120001100020001

以下则不是若当标准形:

[ 1 2 0 2 ] [ 1 0 1 0 2 0 0 0 1 ] [ 1 0 0 1 2 1 0 0 1 ] \left [ \begin {array}{ccc} 1 & 2 \\ 0 & 2 \end {array} \right ] \quad \left [ \begin {array}{ccc} 1 & 0 & 1\\ 0 & 2 & 0 \\ 0 & 0 & 1 \end {array} \right ]\quad \left [ \begin {array}{ccc} 1 & 0 & 0\\ 1 & 2 & 1 \\ 0 & 0 & 1 \end {array} \right ] [1022]100020101110020011


3.2 若当标准形指数运算

若非奇异矩阵 P P P 与若当标准形 J J J 满足:

P − 1 A P = J P^{-1}AP = J P1AP=J

则:

e A t = P e J t P − 1 e^{At} = Pe^{Jt}P^{-1} eAt=PeJtP1

其中,

e J t = [ 1 t 1 2 ! t 2 . . . 1 ( p − 1 ) ! t p − 1 0 1 t . . . 1 ( p − 2 ) ! t p − 2 ⋮ ⋮ ⋮ ⋮ 0 0 0 . . . 1 ] e λ t e^{Jt}=\left [ \begin {array}{ccccc} 1 & t & \frac{1}{2!}t^2 & ... & \frac{1}{(p-1)!}t^{p-1}\\ 0 & 1 & t & ... & \frac{1}{(p-2)!}t^{p-2} \\ \vdots & \vdots &\vdots& & \vdots \\ 0 & 0 & 0 & ... & 1 \end {array} \right ] e^{\lambda t} eJt=100t102!1t2t0.........(p1)!1tp1(p2)!1tp21eλt

不要感觉复杂,举个栗子就一下子清晰了。


A = [ 2 1 0 2 ] A= \left [ \begin {array}{ccc} 2 & 1 \\ 0 & 2 \end {array} \right ] A=[2012]

可见, A A A 已经是若当标准形, P = P − 1 = I 2 P=P^{-1} = I_2 P=P1=I2 (二阶单位阵)即可, J = A J=A J=A

e J t = [ 1 t 0 1 ] e 2 t = [ e 2 t t e 2 t 0 e 2 t ] e^{Jt}= \left [ \begin {array}{ccc} 1 & t \\ 0 & 1 \end {array} \right ]e^{2t} = \left [ \begin {array}{ccc} e^{2t} & te^{2t} \\ 0 & e^{2t} \end {array} \right ] eJt=[10t1]e2t=[e2t0te2te2t]

再来一个梨子:

J = [ 2 1 0 0 2 0 0 0 3 ] J= \left [ \begin {array}{ccc} 2 & 1 & 0\\ 0 & 2 & 0 \\ 0 & 0 & 3 \end {array} \right ] J=200120003

分成两个若当块,一个二阶,特征值为2;一个一阶,特征值为3,易得:

e J t = [ e 2 t t e 2 t 0 0 e 2 t 0 0 0 e 3 t ] e^{Jt} = \left [ \begin {array}{ccc} e^{2t} & te^{2t} & 0\\ 0 & e^{2t} & 0 \\ 0 & 0 & e^{3t} \end {array} \right ] eJt=e2t00te2te2t000e3t

其他的就依葫芦画瓢,不再赘述。


3.3 若当标准形的计算

对角阵中, P P P 是由线性无关的特征向量组成, Λ \Lambda Λ 由特征值组成。那么,若当标准形中的 P P P J J J 如何计算呢?

这里比较繁琐,难打公式,以后再写。

你可能感兴趣的:(矩阵,线性代数,机器学习)