第三章 矩阵分析基础-笔记与总结

第三章 矩阵分析基础

文章目录

  • 3.1 矩阵序列与矩阵级数
    • 3.1.1 矩阵序列的极限
    • 3.1.2 矩阵级数
  • 3.2 矩阵幂级数
  • 3.3 矩阵的微积分
    • 3.3.1 相对于数量变量的微分和积分
    • 3.3.2 相对于矩阵变量的微分
    • 3.3.3 ~~矩阵在微分方程中的应用~~


3.1 矩阵序列与矩阵级数

3.1.1 矩阵序列的极限

定义3.1的理解——矩阵中的任意一项可取到极限值,则序列A收敛。不收敛的矩阵序列称为发散的。
定理3.1矩阵序列{Ak} k ∞ _k^∞ k收敛于矩阵A的充要条件是||Ak-A||收敛于零。
推论3.1 lim ⁡ k → ∞ {\lim_{k \to \infty}} limkAk=A,则|| lim ⁡ k → ∞ {\lim_{k \to \infty}} limkAk||=||A||
性质3.1 lim ⁡ k → ∞ {\lim_{k \to \infty}} limkAk=A, lim ⁡ k → ∞ {\lim_{k \to \infty}} limkBk=B,则
lim ⁡ k → ∞ A k B k = A B {\lim_{k \to \infty}}A_kB_k=AB klimAkBk=AB
性质3.2 Ak和A均可逆,则
lim ⁡ k → ∞ A k − 1 = A − 1 {\lim_{k \to \infty}}A_k^{-1}=A^{-1} klimAk1=A1
例题结论: lim ⁡ k → ∞ {\lim_{k \to \infty}} limkAk=0的充分必要条件为ρ(A)<1。
性质3.3定义3.1中的序列的和为矩阵级数,记为 ∑ k = 1 ∞ A k \sum\limits_{k=1}^\infty A_k k=1Ak

3.1.2 矩阵级数

定义3.2定义3.3的理解——矩阵前k项部分和记为Sk,若收敛则矩阵级数收敛,矩阵S为矩阵级数的和矩阵,记为S= ∑ i = 1 ∞ A i \sum\limits_{i=1}^\infty A_i i=1Ai。不收敛的矩阵级数称为发散的。
重要公式 ∑ k = 0 ∞ A k = ( I − A ) − 1 {\sum\limits_{k=0}^\infty}A_k=(I-A)^{-1} k=0Ak=(IA)1

推论3.2 若||A||<1,则 lim ⁡ k → ∞ A k = 0 {\lim_{k \to \infty}}A^k=0 klimAk=0
性质3.4的理解—— 矩阵求和中的系数可以提前到求和之前。
定义3.4 任意矩阵的子级数均为绝对收敛,则该矩阵A绝对收敛。
性质3.5 若矩阵级数 ∑ k = 0 ∞ A k {\sum\limits_{k=0}^\infty}A_k k=0Ak绝对收敛,则它一定是收敛的,并且任意调换各项的顺序所得到的级数还是收敛的,且级数和不变。
性质3.6 矩阵级数绝对收敛的充分必要条件是正项级数 ∑ k = 0 ∞ ∣ ∣ A k ∣ ∣ {\sum\limits_{k=0}^\infty}||A_k|| k=0Ak收敛。
性质3.7 两个绝对收敛的级数A和B,按任何方式排列得到的级数也是绝对收敛,且和均为AB。
性质3.8 m×n型矩阵级数A收敛,则 p×q矩阵级数 ∑ k = 0 ∞ P A Q \sum\limits_{k=0}^\infty PAQ k=0PAQ也收敛
∑ k = 0 ∞ P A Q = P ( ∑ k = 0 ∞ A ) Q \sum\limits_{k=0}^\infty PAQ = P (\sum\limits_{k=0}^\infty A)Q k=0PAQ=Pk=0AQ

3.2 矩阵幂级数

定理3.2 幂级数akzk的收敛半径为r,A为n阶方阵,则
(1)ρ(A) (2)ρ(A)>r,幂级数发散
推论3.3 ∑ 0 ∞ a k ( z − z 0 ) k \sum_0^\infty a_k(z-z_0)^k 0ak(zz0)k为收敛半径为r的幂级数,A为n阶方阵,如果A的特征值均落在收敛圆内,即 ∣ λ − z 0 ∣ < r |λ-z_0|λz0<r,其中 λ λ λ为A的任意特征值,则矩阵幂级数 ∑ 0 ∞ a k ( A − z 0 I ) k \sum_0^\infty a_k(A-z_0I)^k 0ak(Az0I)k绝对收敛;若有某个 λ i 0 λ_i0 λi0使得 ∣ λ i 0 − z 0 ∣ > r |λ_{i0}-z_0|>r λi0z0>r,则幂级数 ∑ 0 ∞ a k ( A − z 0 I ) k \sum_0^\infty a_k(A-z_0I)^k 0ak(Az0I)k发散。
重要公式:
e A = I + A + A 2 2 ! + A 3 3 ! + . . . e^A=I+A+\frac{A^2}{2!}+\frac{A^3}{3!}+... eA=I+A+2!A2+3!A3+...
c o s A = I − A 2 2 ! + A 4 4 ! + . . . cos^A=I-\frac{A^2}{2!}+\frac{A^4}{4!}+... cosA=I2!A2+4!A4+...
s i n A = z − A + A 3 3 ! + A 5 5 ! + . . . sin^A=z-A+\frac{A^3}{3!}+\frac{A^5}{5!}+... sinA=zA+3!A3+5!A5+...
( I − A ) − 1 = I + A + A 2 + A 3 + . . . (I-A)^{-1}=I+A+A^2+A^3+... (IA)1=I+A+A2+A3+...
l n ( I + A ) = A − A 2 2 ! + A 3 3 ! − . . . ln(I+A)=A-\frac{A^2}{2!}+\frac{A^3}{3!}-... ln(I+A)=A2!A2+3!A3...

引理3.1 f ( z ) = ∑ k = 0 ∞ a k z k f(z)=\sum\limits_{k=0}^\infty a_kz^k f(z)=k=0akzk是收敛半径为r的幂级数, J i J_i Ji是特征值为 λ i λ_i λi的ni阶Jordan块阵,且 ∣ λ i ∣ < r |λ_i|λi<r,则
f ( J i ) = ( f ( λ i )   f ′ ( λ i )   . . .   f n i − 1 ( λ i ) ( n i − 1 ) ! 0       f ( λ i )   f ′ ( λ i )   0 0      0       …   f ′ ( λ i ) 0      0       0       f ( λ i ) ) (3-1) f(J_i)= \begin{pmatrix} f(λ_i) \ f'(λ_i) \ ... \ \frac{ f^{n_i-1}(λ_i) }{(n_i-1)!} \\ 0 \ \ \ \ \ f(λ_i) \ f'(λ_i) \ 0 \\ 0 \ \ \ \ 0 \ \ \ \ \ … \ f'(λ_i) \\ 0 \ \ \ \ 0 \ \ \ \ \ 0 \ \ \ \ \ f(λ_i) \\ \end{pmatrix}\tag{3-1} f(Ji)=f(λi) f(λi) ... (ni1)!fni1(λi)0     f(λi) f(λi) 00    0      f(λi)0    0     0     f(λi)(3-1)
推论3.4 f ( z ) = ∑ k = 0 ∞ a k ( z − z 0 ) k f(z)=\sum\limits_{k=0}^\infty a_k(z-z_0)^k f(z)=k=0ak(zz0)k是收敛半径为r的幂级数, J i J_i Ji是特征值为 λ i λ_i λi的ni阶Jordan块阵,且 ∣ λ i − z 0 ∣ < r |λ_i-z_0|λiz0<r,则
f ( J i ) = ( f ( λ i )   f ′ ( λ i )   . . .   f n i − 1 ( λ i ) ( n i − 1 ) ! 0       f ( λ i )   f ′ ( λ i )   0 0      0       …   f ′ ( λ i ) 0      0       0       f ( λ i ) ) f(J_i)= \begin{pmatrix} f(λ_i) \ f'(λ_i) \ ... \ \frac{ f^{n_i-1}(λ_i) }{(n_i-1)!} \\ 0 \ \ \ \ \ f(λ_i) \ f'(λ_i) \ 0 \\ 0 \ \ \ \ 0 \ \ \ \ \ … \ f'(λ_i) \\ 0 \ \ \ \ 0 \ \ \ \ \ 0 \ \ \ \ \ f(λ_i) \\ \end{pmatrix} f(Ji)=f(λi) f(λi) ... (ni1)!fni1(λi)0     f(λi) f(λi) 00    0      f(λi)0    0     0     f(λi)
推论3.5 f ( z ) = ∑ k = 0 ∞ a k z k f(z)=\sum\limits_{k=0}^\infty a_kz^k f(z)=k=0akzk是收敛半径为r的幂级数, J i J_i Ji是特征值为 λ i λ_i λi的ni阶Jordan块阵,且 ∣ λ i ∣ < r |λ_i|λi<r,则
f ( J i ) = ( f ( λ i )   f ′ ( λ i )   . . .   f n i − 1 ( λ i ) ( n i − 1 ) ! 0       f ( λ i )   f ′ ( λ i )   0 0      0       …   f ′ ( λ i ) 0      0       0       f ( λ i ) ) f(J_i)= \begin{pmatrix} f(λ_i) \ f'(λ_i) \ ... \ \frac{ f^{n_i-1}(λ_i) }{(n_i-1)!} \\ 0 \ \ \ \ \ f(λ_i) \ f'(λ_i) \ 0 \\ 0 \ \ \ \ 0 \ \ \ \ \ … \ f'(λ_i) \\ 0 \ \ \ \ 0 \ \ \ \ \ 0 \ \ \ \ \ f(λ_i) \\ \end{pmatrix} f(Ji)=f(λi) f(λi) ... (ni1)!fni1(λi)0     f(λi) f(λi) 00    0      f(λi)0    0     0     f(λi)
定理3.3 f ( z ) = ∑ k = 0 ∞ a k z k f(z)=\sum\limits_{k=0}^\infty a_kz^k f(z)=k=0akzk是收敛半径为r的幂级数,A为n阶方阵, A = T J T − 1 A=TJT^{-1} A=TJT1为其Jordan分解, J = d i a g ( J 1 , J 2 , . . . , J s ) J=diag(J_1,J_2,...,J_s) J=diagJ1,J2,...,Js)。当A的特征值均落在收敛圆内时,即|λ| ∑ k = 0 ∞ a k A k \sum\limits_{k=0}^\infty a_kA^k k=0akAk
绝对收敛,并且和矩阵为
f ( A ) = T d i a g ( f ( J 1 ) , f ( J 2 ) , . . . , f ( J s ) ) T − 1 f(A)=Tdiag( f(J_1), f(J_2),..., f(J_s))T^{-1} f(A)=Tdiag(f(J1),f(J2),...,f(Js))T1 f ( J i ) f(J_i) fJi的式子为引理3.1的 f ( J i ) f(J_i) fJi

为避免求矩阵A的Jordan分解,用有限待定系数法计算 f ( A ) f(A) f(A) f ( A t ) f(At) f(At)
有限待定系数法

  1. 求矩阵A的特征多项式(3-11)
  2. q ( λ ) = b n − 1 λ n − 1 + . . . + b 1 λ + b 0 q(λ)=b_{n-1}λ^{n-1}+...+b_{1}λ+b_{0} qλ=bn1λn1+...+b1λ+b0
    q ( j ) ( λ i ) = t j f ( j ) ( λ ) ∣ λ = λ i t q^{(j)}(λ_i)=t^jf^{(j)}(λ)|_{λ=λ_it} q(j)λi=tjf(j)λλ=λit (j=0,1,…,m_{i-1};i=1,2,…,s)
    q ( j ) ( λ i ) = f ( j ) ( λ ) ∣ λ = λ i t q^{(j)}(λ_i)=f^{(j)}(λ)|_{λ=λ_it} q(j)λi=f(j)λλ=λit (j=0,1,…,m_{i-1};i=1,2,…,s)
    列出线性方程组求解 b 0 , b 1 , . . . , b n − 1 b_0,b_1,...,b_{n-1} b0,b1,...,bn1
  3. 计算 f ( A t ) f(At) fAt(当t=1时, f ( A ) = q ( A ) = b n − 1 A n − 1 + . . . + b 1 ( t ) A + b 0 ( t ) I f(A)=q(A)=b_{n-1}A^{n-1}+...+b_1(t)A+b_0(t)I fA=qA=bn1An1+...+b1(t)A+b0(t)I

常用公式:

  1. 任意方阵A,总有
    (1) sin(-A)=sinA
    (2) cos(-A)=cosA
    (3) e i A = c o s A + i s i n A e^{iA}=cosA+isinA eiA=cosA+isinA
    (4) c o s A = 1 2 ( e i A + e − i A ) cosA=\frac{1}{2}(e^{iA}+e^{-iA}) cosA=21(eiA+eiA)
    (5) s i n A = 1 2 i ( e i A − e − i A ) sinA=\frac{1}{2i}(e^{iA}-e^{-iA}) sinA=2i1(eiAeiA)
  2. 任意方阵A和B,且AB=BA
    (1) sin(A+B)=sinAcosB+cosAsinB
    (2) cos(A+B)=cosAcosB-sinAsinB
    (3) e A e B = e B e A = e A + B e^{A}e^{B}=e^{B}e^{A}=e^{A+B} eAeB=eBeA=eA+B
  3. 若A=B
    c o s 2 A = c o s 2 A − s i n 2 A cos2A=cos^2A-sin^2A cos2A=cos2Asin2A
    s i n 2 A = 2 s i n A c o s A sin2A=2sinAcosA sin2A=2sinAcosA

3.3 矩阵的微积分

3.3.1 相对于数量变量的微分和积分

定义3.5 如果矩阵A(t)的每一个元素均为变量t的微函数,则称A(t)可微,且导数定义为
A ‘ ( t ) = d d t A ( t ) A‘(t)=\frac{d}{dt}A(t) At=dtdAt
定理3.4 设A(t)、B(t)是可进行运算的两个可微矩阵,则以下的运算规则成立:

  • d d t ( A ( t ) + B ( t ) ) = d d t A ( t ) + d d t B ( t ) \frac{d}{dt}(A(t)+B(t))=\frac{d}{dt}A(t)+\frac{d}{dt}B(t) dtdAt+Bt=dtdAt+dtdBt
  • d d t ( A ( t ) B ( t ) ) = B ( t ) d d t A ( t ) + A ( t ) d d t B ( t ) \frac{d}{dt}(A(t)B(t))=B(t)\frac{d}{dt}A(t)+A(t)\frac{d}{dt}B(t) dtdAtBt=BtdtdAt+AtdtdBt
  • d d t ( α A ( t ) ) = α d d t A ( t ) \frac{d}{dt}(αA(t))=α\frac{d}{dt}A(t) dtdαAt=αdtdAt
  • u=f(t),u可微 d d t A ( u ) = f ′ ( t ) d d u A ( u ) \frac{d}{dt}A(u)=f'(t)\frac{d}{du}A(u) dtdAu=ftdudAu
  • A{-1}为可微矩阵时, d d t ( A − 1 ( t ) ) = − A − 1 ( t ) ( d d t A ( t ) ) A − 1 ( t ) \frac{d}{dt}(A^{-1}(t))=-A^{-1}(t)(\frac{d}{dt}A(t))A^{-1}(t) dtdA1t=A1t(dtdAt)A1t

定理3.5 设n阶方阵A与t无关,则有

d d t e t A = A e t A = e t A A \frac{d}{dt}e^{tA}=Ae^{tA}=e^{tA}A dtdetA=AetA=etAA
d d t s i n t A = A c o s t A = c o s t A A \frac{d}{dt}sin^{tA}=Acos^{tA}=cos^{tA}A dtdsintA=AcostA=costAA
d d t c o s t A = − A s i n t A = − s i n t A A \frac{d}{dt}cos^{tA}=-Asin^{tA}=-sin^{tA}A dtdcostA=AsintA=sintAA

定义3.6 矩阵A的每一个元素在区间内可积,则A的积分为每一项积分后的矩阵。
∫ a b ( A ( t ) + B ( t ) )   d t = ∫ a b A ( t )   d t + ∫ a b B ( t )   d t \int_{a}^{b}(A(t)+B(t))\,dt=\int_{a}^{b}A(t)\,dt+\int_{a}^{b}B(t)\,dt ab(A(t)+B(t))dt=abA(t)dt+abB(t)dt
B为常数矩阵 ∫ a b A ( t ) B   d t = ( ∫ a b A ( t )   d t ) B \int_{a}^{b}A(t)B\,dt=(\int_{a}^{b}A(t)\,dt)B abA(t)Bdt=(abA(t)dt)B
A为常数矩阵 ∫ a b A B ( t )   d t = A ∫ a b B ( t )   d t \int_{a}^{b}AB(t)\,dt=A\int_{a}^{b}B(t)\,dt abAB(t)dt=AabB(t)dt

3.3.2 相对于矩阵变量的微分

定义3.7得出
d f d x = A x + A T x = ( A + A T ) x \frac{df}{dx}=Ax+A^Tx=(A+A^T)x dxdf=Ax+ATx=(A+AT)x

3.3.3 矩阵在微分方程中的应用

你可能感兴趣的:(数值分析,计算机科学计算,矩阵)