第三章 矩阵分析基础
对定义3.1的理解——矩阵中的任意一项可取到极限值,则序列A收敛。不收敛的矩阵序列称为发散的。
定理3.1矩阵序列{Ak} k ∞ _k^∞ k∞收敛于矩阵A的充要条件是||Ak-A||收敛于零。
推论3.1 lim k → ∞ {\lim_{k \to \infty}} limk→∞Ak=A,则|| lim k → ∞ {\lim_{k \to \infty}} limk→∞Ak||=||A||
性质3.1 lim k → ∞ {\lim_{k \to \infty}} limk→∞Ak=A, lim k → ∞ {\lim_{k \to \infty}} limk→∞Bk=B,则
lim k → ∞ A k B k = A B {\lim_{k \to \infty}}A_kB_k=AB k→∞limAkBk=AB
性质3.2 Ak和A均可逆,则
lim k → ∞ A k − 1 = A − 1 {\lim_{k \to \infty}}A_k^{-1}=A^{-1} k→∞limAk−1=A−1
例题结论: lim k → ∞ {\lim_{k \to \infty}} limk→∞Ak=0的充分必要条件为ρ(A)<1。
性质3.3定义3.1中的序列的和为矩阵级数,记为 ∑ k = 1 ∞ A k \sum\limits_{k=1}^\infty A_k k=1∑∞Ak
对定义3.2 和定义3.3的理解——矩阵前k项部分和记为Sk,若收敛则矩阵级数收敛,矩阵S为矩阵级数的和矩阵,记为S= ∑ i = 1 ∞ A i \sum\limits_{i=1}^\infty A_i i=1∑∞Ai。不收敛的矩阵级数称为发散的。
重要公式: ∑ k = 0 ∞ A k = ( I − A ) − 1 {\sum\limits_{k=0}^\infty}A_k=(I-A)^{-1} k=0∑∞Ak=(I−A)−1
推论3.2 若||A||<1,则 lim k → ∞ A k = 0 {\lim_{k \to \infty}}A^k=0 k→∞limAk=0。
对性质3.4的理解—— 矩阵求和中的系数可以提前到求和之前。
定义3.4 任意矩阵的子级数均为绝对收敛,则该矩阵A绝对收敛。
性质3.5 若矩阵级数 ∑ k = 0 ∞ A k {\sum\limits_{k=0}^\infty}A_k k=0∑∞Ak绝对收敛,则它一定是收敛的,并且任意调换各项的顺序所得到的级数还是收敛的,且级数和不变。
性质3.6 矩阵级数绝对收敛的充分必要条件是正项级数 ∑ k = 0 ∞ ∣ ∣ A k ∣ ∣ {\sum\limits_{k=0}^\infty}||A_k|| k=0∑∞∣∣Ak∣∣收敛。
性质3.7 两个绝对收敛的级数A和B,按任何方式排列得到的级数也是绝对收敛,且和均为AB。
性质3.8 m×n型矩阵级数A收敛,则 p×q矩阵级数 ∑ k = 0 ∞ P A Q \sum\limits_{k=0}^\infty PAQ k=0∑∞PAQ也收敛
∑ k = 0 ∞ P A Q = P ( ∑ k = 0 ∞ A ) Q \sum\limits_{k=0}^\infty PAQ = P (\sum\limits_{k=0}^\infty A)Q k=0∑∞PAQ=P(k=0∑∞A)Q
定理3.2 幂级数akzk的收敛半径为r,A为n阶方阵,则
(1)ρ(A)
推论3.3 设 ∑ 0 ∞ a k ( z − z 0 ) k \sum_0^\infty a_k(z-z_0)^k ∑0∞ak(z−z0)k为收敛半径为r的幂级数,A为n阶方阵,如果A的特征值均落在收敛圆内,即 ∣ λ − z 0 ∣ < r |λ-z_0|
重要公式: :
e A = I + A + A 2 2 ! + A 3 3 ! + . . . e^A=I+A+\frac{A^2}{2!}+\frac{A^3}{3!}+... eA=I+A+2!A2+3!A3+...
c o s A = I − A 2 2 ! + A 4 4 ! + . . . cos^A=I-\frac{A^2}{2!}+\frac{A^4}{4!}+... cosA=I−2!A2+4!A4+...
s i n A = z − A + A 3 3 ! + A 5 5 ! + . . . sin^A=z-A+\frac{A^3}{3!}+\frac{A^5}{5!}+... sinA=z−A+3!A3+5!A5+...
( I − A ) − 1 = I + A + A 2 + A 3 + . . . (I-A)^{-1}=I+A+A^2+A^3+... (I−A)−1=I+A+A2+A3+...
l n ( I + A ) = A − A 2 2 ! + A 3 3 ! − . . . ln(I+A)=A-\frac{A^2}{2!}+\frac{A^3}{3!}-... ln(I+A)=A−2!A2+3!A3−...
引理3.1 设 f ( z ) = ∑ k = 0 ∞ a k z k f(z)=\sum\limits_{k=0}^\infty a_kz^k f(z)=k=0∑∞akzk是收敛半径为r的幂级数, J i J_i Ji是特征值为 λ i λ_i λi的ni阶Jordan块阵,且 ∣ λ i ∣ < r |λ_i|
f ( J i ) = ( f ( λ i ) f ′ ( λ i ) . . . f n i − 1 ( λ i ) ( n i − 1 ) ! 0 f ( λ i ) f ′ ( λ i ) 0 0 0 … f ′ ( λ i ) 0 0 0 f ( λ i ) ) (3-1) f(J_i)= \begin{pmatrix} f(λ_i) \ f'(λ_i) \ ... \ \frac{ f^{n_i-1}(λ_i) }{(n_i-1)!} \\ 0 \ \ \ \ \ f(λ_i) \ f'(λ_i) \ 0 \\ 0 \ \ \ \ 0 \ \ \ \ \ … \ f'(λ_i) \\ 0 \ \ \ \ 0 \ \ \ \ \ 0 \ \ \ \ \ f(λ_i) \\ \end{pmatrix}\tag{3-1} f(Ji)=⎝⎜⎜⎛f(λi) f′(λi) ... (ni−1)!fni−1(λi)0 f(λi) f′(λi) 00 0 … f′(λi)0 0 0 f(λi)⎠⎟⎟⎞(3-1)
推论3.4 设 f ( z ) = ∑ k = 0 ∞ a k ( z − z 0 ) k f(z)=\sum\limits_{k=0}^\infty a_k(z-z_0)^k f(z)=k=0∑∞ak(z−z0)k是收敛半径为r的幂级数, J i J_i Ji是特征值为 λ i λ_i λi的ni阶Jordan块阵,且 ∣ λ i − z 0 ∣ < r |λ_i-z_0|
f ( J i ) = ( f ( λ i ) f ′ ( λ i ) . . . f n i − 1 ( λ i ) ( n i − 1 ) ! 0 f ( λ i ) f ′ ( λ i ) 0 0 0 … f ′ ( λ i ) 0 0 0 f ( λ i ) ) f(J_i)= \begin{pmatrix} f(λ_i) \ f'(λ_i) \ ... \ \frac{ f^{n_i-1}(λ_i) }{(n_i-1)!} \\ 0 \ \ \ \ \ f(λ_i) \ f'(λ_i) \ 0 \\ 0 \ \ \ \ 0 \ \ \ \ \ … \ f'(λ_i) \\ 0 \ \ \ \ 0 \ \ \ \ \ 0 \ \ \ \ \ f(λ_i) \\ \end{pmatrix} f(Ji)=⎝⎜⎜⎛f(λi) f′(λi) ... (ni−1)!fni−1(λi)0 f(λi) f′(λi) 00 0 … f′(λi)0 0 0 f(λi)⎠⎟⎟⎞
推论3.5 设 f ( z ) = ∑ k = 0 ∞ a k z k f(z)=\sum\limits_{k=0}^\infty a_kz^k f(z)=k=0∑∞akzk是收敛半径为r的幂级数, J i J_i Ji是特征值为 λ i λ_i λi的ni阶Jordan块阵,且 ∣ λ i ∣ < r |λ_i|
f ( J i ) = ( f ( λ i ) f ′ ( λ i ) . . . f n i − 1 ( λ i ) ( n i − 1 ) ! 0 f ( λ i ) f ′ ( λ i ) 0 0 0 … f ′ ( λ i ) 0 0 0 f ( λ i ) ) f(J_i)= \begin{pmatrix} f(λ_i) \ f'(λ_i) \ ... \ \frac{ f^{n_i-1}(λ_i) }{(n_i-1)!} \\ 0 \ \ \ \ \ f(λ_i) \ f'(λ_i) \ 0 \\ 0 \ \ \ \ 0 \ \ \ \ \ … \ f'(λ_i) \\ 0 \ \ \ \ 0 \ \ \ \ \ 0 \ \ \ \ \ f(λ_i) \\ \end{pmatrix} f(Ji)=⎝⎜⎜⎛f(λi) f′(λi) ... (ni−1)!fni−1(λi)0 f(λi) f′(λi) 00 0 … f′(λi)0 0 0 f(λi)⎠⎟⎟⎞
定理3.3 设 f ( z ) = ∑ k = 0 ∞ a k z k f(z)=\sum\limits_{k=0}^\infty a_kz^k f(z)=k=0∑∞akzk是收敛半径为r的幂级数,A为n阶方阵, A = T J T − 1 A=TJT^{-1} A=TJT−1为其Jordan分解, J = d i a g ( J 1 , J 2 , . . . , J s ) J=diag(J_1,J_2,...,J_s) J=diag(J1,J2,...,Js)。当A的特征值均落在收敛圆内时,即|λ|
f ( A ) = T d i a g ( f ( J 1 ) , f ( J 2 ) , . . . , f ( J s ) ) T − 1 f(A)=Tdiag( f(J_1), f(J_2),..., f(J_s))T^{-1} f(A)=Tdiag(f(J1),f(J2),...,f(Js))T−1 f ( J i ) f(J_i) f(Ji)的式子为引理3.1的 f ( J i ) f(J_i) f(Ji)。
为避免求矩阵A的Jordan分解,用有限待定系数法计算 f ( A ) f(A) f(A)和 f ( A t ) f(At) f(At)
有限待定系数法
常用公式:
定义3.5 如果矩阵A(t)的每一个元素均为变量t的微函数,则称A(t)可微,且导数定义为
A ‘ ( t ) = d d t A ( t ) A‘(t)=\frac{d}{dt}A(t) A‘(t)=dtdA(t)
定理3.4 设A(t)、B(t)是可进行运算的两个可微矩阵,则以下的运算规则成立:
定理3.5 设n阶方阵A与t无关,则有
d d t e t A = A e t A = e t A A \frac{d}{dt}e^{tA}=Ae^{tA}=e^{tA}A dtdetA=AetA=etAA
d d t s i n t A = A c o s t A = c o s t A A \frac{d}{dt}sin^{tA}=Acos^{tA}=cos^{tA}A dtdsintA=AcostA=costAA
d d t c o s t A = − A s i n t A = − s i n t A A \frac{d}{dt}cos^{tA}=-Asin^{tA}=-sin^{tA}A dtdcostA=−AsintA=−sintAA
定义3.6 矩阵A的每一个元素在区间内可积,则A的积分为每一项积分后的矩阵。
∫ a b ( A ( t ) + B ( t ) ) d t = ∫ a b A ( t ) d t + ∫ a b B ( t ) d t \int_{a}^{b}(A(t)+B(t))\,dt=\int_{a}^{b}A(t)\,dt+\int_{a}^{b}B(t)\,dt ∫ab(A(t)+B(t))dt=∫abA(t)dt+∫abB(t)dt
B为常数矩阵 ∫ a b A ( t ) B d t = ( ∫ a b A ( t ) d t ) B \int_{a}^{b}A(t)B\,dt=(\int_{a}^{b}A(t)\,dt)B ∫abA(t)Bdt=(∫abA(t)dt)B
A为常数矩阵 ∫ a b A B ( t ) d t = A ∫ a b B ( t ) d t \int_{a}^{b}AB(t)\,dt=A\int_{a}^{b}B(t)\,dt ∫abAB(t)dt=A∫abB(t)dt
由定义3.7得出
d f d x = A x + A T x = ( A + A T ) x \frac{df}{dx}=Ax+A^Tx=(A+A^T)x dxdf=Ax+ATx=(A+AT)x