- 注: 以下内容均由个人整理, 不保证完全准确, 如有纰漏, 欢迎交流讨论
- 参考: 杨明, 刘先忠. 矩阵论(第二版)[M]. 武汉: 华中科技大学出版社, 2005
2 Jordan 标准形介绍
2.1 线性变换的对角矩阵表示
线性变换的特征值 特征向量
T T T 是 V n ( F ) V_n(F) Vn(F) 上的线性变换, T T T 在某组基 { ξ 1 , ξ 2 , . . . ξ n } \{\xi_1,\xi_2,...\xi_n\} {ξ1,ξ2,...ξn} 下变换矩阵为对角矩阵 [ λ 1 λ 2 ⋱ λ n ] \begin{bmatrix}\lambda_1& & & \\ &\lambda_2& & \\ & &\ddots& \\ & & &\lambda_n\end{bmatrix} ⎣⎢⎢⎡λ1λ2⋱λn⎦⎥⎥⎤ ⟺ T ( ξ i ) = λ i ξ i , i = 1 , 2 , . . . , n T(\xi_i)=\lambda_i\xi_i,i=1,2,...,n T(ξi)=λiξi,i=1,2,...,n
Def’ 2.1: T T T 是 V n ( F ) V_n(F) Vn(F) 上的线性变换, 若 ∃ ξ ∈ V n ( F ) , λ ∈ F , ξ ≠ 0 ⃗ : T ( ξ ) = λ ξ \exists\xi\in V_n(F),\lambda\in F,\xi\neq\vec{0}: T(\xi)=\lambda\xi ∃ξ∈Vn(F),λ∈F,ξ=0 :T(ξ)=λξ:
- 数 λ \lambda λ 是 T T T 特征值 (对应变换矩阵 A A A 的特征值)
- 向量 ξ \xi ξ 是 T T T 对应 λ \lambda λ 的特征向量 (向量坐标对应变换矩阵 A A A 的特征向量)
相似矩阵有相同特征值, 与基的选择无关; 但特征向量一般不同.
特征向量求法
(相当于求矩阵特征向量)
- 选择基(一般选自然基), 并写出变换 T T T 在基下对应的变换矩阵 A A A
- 求矩阵 A A A 的特征值: 即求特征多项式 f ( λ ) = ∣ λ I − A ∣ = 0 f(\lambda)=\pmb{|\lambda I-A|}=0 f(λ)=∣λI−A∣∣λI−A∣∣λI−A∣=0 的解 λ 1 , λ 2 , . . . , λ n \lambda_1,\lambda_2,...,\lambda_n λ1,λ2,...,λn 为全部特征值.
- 求矩阵 A A A 关于 λ i \lambda_i λi 的特征向量: 求方程 ( λ i I − A ) X = 0 (\lambda_iI-A)X=0 (λiI−A)X=0 或 ( A − λ i I ) X = 0 (A-\lambda_iI)X=0 (A−λiI)X=0 的非零解 X X X (需要将算出的 λ i \lambda_i λi 的值带入). 它是 T T T 的特征值对应的特征向量的坐标.
特征子空间
Def’ 2.2: 特征子空间 V λ = L { ξ 1 , ξ 2 , . . . , ξ t } = { ξ ∣ T ( ξ ) = λ ξ } = N ( T − λ I ) V_\lambda=L\{\xi_1,\xi_2,...,\xi_t\}=\{\xi|T(\xi)=\lambda\xi\}=N(T-\lambda I) Vλ=L{ξ1,ξ2,...,ξt}={ξ∣T(ξ)=λξ}=N(T−λI), 即 ξ 1 , ξ 2 , . . . , ξ t \xi_1,\xi_2,...,\xi_t ξ1,ξ2,...,ξt 是变换 T T T 对应特征值 λ \lambda λ 的极大线性无关组(变换的 t t t 个特征向量).
Th 2.2: 特征子空间性质:
V n ( F ) V_n(F) Vn(F) 上线性变换 T T T 的 s s s 个互异特征值 λ 1 , λ 2 , . . . , λ n \lambda_1,\lambda_2,...,\lambda_n λ1,λ2,...,λn, V λ i = L { ξ 1 , ξ 2 , . . . , ξ t } V_{\lambda_i}=L\{\xi_1,\xi_2,...,\xi_t\} Vλi=L{ξ1,ξ2,...,ξt} 是 λ i \lambda_i λi 的特征子空间, i = 1 , 2 , . . . , s i=1,2,...,s i=1,2,...,s, 则:
- V λ i V_{\lambda_i} Vλi 是 T T T 的不变子空间(原像和像都在该空间)
- λ i ≠ λ j \lambda_i\neq\lambda_j λi=λj, 则 V λ i ∩ V λ j = { 0 ⃗ } V_{\lambda_i}\cap V_{\lambda_j}=\{\vec{0}\} Vλi∩Vλj={0 }
- 若 λ i \lambda_i λi 是 T T T 的 k k k 重特征值(1 个特征值至少 1 个特征向量), 则 d i m V λ i ≤ k dimV_{\lambda_i}\leq k dimVλi≤k ( d i m V λ i dimV_{\lambda_i} dimVλi 为特征向量的个数, 即几何重数; k k k 为代数重数; 几何重数 ≤ \leq ≤代数重数)
推论:
- 单特征值 λ i \lambda_i λi, d i m V λ i = 1 dimV_{\lambda_i}=1 dimVλi=1
- V λ 1 + V λ 2 + . . . + V λ s = V λ 1 ⊕ V λ 2 ⊕ . . . V λ s ⊆ V n ( F ) V_{\lambda_1}+V_{\lambda_2}+...+V_{\lambda_s}=V_{\lambda_1}\oplus V_{\lambda_2}\oplus...V_{\lambda_s}\subseteq V_n(F) Vλ1+Vλ2+...+Vλs=Vλ1⊕Vλ2⊕...Vλs⊆Vn(F)
线性变换矩阵对角化
V n ( F ) V_n(F) Vn(F) 上线性变换 T T T 可对角化 ⟺ T T T 的变换矩阵 A A A 可对角化
⟺ T T T 有 n n n 个线性无关的特征向量
⟺ ∑ d i m V λ i = n \sum dim V_{\lambda_i}=n ∑dimVλi=n
⟺ d i m V λ i = k i , i = 1 , . . . , s dim V_{\lambda_i}=k_i,i=1,...,s dimVλi=ki,i=1,...,s (即每个特征子空间的几何重数等于代数重数), 其中 f ( λ ) = ∣ λ I − A ∣ = ( λ − λ 1 ) k 1 ( λ − λ 2 ) k 2 ⋯ ( λ − λ s ) k s , ∑ i = 1 s k i = n f(\lambda)=|\lambda I-A|=(\lambda-\lambda_1)^{k_1}(\lambda-\lambda_2)^{k_2}\cdots(\lambda-\lambda_s)^{k_s}, \sum_{i=1}^sk_i=n f(λ)=∣λI−A∣=(λ−λ1)k1(λ−λ2)k2⋯(λ−λs)ks,∑i=1ski=n (代数重数的和总为 n n n, 但几何重数的和 ≤ n \leq n ≤n)
⟺ V λ 1 ⊕ V λ 2 ⊕ . . . V λ s = V n ( F ) V_{\lambda_1}\oplus V_{\lambda_2}\oplus...V_{\lambda_s}=V_n(F) Vλ1⊕Vλ2⊕...Vλs=Vn(F)
重要等式:
d i m V λ i = n − r a n k ( λ I − A ) dimV_{\lambda_i}=n-rank(\lambda I-A) dimVλi=n−rank(λI−A)
特征子空间 V λ i V_{\lambda_i} Vλi 的维数相当于整个空间 V n ( F ) V_n(F) Vn(F) 的维数减去"求子空间的方程 λ I − A \lambda I-A λI−A 的秩".
一种理解: 以 ( λ I − A ) x = 0 ⃗ (\lambda I-A)x=\vec{0} (λI−A)x=0 解方程的角度理解
- d i m V λ i dimV_{\lambda_i} dimVλi: 即 V λ i V_{\lambda_i} Vλi 基的个数, 相当于自由未知数的个数
- n n n: 即未知数的总数
- r a n k ( λ I − A ) rank(\lambda I-A) rank(λI−A): 即未知数的方程个数.
2.2 Jordan 矩阵介绍
Jordan 块和 Jordan 矩阵
Jordan 块:
J ( λ ) = [ λ 1 λ 1 ⋱ 1 λ ] J(\lambda)=\begin{bmatrix} \lambda&1& & \\ &\lambda&1& \\ & &\ddots&1\\ & & &\lambda \end{bmatrix} J(λ)=⎣⎢⎢⎡λ1λ1⋱1λ⎦⎥⎥⎤
注: 对角线 λ \lambda λ 都相同, 上面一列全为 1.
Jordan 矩阵: 有 Jordan 块组成
J = [ J ( λ 1 ) J ( λ 2 ) ⋱ J ( λ m ) ] J=\begin{bmatrix} J(\lambda_1)& & & \\ &J(\lambda_2)& & \\ & &\ddots& \\ & & &J(\lambda_m) \end{bmatrix} J=⎣⎢⎢⎡J(λ1)J(λ2)⋱J(λm)⎦⎥⎥⎤
Jordan 标准形
Th 2.5: 在复数域 C C C 上, 每个方阵 A A A 都相似于一个 Jordan 阵 J A J_A JA.
含义:
- Jordan 矩阵可以作为相似标准形
- 惟一性: Jordan 子块的集合唯一(子块的顺序无关紧要)
- A A A 相似于 B B B ⟺ J A J_A JA 相似于 J B J_B JB
Jordan 标准形求法★
目标: 求可逆矩阵 P P P 和 Jordan 矩阵 J A J_A JA, 使 A P = P J A AP=PJ_A AP=PJA
求法与步骤:
- 求 A A A 的特征值
f ( λ ) = ∣ λ I − A ∣ = ( λ − λ 1 ) k 1 ( λ − λ 2 ) k 2 ⋯ ( λ − λ s ) k s f(\lambda)=|\lambda I-A|=(\lambda-\lambda_1)^{k_1}(\lambda-\lambda_2)^{k_2}\cdots(\lambda-\lambda_s)^{k_s} f(λ)=∣λI−A∣=(λ−λ1)k1(λ−λ2)k2⋯(λ−λs)ks
注: 检查特征值是否正确: ∑ λ i = t r a c e ( A ) \sum\lambda_i=trace(A) ∑λi=trace(A)
有 s s s 个特征值, 则 J A J_A JA 有 s s s 个 Jordan 子矩阵 J i ( λ i ) J_i(\lambda_i) Ji(λi), 每一个子矩阵:
- 特征值均为 λ i \lambda_i λi.
- 阶数(即占 J A J_A JA 的行数)为对应代数重数 k i k_i ki.
- 会包含几何重数 t i t_i ti 个 Jordan 块.
- 分别求 s s s 个特征值对应的特征向量 α \alpha α
( A − λ i I ) X = 0 (A-\lambda_iI)X=0 (A−λiI)X=0
有 t i t_i ti 个特征向量(即特征子空间维度 d i m V λ i dimV_{\lambda_i} dimVλi, 即特征值的几何重数), 则子矩阵 J i ( λ i ) J_i(\lambda_i) Ji(λi) 有 t i t_i ti 个 Jordan 块.
- 分别求每个 Jordan 子矩阵 J i ( λ i ) J_i(\lambda_i) Ji(λi) 的每个 Jordan 链条
判断特征值 λ i \lambda_i λi 的代数重数 k i k_i ki 与几何重数(即特征向量个数) t i t_i ti 的大小关系:
- 若 t i = k i \pmb{t_i=k_i} ti=kiti=kiti=ki, 则: J i ( λ i ) J_i(\lambda_i) Ji(λi) 有 t i t_i ti 个 1 阶 Jordan 块, 即为对角矩阵(对角线元素为 λ i \lambda_i λi).
- 若 t i < k i \pmb{t_i < k_i} ti<kiti<kiti<ki:
首先依次将每个特征向量作为 α \alpha α 代入尝试 ( A − λ i I ) y 2 = α (A-\lambda_iI)y_2=\alpha (A−λiI)y2=α, 判断方程是否相容(是否有解). 若有解则选定该特征向量求解 y 2 y_2 y2. 然后将解 y 2 y_2 y2 代入 ( A − λ i I ) y i = y i − 1 (A-\lambda_iI)y_i=y_{i-1} (A−λiI)yi=yi−1 继续求解 y 3 y_3 y3, 直至方程不相容(无解), 根据广义特征向量的个数从而确定对应的 Jordan 块的阶数.
若每个特征向量代入 ( A − λ i I ) y 2 = α (A-\lambda_iI)y_2=\alpha (A−λiI)y2=α 均无解, 则应构造 t i t_i ti 个特征向量的线性组合 α = c 1 α 1 + c 2 α 2 + . . . + c t i α t i , α ≠ 0 ⃗ \alpha=c_1\alpha_1+c_2\alpha_2+...+c_{t_i}\alpha_{t_i},\alpha\neq\vec{0} α=c1α1+c2α2+...+ctiαti,α=0 , 通过求解常量 c j c_j cj 得到对应的 α \alpha α. 并选择该构造的特征向量 α \alpha α 求解 y 2 , y 3 y_2,y_3 y2,y3 等, 直至方程 ( A − λ i I ) y i = y i − 1 (A-\lambda_iI)y_i=y_{i-1} (A−λiI)yi=yi−1 无解.
{ ( A − λ i I ) α = 0 ( A − λ i I ) y 2 = α ( A − λ i I ) y 3 = y 2 ⋯ ⋯ ( A − λ i I ) y k i − t i + 1 = y k i − t i \begin{cases} (A-\lambda_iI)\alpha&=0\\ (A-\lambda_iI)y_2&=\alpha\\ (A-\lambda_iI)y_3&=y_2\\ \cdots&\cdots\\ (A-\lambda_iI)y_{k_i-t_i+1}&=y_{k_i-t_i} \end{cases} ⎩⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎧(A−λiI)α(A−λiI)y2(A−λiI)y3⋯(A−λiI)yki−ti+1=0=α=y2⋯=yki−ti
- 根据 Jordan 链条写出可逆矩阵 P P P 和 Jordan 矩阵 J A J_A JA.
P P P 分为 s 个列块 P = ( P 1 , . . . , P s ) P=(P_1,...,P_s) P=(P1,...,Ps), 对应每个特征值相同的 Jordan 子矩阵 J i ( λ i ) J_i(\lambda_i) Ji(λi)
每个 P i P_i Pi 由选择的特征向量和广义特征向量构成.
- 若 t i = k i t_i=k_i ti=ki:
P i P_i Pi 的列由特征值 λ i \lambda_i λi 对应的 t i t_i ti 个特征向量构成.
J i ( λ i ) J_i(\lambda_i) Ji(λi) 是对角元素为 λ i \lambda_i λi 的 k i k_i ki 阶对角矩阵.
P i = ( α 1 , α 2 , . . . , α t i ) , J i ( λ i ) = [ λ i λ i ⋱ λ i ] t i × t i P_i=(\alpha_1,\alpha_2,...,\alpha_{t_i}), J_i(\lambda_i)=\begin{bmatrix} \lambda_i& & & \\ &\lambda_i& & \\ & &\ddots& \\ & & &\lambda_i \end{bmatrix}_{t_i\times t_i} Pi=(α1,α2,...,αti),Ji(λi)=⎣⎢⎢⎡λiλi⋱λi⎦⎥⎥⎤ti×ti
- 若 t i < k i t_iti<ki:
P i P_i Pi 的列由特征值 λ i \lambda_i λi 对应的 t i t_i ti 个 Jordan 块 J i j J_{ij} Jij 的特征向量和广义特征向量构成. 每个 Jordan 块 J i j J_{ij} Jij 包括 1 个特征向量(可能是求解的特征向量, 也可能是构造的特征向量 α = ∑ j = 1 t i c j α j \alpha=\sum_{j=1}^{t_i}c_j\alpha_j α=∑j=1ticjαj)和基于该特征向量求解的多个广义特征向量 y 2 , . . . y_2,... y2,... 构成.
J i J_i Ji 由 t i t_i ti 个对角元素是 λ i \lambda_i λi 的 Jordan 块(块的阶数由方程相容性计算得到的 Jordan 链条数确定)构成(要与 P P P 每一列的特征向量一一对应).
P i j = ( α , y 2 , . . . , y n j ) , ∑ j = 0 t n i j = k i P i = ( P i 1 , P i 2 , . . . , P i j , . . . , P i t i ) P = ( P 1 , . . . , P i , . . . , P s ) J i j ( λ i ) = [ λ i 1 λ i ⋱ ⋱ 1 λ i ] n i × n i J i ( λ i ) = d i a g ( J i 1 , . . . , J i j , . . . , J i t i ) J A = d i a g ( J 1 ( λ 1 ) , . . . , J i ( λ i ) , . . . , J s ( λ s ) ) \begin{aligned} &P_{ij}=(\alpha,y_2,...,y_{n_j}),\sum_{j=0}^tn_{ij}=k_i\\ &P_i=(P_{i1},P_{i2},...,P_{ij},...,P_{it_i})\\ &P=(P_1,...,P_i,...,P_s) \\ \\ &J_{ij}(\lambda_i)=\begin{bmatrix} \lambda_i&1& & \\ &\lambda_i&\ddots& \\ & &\ddots&1\\ & & &\lambda_i \end{bmatrix}_{n_i\times n_i}\\ &J_i(\lambda_i)=diag(J_{i1},...,J_{ij},...,J_{it_i})\\ &J_A=diag(J_1(\lambda_1),...,J_i(\lambda_i),...,J_s(\lambda_s)) \end{aligned}\\ Pij=(α,y2,...,ynj),j=0∑tnij=kiPi=(Pi1,Pi2,...,Pij,...,Piti)P=(P1,...,Pi,...,Ps)Jij(λi)=⎣⎢⎢⎡λi1λi⋱⋱1λi⎦⎥⎥⎤ni×niJi(λi)=diag(Ji1,...,Jij,...,Jiti)JA=diag(J1(λ1),...,Ji(λi),...,Js(λs))
2.3 最小多项式
矩阵多项式
Def’ 2.4: 设 A ∈ F n × n , a i ∈ F , g ( λ ) = a m λ m + ⋯ + a 1 λ + a 0 A\in F^{n\times n}, a_i\in F, g(\lambda)=a_m\lambda^m+\cdots+a_1\lambda+a_0 A∈Fn×n,ai∈F,g(λ)=amλm+⋯+a1λ+a0 是一个多项式, 则矩阵 g ( A ) = a m A m + ⋯ + a 1 A + a 0 g(A)=a_mA^m+\cdots+a_1A+a_0 g(A)=amAm+⋯+a1A+a0 为方阵 A 的矩阵多项式.
Th 2.6 性质:
- A X = λ 0 X AX=\lambda_0X AX=λ0X ⇒ g ( A ) X = g ( λ 0 ) X g(A)X=g(\lambda_0)X g(A)X=g(λ0)X (特征值不同但特征向量相同)
- P − 1 A P = B P^{-1}AP=B P−1AP=B ⇒ P − 1 g ( A ) P = g ( B ) P^{-1}g(A)P=g(B) P−1g(A)P=g(B)
- A = [ A 1 A 2 ⋱ A k ] A=\begin{bmatrix}A_1& & & \\ &A_2& & \\ & &\ddots& \\ & & &A_k\end{bmatrix} A=⎣⎢⎢⎡A1A2⋱Ak⎦⎥⎥⎤ 为准对角矩阵 ⇒ g ( A ) = [ g ( A 1 ) g ( A 2 ) ⋱ g ( A k ) ] g(A)=\begin{bmatrix}g(A_1)& & & \\ &g(A_2)& & \\ & &\ddots& \\ & & &g(A_k)\end{bmatrix} g(A)=⎣⎢⎢⎡g(A1)g(A2)⋱g(Ak)⎦⎥⎥⎤ 也为准对角矩阵.
矩阵多项式的求法
目标: 求矩阵 A A A 的矩阵多项式 g ( A ) g(A) g(A)
步骤:
- 计算矩阵 A A A 的 J A J_A JA 和 P P P 以及 P − 1 P^{-1} P−1
g ( A ) = P ⋅ g ( J A ) ⋅ P − 1 = P ⋅ d i a g ( g ( J 1 ) , g ( J 2 ) , . . . , g ( J k ) ) ⋅ P − 1 g(A)=P\cdot g(J_A)\cdot P^{-1}= P\cdot diag(g(J_1),g(J_2),...,g(J_k))\cdot P^{-1} g(A)=P⋅g(JA)⋅P−1=P⋅diag(g(J1),g(J2),...,g(Jk))⋅P−1
其中 J i J_i Ji 为每个 Jordan 块
- 对于每个 Jordan 块 J i ( λ ) J_i(\lambda) Ji(λ)
g ( J i ) = [ g ( λ ) g ′ ( λ ) g ′ ′ ( λ ) 2 ! ⋯ g r − 1 ( λ ) ( r − 1 ) ! g ( λ ) g ′ ( λ ) ⋱ ⋮ g ( λ ) ⋱ g ′ ′ ( λ ) 2 ! ⋱ g ′ ( λ ) g ( λ ) ] g(J_i)=\begin{bmatrix} g(\lambda)&g'(\lambda)&\frac{g''(\lambda)}{2!}&\cdots&\frac{g^{r-1}(\lambda)}{(r-1)!}\\ &g(\lambda)&g'(\lambda)&\ddots&\vdots\\ & &g(\lambda)&\ddots&\frac{g''(\lambda)}{2!}\\ & & &\ddots&g'(\lambda)\\ & & & &g(\lambda) \end{bmatrix} g(Ji)=⎣⎢⎢⎢⎢⎢⎢⎡g(λ)g′(λ)g(λ)2!g′′(λ)g′(λ)g(λ)⋯⋱⋱⋱(r−1)!gr−1(λ)⋮2!g′′(λ)g′(λ)g(λ)⎦⎥⎥⎥⎥⎥⎥⎤
(即每上一层斜对角, 对 g ( λ ) g(\lambda) g(λ) 做一次求导并除以导数次数的阶乘)
最终由 g ( J i ) g(J_i) g(Ji) 组成矩阵 g ( J A ) g(J_A) g(JA)
- 由 g ( A ) = P ⋅ g ( J A ) ⋅ P − 1 g(A)=P\cdot g(J_A)\cdot P^{-1} g(A)=P⋅g(JA)⋅P−1 计算得到 g ( A ) g(A) g(A)
化零多项式
让矩阵多项式为零矩阵 g ( A ) = 0 g(A)=\pmb{0} g(A)=000
若 A A A 有化零多项式, 则有无穷多化零多项式.
Def’ 2.7(Cayley 定理) 特征多项式是化零多项式. f ( λ ) = ∣ λ I − A ∣ f(\lambda)=|\lambda I-A| f(λ)=∣λI−A∣, f ( A ) = 0 f(A)=\pmb{0} f(A)=000
应用:
- 使 A k ( ∀ k ≥ n ) A^k(\forall k\geq n) Ak(∀k≥n) 降阶至不超过 n − 1 n-1 n−1 次的多项式(除法余项) r ( λ ) r(\lambda) r(λ): g ( λ ) = q ( λ ) f ( λ ) + r ( λ ) g(\lambda)=q(\lambda)f(\lambda)+r(\lambda) g(λ)=q(λ)f(λ)+r(λ)
- 由 f ( A ) = 0 f(A)=0 f(A)=0, A − 1 A^{-1} A−1 可以用多项式表示: A − 1 = − 1 a 0 ( A n − 1 + a n − 1 A n − 2 + ⋯ + a 2 A + a 1 ) , a 0 ≠ 0 A^{-1}=-\frac{1}{a_0}(A^{n-1}+a_{n-1}A^{n-2}+\cdots+a_2A+a_1),a_0\neq 0 A−1=−a01(An−1+an−1An−2+⋯+a2A+a1),a0=0
- 对线性变换 T T T, f ( T ) = 0 f(T)=0 f(T)=0(此时 f f f 为特征多项式),即 f ( T ) f(T) f(T) 为零变换
最小多项式
Def’ 2.5 最小多项式 m A ( λ ) m_A(\lambda) mA(λ): V n ( F ) V_n(F) Vn(F) 上线性变换 T T T 的变换矩阵为 A A A, m A ( λ ) m_A(\lambda) mA(λ) 满足:
- m A ( A ) = 0 m_A(A) = 0 mA(A)=0
- m A ( λ ) m_A(\lambda) mA(λ) 在化零多项式中次数最低
- m A ( λ ) m_A(\lambda) mA(λ) 最高次项系数是 1
m A ( λ ) m_A(\lambda) mA(λ) 整除任何化零多项式
最小多项式的结构
设 f ( λ ) = ( λ − λ 1 ) k 1 ( λ − λ 2 ) k 2 ⋯ ( λ − λ s ) k s f(\lambda)=(\lambda-\lambda_1)^{k_1}(\lambda-\lambda_2)^{k_2}\cdots(\lambda-\lambda_s)^{k_s} f(λ)=(λ−λ1)k1(λ−λ2)k2⋯(λ−λs)ks, 则特征多项式:
m A ( λ ) = ( λ − λ 1 ) n 1 ‾ ( λ − λ 2 ) n 2 ‾ ⋯ ( λ − λ s ) n s ‾ m_A(\lambda)=(\lambda-\lambda_1)^{\overline{n_1}}(\lambda-\lambda_2)^{\overline{n_2}}\cdots(\lambda-\lambda_s)^{\overline{n_s}} mA(λ)=(λ−λ1)n1(λ−λ2)n2⋯(λ−λs)ns
其中, n i ‾ \overline{n_i} ni 是 λ i \lambda_i λi 对应 Jordan 块的指数(最高阶数)
( λ i \lambda_i λi 对应 Jordan 块有多个, n i ‾ \overline{n_i} ni 是其中最大的那个的阶数)
Th 2.10: 线性变换 T T T 可以对角化 ⟺ T T T 的最小多项式是一次因子的乘积 m A ( λ ) = ( λ − λ 1 ) ( λ − λ 2 ) ⋯ ( λ − λ s ) m_A(\lambda)=(\lambda-\lambda_1)(\lambda-\lambda_2)\cdots(\lambda-\lambda_s) mA(λ)=(λ−λ1)(λ−λ2)⋯(λ−λs)
矩阵相似问题的一些结果
相似矩阵
相似矩阵具有相同的:
- 特征值和特征多项式
- 化零多项式和最小多项式
- 行列式 d e t ( A ) det(A) det(A)、迹 t r a c e ( A ) = ∑ i n a i i = ∑ λ i trace(A)=\sum_i^n a_{ii}=\sum\lambda_i trace(A)=∑inaii=∑λi 和秩 r a n k ( A ) rank(A) rank(A)
幂等矩阵 幂零矩阵 乘法矩阵
- 幂等矩阵: A 2 = A A^2=A A2=A ⟺ A ∼ [ I r 0 ] A\sim\begin{bmatrix}I_r& \\ &0\end{bmatrix} A∼[Ir0]
- 幂零矩阵 A k = 0 A^k=0 Ak=0 ⟺ 特征值均为 0
- 乘方矩阵: A 2 = I A^2=I A2=I ⟺ A ∼ [ I − I ] A\sim\begin{bmatrix}I& \\ &-I\end{bmatrix} A∼[I−I]
A , A T , A H , A H A A,\ A^T,\ A^H,\ A^HA A, AT, AH, AHA
- A ∼ A T A\sim A^T A∼AT
- A ∼ A H A\sim A^H A∼AH ⟺ 矩阵的非实数特征值对应的 Jordan 块以共轭对出现 (eg: [ i − i ] \begin{bmatrix}i& \\ &-i\end{bmatrix} [i−i])
- A H A ∼ A A H A^HA\sim AA^H AHA∼AAH: 特征多项式、值相同, 且可对角化
A B , B A AB,BA AB,BA
- 特征值, 特征多项式相同(但不一定相似)
- 若 A A A 或 B B B 可逆, 则 A B ∼ B A AB\sim BA AB∼BA
- 行列式 d e t ( A ) det(A) det(A)、迹 t r a c e ( A ) = ∑ i n a i i = ∑ λ i trace(A)=\sum_i^n a_{ii}=\sum\lambda_i trace(A)=∑inaii=∑λi 相同
秩不一定相同