矩阵论-矩阵的标准形理论
文章目录
- 矩阵论-矩阵的标准形理论
-
- 一、线性变换的特征值和特征向量
-
- 1、特征值与特征向量的基本概念
-
- 1.1 定义
- 1.2 性质
- 1.3 求取特征值和特征向量
- 2、特征子空间
-
- 二、矩阵的酉相似对角化
-
- 1、线性变换完全解耦及矩阵相似对角化
-
- 1.1 定义
- 1.2 性质
- 1.3 Schur (舒尔)分解定理
- 2、正规矩阵的酉相似对角化
-
- 3、 H e r m i t e Hermite Hermite (埃尔米特)阵与正定矩阵
-
- 三、特征矩阵的 S m i t h Smith Smith标准形
-
- 1、矩阵的秩、逆与初等变换
-
- 2、特征矩阵$\lambda E -A $的行列式因子
-
- 3、 S m i t h Smith Smith标准形
-
- 四、矩阵的 J o r d a n Jordan Jordan标准形
-
- 1、不变因子和初等因子
-
- 2、矩阵相似的特征
- 3、 J o r d a n Jordan Jordan 块与标准形
-
- 3.1 定义
- 3.2 性质
- 3.3 约当标准型变换矩阵(另外矩阵函数章详见)
- 五、 C a y l e y − H a m i l t o n Cayley-Hamilton Cayley−Hamilton 定理与矩阵的最小多项式
-
- 1、矩阵多项式
- 2、 C a y l e y − H a m i l t o n Cayley-Hamilton Cayley−Hamilton 定理
- 3、矩阵的零化多项式与最小多项式
一、线性变换的特征值和特征向量
1、特征值与特征向量的基本概念
1.1 定义
设 T T T 是内积空间 V V V 上的线性变换,若存在数 λ \lambda λ 和 V V V 中非零向量 α \alpha α ,使得 T α = λ α T \alpha=\lambda \alpha Tα=λα ,则 λ \lambda λ 称为 T T T 的特征值, α \alpha α 称为 T T T 属于 λ \lambda λ 的特征向量。
1.2 性质
- 线性变换的特征值与基的形式无关,但特征向量与基的形式直接相关。
- 线性变换对应矩阵所有特征值之积等于其行列式的值,所有特征值之和等于其对角线元素之和。
- 线性变换在不同特征值下的特征向量线性无关。
1.3 求取特征值和特征向量
- 特征多项式 ∣ λ E − A ∣ |\lambda E -A| ∣λE−A∣:令特征方程 ∣ λ E − A ∣ = 0 |\lambda E -A|=0 ∣λE−A∣=0 ,解出 λ i \lambda_i λi。
- 反将 λ i \lambda_i λi 代回, ( λ i E − A ) x → = 0 (\lambda_i E-A)\overrightarrow{x}=0 (λiE−A)x =0,解得 x → \overrightarrow{x} x 的基础解系,即为特征向量。
2、特征子空间
2.1 定义
设 T T T 是线性空间 V V V 上的线性变换, λ \lambda λ 为 T T T 的特征值,则集合 V λ = { α ∣ T α = λ α , α ∈ V } V_{\lambda}=\{\alpha | T\alpha = \lambda \alpha , \alpha \in V\} Vλ={α∣Tα=λα,α∈V} ,称为 T T T 的特征子空间( 即 λ \lambda λ 的特征向量的集合)。
- 若 T T T 在 V V V 的一组基下对应的矩阵为 A A A ,则 V λ = { α ∣ T α = λ α , α ∈ V } V_{\lambda}=\{\alpha | T\alpha = \lambda \alpha , \alpha \in V \} Vλ={α∣Tα=λα,α∈V} 同构于 S λ = { x ∣ T x = λ x , x ∈ P n } S_{\lambda}=\{x | Tx = \lambda x , x \in P^{n} \} Sλ={x∣Tx=λx,x∈Pn} ,从而 d i m V λ = d i m S λ = n − R ( λ E − A ) dimV_{\lambda}=dimS_{\lambda}=n-R(\lambda E -A ) dimVλ=dimSλ=n−R(λE−A)。
2.2 几何重数和代数重数
特征子空间的维数 d i m V λ dimV_{\lambda} dimVλ 称为 λ \lambda λ 的几何重数,特征方程 ∣ λ E = A ∣ |\lambda E = A| ∣λE=A∣ 中 λ \lambda λ 的重数称为 $\lambda $ 的代数重数。
- A 的特征子空间为线性子空间,所有几何重数之和不超过 n n n ,所有代数重数之和为 n n n 。
- 特征值的几何重数不大于代数重数。
二、矩阵的酉相似对角化
1、线性变换完全解耦及矩阵相似对角化
1.1 定义
-
完全解耦 : 设 V V V 上的线性变换 T T T 存在一组特征向量 α 1 , α 2 , . . . , α n \alpha_{1}, \alpha_2 ,..., \alpha_{n} α1,α2,...,αn 构成 V V V 的一组基, λ 1 , λ 2 , . . . , λ n \lambda_{1}, \lambda_2 ,..., \lambda_{n} λ1,λ2,...,λn 为对应的特征向量,则称 T T T 在基 α 1 , α 2 , . . . , α n \alpha_{1}, \alpha_2 ,..., \alpha_{n} α1,α2,...,αn 下完全解耦,此时
T α 1 = λ α 1 , T α 2 = λ α 2 , . . . , T α n = λ α n T \alpha_1=\lambda \alpha_1 ,T \alpha_2=\lambda \alpha_2 ,... ,T \alpha_n=\lambda \alpha_n Tα1=λα1,Tα2=λα2,...,Tαn=λαn
- 充要条件:线性变换 T T T 在基 α 1 , α 2 , . . . , α n \alpha_{1}, \alpha_2 ,..., \alpha_{n} α1,α2,...,αn下完全解耦的充分必要条件是 T T T 在基 α 1 , α 2 , . . . , α n \alpha_{1}, \alpha_2 ,..., \alpha_{n} α1,α2,...,αn下的表示矩阵为对角阵。
-
相似对角化 : 设 n n n 阶矩阵 A A A ,若存在 n n n 阶可逆矩阵 P P P ,使得 P − 1 A P = Λ P^{-1}AP= \Lambda P−1AP=Λ ,其中 Λ \Lambda Λ 是对角矩阵 ,则称 A A A 可相似对角化,记 A A A ~ Λ \Lambda Λ ,称 Λ \Lambda Λ 是 A A A 的相似标准形
- 充要条件 : n n n 阶矩阵 A A A 可相似对角化 ⇔ \Leftrightarrow ⇔ A A A 有 n n n 个线性无关的特征向量 ⇔ \Leftrightarrow ⇔ A A A 对应于每个 k k k 重特征值都有 k k k 个线性无关的特征向量
- 充分条件 : n n n 阶矩阵 A A A 有 n n n 个不同特征值 ⇒ \Rightarrow ⇒ A A A 可相似对角化 ; n n n 阶矩阵 A A A 为实对称矩阵 ⇒ \Rightarrow ⇒ A A A 可相似对角化
1.2 性质
- 线性变换 T T T 在基 α 1 , α 2 , . . . , α n \alpha_{1}, \alpha_2 ,..., \alpha_{n} α1,α2,...,αn 下的表示矩阵与对角阵相似(即可相似对角化)的充分必要条件是存在基 β 1 , β 2 , . . . , β n \beta_{1}, \beta_2 ,..., \beta_{n} β1,β2,...,βn ,使得 T T T 在其下完全解耦,即 T T T 在基 β 1 , β 2 , . . . , β n \beta_{1}, \beta_2 ,..., \beta_{n} β1,β2,...,βn 下的表示矩阵为对角阵。
上标H,表示埃米尔特,对原矩阵中每个元素求共轭再转置
- n n n 阶矩阵 A A A 相似对角阵的 充分必要条件 是 A A A 各特征值的几何重数与代数重数相等。
1.3 Schur (舒尔)分解定理
设 λ 1 , λ 2 , . . . , λ n \lambda_{1}, \lambda_2 ,..., \lambda_{n} λ1,λ2,...,λn 为 n n n 阶矩阵 A A A 的特征值,则存在酉矩阵 U U U ,使得 U H A U = T U^H AU=T UHAU=T ,其中 T T T 为上三角阵,并且对角线元素为 λ 1 , λ 2 , . . . , λ n \lambda_{1}, \lambda_2 ,..., \lambda_{n} λ1,λ2,...,λn。
2、正规矩阵的酉相似对角化
2.1 定义
-
正规矩阵: 设 A ∈ C n × n A\in C^{ \ n\times n} A∈C n×n, A H A = A A H A^H A=AA^H AHA=AAH,则称 A A A 为 正规矩阵。
- 正交矩阵、酉矩阵、对角矩阵、实对称矩阵均为正规矩阵。
-
酉相似 :对于矩阵 A , B ∈ C n × n A, B \in C_{n \times n} A,B∈Cn×n,若存在酉矩阵 P P P ,使得 P H A P = B P^H AP=B PHAP=B ,其中,则称 A A A 与 B B B 酉相似, P P P 称为酉相似变换阵。
- 对于复矩阵的对角化问题,一般相似对角化失去意义,常考察其酉相似对角化。
2.2 性质
n n n 阶矩阵 A A A 酉相似于对角阵的 充分必要条件 是 A A A 为正规矩阵。
- 实对称矩阵正交相似于对角阵。
- 正规矩阵与其相似的对角阵具有相同的几何特性。
3、 H e r m i t e Hermite Hermite (埃尔米特)阵与正定矩阵
3.1 概念
-
设 A ∈ C n × n A \in C^{ \ n\times n} A∈C n×n ,若 $ A^H=A $ ,则称 A A A 为 H e r m i t e Hermite Hermite 阵。
-
若 A H = − A A^H=-A AH=−A ,则称 A A A 为 反 H e r m i t e Hermite Hermite 阵。
-
对于 H e r m i t e Hermite Hermite 阵 A A A ,若对任何 x ∈ C n , x ≠ 0 , x H A x > 0 x \in C^{ \ n} , x \neq 0 ,x^H Ax > 0 x∈C n,x=0,xHAx>0,则称 A A A 为正定矩阵。
-
若将上述定义中 x H A x > 0 x^H Ax>0 xHAx>0 改为 x H A x ≥ 0 x^H Ax \geq 0 xHAx≥0,则称 A 为半正定矩阵。
-
对于 x ∈ C n x \in C^{\ n} x∈C n , x H A x x^H Ax xHAx 称为 H e r m i t e Hermite Hermite二次型 。
3.2 性质
-
H e r m i t e Hermite Hermite 阵为正规矩阵。
-
H e r m i t e Hermite Hermite 阵的特征值是实数,不同特征值的特征向量相互正交。
-
H e r m i t e Hermite Hermite 阵必可酉相似于对角阵。
-
若 A A A 为 H e r m i t e Hermite Hermite阵,则存在酉矩阵 U U U ,使得 x H A x x^H Ax xHAx 在正交变换 x = U y x=Uy x=Uy 下变为标准形,即不含交叉乘积项。
-
每个正定矩阵 A A A 均对应于一个 C n C^n Cn 中一个内积: < x , y > = x H A y , x , y ∈ C n =x^HAy , x,y \in C^{\ n} <x,y>=xHAy,x,y∈C n。
-
充要条件: H e r m i t e Hermite Hermite阵 A A A 为正定矩阵 ⇔ \Leftrightarrow ⇔ 特征值均为正数。 ⇔ \Leftrightarrow ⇔ 存在可逆矩阵 B B B ,使得 A = B H B A=B^HB A=BHB 。 ⇔ \Leftrightarrow ⇔ 各顺序主子式均大于0。
-
设 A ∈ C m × n A \in C^{\ m \times n} A∈C m×n,则存在酉矩阵 U m , V n U_m , V_{n} Um,Vn使得 U H A V = U^HAV= UHAV= [ D 0 0 0 ] \begin{bmatrix} D & 0 \\ 0 & 0 \end{bmatrix} [D000] ,其中 D = D= D= [ d 1 d 2 ⋱ d r ] \begin{bmatrix} d_{1} & & \\ & d_{2} & \\ & & \ddots & \\ & & & d_{r} \end{bmatrix} d1d2⋱dr , d 1 ≥ d 2 ≥ . . . ≥ d r > 0 d_{1} \geq d_{2} \geq ... \geq d_{r} > 0 d1≥d2≥...≥dr>0
-
矩阵 A A A 的奇异值为 A H A A^HA AHA或 A A H AA^H AAH 的正特征值的算术根, U U U 和 V V V 的列向量分别为 A H A A^HA AHA或 A A H AA^H AAH的单位正交特征向量组。
三、特征矩阵的 S m i t h Smith Smith标准形
1、矩阵的秩、逆与初等变换
1.1 概念
- λ \lambda λ 矩阵 :以 λ \lambda λ 的多项式为元素构成的矩阵称为 λ \lambda λ 矩阵 ,表示为 A ( λ ) A(\lambda) A(λ) 。
- 显然,每个为 $\lambda $ 矩阵均可表示为矩阵系数的多项式 A 0 λ k + A 1 λ k − 1 + . . . + A k − 1 λ + A k A_{0}\lambda^k+A_{1}\lambda^{k-1}+...+A_{k-1}\lambda+A_{k} A0λk+A1λk−1+...+Ak−1λ+Ak
- 纯数值矩阵 仍用 A , B , . . . A, B,... A,B,... 等符号表示。
- 秩: λ \lambda λ 矩阵 A ( λ ) A(\lambda) A(λ) 中不恒等于 0 0 0 子式的最高阶数称为 A ( λ ) A(\lambda) A(λ) 的秩,记为 R ( A ( λ ) ) R(A(\lambda)) R(A(λ)) 。
- 显然, n n n 阶矩阵 A A A 的特征矩阵 λ E − A \lambda E - A λE−A 是一个 λ \lambda λ 矩阵,其秩为 n n n 。
- 逆矩阵: 对于 n n n 阶 λ \lambda λ 矩阵 A ( λ ) A(\lambda) A(λ) ,若存在另一 n n n 阶矩阵 B ( λ ) B(\lambda) B(λ) ,使得 A ( λ ) B ( λ ) = B ( λ ) A ( λ ) = E A(\lambda)B(\lambda)=B(\lambda)A(\lambda)=E A(λ)B(λ)=B(λ)A(λ)=E 则称 A ( λ ) A(\lambda) A(λ) 可逆, B ( λ ) B(\lambda) B(λ) 为 A ( λ ) A(\lambda) A(λ) 的逆矩阵,并记为 A − 1 ( λ ) A^{-1}(\lambda) A−1(λ)。
- 初等变换 : 如下变换称为对 λ \lambda λ 矩阵的初等变换:
- 互换两行(列);
- 某行(列)乘以一个非0常数;
- 将某行(列)的 λ \lambda λ多项式倍加到另一行(列)上。
- 等价:若 A ( λ ) A(\lambda) A(λ) 经一系列初等变换化成 B ( λ ) B(\lambda) B(λ) ,则称 B ( λ ) B(\lambda) B(λ) 与 A ( λ ) A(\lambda) A(λ) 等价。
1.2 性质
2、特征矩阵$\lambda E -A $的行列式因子
2.1 概念
- 特征矩阵 λ E − A \lambda E-A λE−A 中所有 k k k 阶非零子式的最大首一公因式 D k ( λ ) ( k = 1 , 2 , . . . , n ) D_{k}(\lambda)(k=1,2,...,n) Dk(λ)(k=1,2,...,n)称为特征矩阵 λ E − A \lambda E-A λE−A 的 k k k 阶行列式因子,也称为 A A A 的 k k k 阶行列式因子。
- 显然,特征矩阵的行列式因子是唯一的,并且 D n ( λ ) = ∣ λ E − A ∣ Dn(\lambda)=|\lambda E-A| Dn(λ)=∣λE−A∣ 。
- 行列式因子求法:(以三阶矩阵为例)
- D 3 ( λ ) = ∣ λ E − A ∣ D_3(\lambda)=|\lambda E-A| D3(λ)=∣λE−A∣
- 求解 D 2 ( λ ) D_2(\lambda) D2(λ):首先,特征矩阵的行列式子式消去某行和某列,剩下元素组成行列式,如三阶矩阵对应的行列式子式有9个。那么这九个行列式子式均是 λ \lambda λ的多项式,这九个多项式(前提是这些行列式非零)因式分解,求出这九个多项式的最大公因式,即为 D 2 ( λ ) D_2(\lambda) D2(λ)。
- 求解 D 1 ( λ ) D_1(\lambda) D1(λ):特征矩阵的九个元素的最大公因式即为所求。
2.2 性质
- 设 D 0 ( λ ) = 1 D_0(\lambda)=1 D0(λ)=1,则 D k − 1 ( λ ) ∣ D k ( λ ) D_{k-1}(\lambda)|D_{k}(\lambda) Dk−1(λ)∣Dk(λ) 。
(竖线表示可以整除,后者可以被前者整除)
3、 S m i t h Smith Smith标准形
3.1 概念
-
n n n 阶矩阵 A A A 的特征矩阵 λ E − A \lambda E - A λE−A 等价于对角阵
D = [ d 1 ( λ ) d 2 ( λ ) ⋱ d n ( λ ) ] D=\begin{bmatrix} d_{1}(\lambda) & & \\ & d_{2}(\lambda) & \\ & & \ddots & \\ & & & d_{n}(\lambda) \end{bmatrix} D= d1(λ)d2(λ)⋱dn(λ) 其中, d i ( λ ) ( i = 1 , 2 , . . . , n ) d_{i}(\lambda)(i=1,2,...,n) di(λ)(i=1,2,...,n) (不变因子 )为首一多项式,并且 d i ( λ ) ∣ d i + 1 ( λ ) ( i = 1 , 2 , . . . n ) d_{i}(\lambda)|d_{i+1}(\lambda)(i=1,2,...n) di(λ)∣di+1(λ)(i=1,2,...n) ,对角阵 D D D 称为特征矩阵 λ E − A \lambda E -A λE−A 的 S m i t h Smith Smith 标准形。
- 对于一般 λ \lambda λ矩阵 A ( λ ) A(\lambda) A(λ) , S m i t h Smith Smith标准形为
D = [ d 1 ( λ ) 0 d 2 ( λ ) ⋱ d n ( λ ) 0 0 ] D=\begin{bmatrix} d_{1}(\lambda) & & & &0\\ & d_{2}(\lambda) & \\ & & \ddots & \\ & & & d_{n}(\lambda)\\ 0& & & & 0 \end{bmatrix} D= d1(λ)0d2(λ)⋱dn(λ)00 其中, d i ( λ ) ( i = 1 , 2 , . . . n ) d_{i}(\lambda)(i=1,2,...n) di(λ)(i=1,2,...n) 为首一多项式 ,并且 d i ( λ ) ∣ d i + 1 ( λ ) ( i = 1 , 2 , . . . n ) d_{i}(\lambda)|d_{i+1}(\lambda)(i=1,2,...n) di(λ)∣di+1(λ)(i=1,2,...n) , r = R ( A ( λ ) r=R(A(\lambda) r=R(A(λ)
3.2 性质
- 特征矩阵等价的充分必要条件是不变因子或行列式因子相同。
- 特征矩阵的 S m i t h Smith Smith 标准形是唯一的
四、矩阵的 J o r d a n Jordan Jordan标准形
1、不变因子和初等因子
1.1 概念
-
不变因子: 设 D k ( λ ) ( k = 1 , 2 , , n ) D_{k}(\lambda)(k=1,2, ,n) Dk(λ)(k=1,2,,n) 是矩阵 A A A 的 k k k 阶行列式因子,则多项式 d k ( λ ) = D k ( λ ) / D k − 1 ( λ ) , k = 1 , 2 , . . . , n d_{k}(\lambda)=D_{k}(\lambda)/D_{k-1}(\lambda),k=1,2,...,n dk(λ)=Dk(λ)/Dk−1(λ),k=1,2,...,n称为特征矩阵 λ E − A \lambda E -A λE−A或 A A A 的不变因子。
- 另一种定义说法 : 称 A ( λ ) A(\lambda) A(λ)的 S m i t h Smith Smith 标准形中对角元素 d i ( λ ) ( i = 1 , 2 , . . . , r ) d_i(\lambda) (i=1,2,...,r) di(λ)(i=1,2,...,r) 为 A ( λ ) A(\lambda) A(λ) 的第 i i i个不变因子。
- 显然, D k ( λ ) = d 1 ( λ ) . . . d k ( λ ) , k = 1 , 2 , . . . n D_{k}(\lambda)=d_{1}(\lambda)...d_{k}(\lambda),k=1,2,...n Dk(λ)=d1(λ)...dk(λ),k=1,2,...n
-
初等因子: 特征矩阵 λ E − A \lambda E - A λE−A 的所有不变因子中一次因子的方幂(包括各个不变因子中重复的因子),称为 A A A 的初等因子。
- 另一种定义说法: λ \lambda λ矩阵的所有次数大于1的不变因子都分解为一次因子的方幂(重复的也重复计算)为此矩阵的初等因子。
- 次数大于一,因式分解,所有一次项或其方幂(可重复),为初等因子
1.2 性质
- 特征矩阵的不变因子在初等变换下保持不变
- 特征矩阵的初等因子由不变因子唯一确定,反之亦然。
- 每个初等因子是且仅是一个不变因子的因子,无初等因子的不变因子均为 1。
- 对角 λ \lambda λ 矩阵中对角线上元素的一次因子的方幂(包括对角线上元素中重复的因子),为其初等因子。
- 分块对角 λ \lambda λ 矩阵上个对角块的初等因子合在一起即为整个 λ \lambda λ 矩阵的初等因子。
2、矩阵相似的特征
矩阵相似的充要条件 : n n n 阶矩阵 A A A、 B B B相似 ⇔ \Leftrightarrow ⇔ 存在可逆矩阵 P P P、 Q Q Q,使得 λ E − A = P ( λ E − B ) Q \lambda E-A=P(\lambda E -B)Q λE−A=P(λE−B)Q ⇔ \Leftrightarrow ⇔ 它们的特征矩阵等价 ⇔ \Leftrightarrow ⇔ 不变因子或初等因子相同
3、 J o r d a n Jordan Jordan 块与标准形
3.1 定义
-
J o r d a n Jordan Jordan 块: 初等因子为 ( λ − λ k ) m k (\lambda - \lambda_{k})^{m_k} (λ−λk)mk 的 m k m_k mk 阶矩阵 J k = [ λ k 1 λ k ⋱ ⋱ 1 λ k ] J_k = \begin{bmatrix} \lambda_{k} & 1 & & \\ & \lambda_{k} & \ddots & \\ & & \ddots & 1 \\ & & & \lambda_{k}\\ \end{bmatrix} Jk= λk1λk⋱⋱1λk
-
J o r d a n Jordan Jordan 标准形: 初等因子为 ( λ − λ 1 ) m 1 (\lambda-\lambda_1)^{m_1} (λ−λ1)m1, ( λ − λ 2 ) m 2 (\lambda-\lambda_2)^{m_2} (λ−λ2)m2,…, ( λ − λ s ) m s (\lambda-\lambda_s)^{m_s} (λ−λs)ms 的矩阵 J = [ J 1 J 2 ⋱ J S ] J=\begin{bmatrix} J_{1} & & & \\ & J_{2} & & \\ & & \ddots & \\ & & & J_{S}\\ \end{bmatrix} J= J1J2⋱JS (其中 j k j_k jk 为上述 J o r d a n Jordan Jordan 块)
3.2 性质
- 每个 n n n 阶矩阵均可相似化为 J o r d a n Jordan Jordan 标准形。
- n n n 阶矩阵可相似对角化的充分必要条件是其初等因子均为一次的。
3.3 约当标准型变换矩阵(另外矩阵函数章详见)
约当标准型变换矩阵 P P P 求法: ( P − 1 A P = J ) (P^{-1} AP =J) (P−1AP=J)
- A A A 是 n n n 维矩阵, J J J 有 t t t个约当块, P P P的列向量 p i p_i pi
- 对于一个对角元素 λ 0 : A P 1 = λ 0 P 1 , A P 2 = P 1 + λ 0 P 2 , . . . , A P m = P m − 1 + λ 0 P m \lambda_0 : AP_1 = \lambda_0 P_1 , AP_2= P_1 + \lambda_0 P_2 , . . . , AP_m= P_{m-1} + \lambda_0 P_m λ0:AP1=λ0P1,AP2=P1+λ0P2,...,APm=Pm−1+λ0Pm
- A ( p 1 , p 2 , . . . , p n ) = ( p 1 , p 2 , . . . , p n ) [ J 1 ⋱ J t ] A(p_1,p_2,...,p_n) = (p_1,p_2,...,p_n) \begin{bmatrix}J_1& &\\& \ddots & \\& & J_t \end{bmatrix} A(p1,p2,...,pn)=(p1,p2,...,pn) J1⋱Jt
五、 C a y l e y − H a m i l t o n Cayley-Hamilton Cayley−Hamilton 定理与矩阵的最小多项式
1、矩阵多项式
f ( A ) = a 0 A m + a 1 A m − 1 + ⋅ ⋅ ⋅ + a m − 1 A + a m E f(A)=a_0A^m+a_1A^{m-1}+···+a_{m-1}A+a_mE f(A)=a0Am+a1Am−1+⋅⋅⋅+am−1A+amE , 为$ n$ 阶矩阵 A A A 的多项式
- n n n 阶矩阵的多项式仍为 n n n 阶矩阵
- 相似矩阵的多项式仍然相似,且具有相同的相似变换阵。
- 对角阵的多项式仍为对角阵,分块对角阵的多项式仍为分块对角阵。
- 对于 n n n 阶矩阵 A A A 和多项式 f ( λ ) f(\lambda) f(λ) , f ( A ) f (A) f(A) 必相似于 [ f ( J 1 ) f ( J 2 ) ⋱ f ( J S ) ] \begin{bmatrix} f(J_{1}) & & & \\ & f(J_{2}) & & \\ & & \ddots & \\ & & & f(J_{S})\\ \end{bmatrix} f(J1)f(J2)⋱f(JS)
其中 J k J_k Jk , k = 1 , 2 , . . , s k=1, 2,.., s k=1,2,..,s 为 A A A 的各个 J o r d a n Jordan Jordan块。
2、 C a y l e y − H a m i l t o n Cayley-Hamilton Cayley−Hamilton 定理
-
设 N = [ 0 1 0 ⋱ ⋱ 1 0 ] k N=\begin{bmatrix} 0 & 1 & & \\ & 0 & \ddots & \\ & & \ddots & 1 \\ & & & 0\\ \end{bmatrix}_k N= 010⋱⋱10 k , N k = 0 N^k = 0 Nk=0 ,并称 N N N 为幂零矩阵
-
C a y l e y − H a m i l t o n Cayley-Hamilton Cayley−Hamilton 定理 :对于 n n n 阶矩阵 A A A ,设 f ( λ ) = ∣ λ E − A ∣ f (\lambda) =|\lambda E - A| f(λ)=∣λE−A∣,则 f ( A ) = 0 f (A) = 0 f(A)=0 。
3、矩阵的零化多项式与最小多项式
对于多项式 g ( λ ) g(\lambda) g(λ) 和 n n n 阶矩阵 A A A ,若 g ( A ) = 0 g(A) = 0 g(A)=0 ,则称 g ( λ ) g(\lambda) g(λ) 为 A A A 的零化多项式。 A A A的次数最低的首一零化多项式称为 A A A 的最小多项式。
- A A A 的特征多项式为其零化多项式,但不一定是最小多项式。
- 多项式 g ( λ ) g(\lambda) g(λ)为 n n n 阶矩阵 A A A 最小多项式的充分必要条件是 g ( λ ) g(\lambda) g(λ) 能整除 A A A 的任何零化多项式。
- 矩阵的最高阶不变因子就是其最小多项式,因而最小多项式是初等因子中各最高幂的乘积。
- 相似矩阵具有相同的最小多项式。
- 矩阵最小多项式的根为特征多项式的根,反之亦然,但重数不一定相同。
- 矩阵可相似对角化的充分必要条件是最小多项式无重根。