《矩阵理论》笔记 2 — 矩阵的标准形理论

矩阵论-矩阵的标准形理论

文章目录

  • 矩阵论-矩阵的标准形理论
    • 一、线性变换的特征值和特征向量
      • 1、特征值与特征向量的基本概念
        • 1.1 定义
        • 1.2 性质
        • 1.3 求取特征值和特征向量
      • 2、特征子空间
        • 2.1 定义
        • 2.2 几何重数和代数重数
    • 二、矩阵的酉相似对角化
      • 1、线性变换完全解耦及矩阵相似对角化
        • 1.1 定义
        • 1.2 性质
        • 1.3 Schur (舒尔)分解定理
      • 2、正规矩阵的酉相似对角化
        • 2.1 定义
        • 2.2 性质
      • 3、 H e r m i t e Hermite Hermite (埃尔米特)阵与正定矩阵
        • 3.1 概念
        • 3.2 性质
    • 三、特征矩阵的 S m i t h Smith Smith标准形
      • 1、矩阵的秩、逆与初等变换
        • 1.1 概念
        • 1.2 性质
      • 2、特征矩阵$\lambda E -A $的行列式因子
        • 2.1 概念
        • 2.2 性质
      • 3、 S m i t h Smith Smith标准形
        • 3.1 概念
        • 3.2 性质
    • 四、矩阵的 J o r d a n Jordan Jordan标准形
      • 1、不变因子和初等因子
        • 1.1 概念
        • 1.2 性质
      • 2、矩阵相似的特征
      • 3、 J o r d a n Jordan Jordan 块与标准形
        • 3.1 定义
        • 3.2 性质
        • 3.3 约当标准型变换矩阵(另外矩阵函数章详见)
    • 五、 C a y l e y − H a m i l t o n Cayley-Hamilton CayleyHamilton 定理与矩阵的最小多项式
      • 1、矩阵多项式
      • 2、 C a y l e y − H a m i l t o n Cayley-Hamilton CayleyHamilton 定理
      • 3、矩阵的零化多项式与最小多项式

一、线性变换的特征值和特征向量

1、特征值与特征向量的基本概念

1.1 定义

T T T 是内积空间 V V V 上的线性变换,若存在数 λ \lambda λ V V V 中非零向量 α \alpha α ,使得 T α = λ α T \alpha=\lambda \alpha Tα=λα ,则 λ \lambda λ 称为 T T T特征值 α \alpha α 称为 T T T 属于 λ \lambda λ特征向量

1.2 性质

  • 线性变换的特征值与基的形式无关,但特征向量与基的形式直接相关。
  • 线性变换对应矩阵所有特征值之积等于其行列式的值,所有特征值之和等于其对角线元素之和。
  • 线性变换在不同特征值下的特征向量线性无关。

1.3 求取特征值和特征向量

  • 特征多项式 ∣ λ E − A ∣ |\lambda E -A| λEA:令特征方程 ∣ λ E − A ∣ = 0 |\lambda E -A|=0 λEA=0 ,解出 λ i \lambda_i λi
  • 反将 λ i \lambda_i λi 代回, ( λ i E − A ) x → = 0 (\lambda_i E-A)\overrightarrow{x}=0 (λiEA)x =0,解得 x → \overrightarrow{x} x 的基础解系,即为特征向量。

2、特征子空间

2.1 定义

T T T 是线性空间 V V V 上的线性变换, λ \lambda λ T T T 的特征值,则集合 V λ = { α ∣ T α = λ α , α ∈ V } V_{\lambda}=\{\alpha | T\alpha = \lambda \alpha , \alpha \in V\} Vλ={αTα=λα,αV} ,称为 T T T特征子空间( 即 λ \lambda λ 的特征向量的集合)。

  • T T T V V V 的一组基下对应的矩阵为 A A A ,则 V λ = { α ∣ T α = λ α , α ∈ V } V_{\lambda}=\{\alpha | T\alpha = \lambda \alpha , \alpha \in V \} Vλ={αTα=λα,αV} 同构于 S λ = { x ∣ T x = λ x , x ∈ P n } S_{\lambda}=\{x | Tx = \lambda x , x \in P^{n} \} Sλ={xTx=λx,xPn} ,从而 d i m V λ = d i m S λ = n − R ( λ E − A ) dimV_{\lambda}=dimS_{\lambda}=n-R(\lambda E -A ) dimVλ=dimSλ=nR(λEA)

2.2 几何重数和代数重数

特征子空间的维数 d i m V λ dimV_{\lambda} dimVλ 称为 λ \lambda λ几何重数,特征方程 ∣ λ E = A ∣ |\lambda E = A| λE=A λ \lambda λ 的重数称为 $\lambda $ 的代数重数

  • A 的特征子空间为线性子空间,所有几何重数之和不超过 n n n ,所有代数重数之和为 n n n
  • 特征值的几何重数不大于代数重数。

二、矩阵的酉相似对角化

1、线性变换完全解耦及矩阵相似对角化

1.1 定义

  • 完全解耦 : 设 V V V 上的线性变换 T T T 存在一组特征向量 α 1 , α 2 , . . . , α n \alpha_{1}, \alpha_2 ,..., \alpha_{n} α1,α2,...,αn 构成 V V V 的一组基, λ 1 , λ 2 , . . . , λ n \lambda_{1}, \lambda_2 ,..., \lambda_{n} λ1,λ2,...,λn 为对应的特征向量,则称 T T T 在基 α 1 , α 2 , . . . , α n \alpha_{1}, \alpha_2 ,..., \alpha_{n} α1,α2,...,αn完全解耦,此时
    T α 1 = λ α 1 , T α 2 = λ α 2 , . . . , T α n = λ α n T \alpha_1=\lambda \alpha_1 ,T \alpha_2=\lambda \alpha_2 ,... ,T \alpha_n=\lambda \alpha_n Tα1=λα1Tα2=λα2...Tαn=λαn

    • 充要条件:线性变换 T T T 在基 α 1 , α 2 , . . . , α n \alpha_{1}, \alpha_2 ,..., \alpha_{n} α1,α2,...,αn下完全解耦的充分必要条件 T T T 在基 α 1 , α 2 , . . . , α n \alpha_{1}, \alpha_2 ,..., \alpha_{n} α1,α2,...,αn下的表示矩阵为对角阵。
  • 相似对角化 : 设 n n n 阶矩阵 A A A ,若存在 n n n 阶可逆矩阵 P P P ,使得 P − 1 A P = Λ P^{-1}AP= \Lambda P1AP=Λ ,其中 Λ \Lambda Λ 是对角矩阵 ,则称 A A A 可相似对角化,记 A A A ~ Λ \Lambda Λ ,称 Λ \Lambda Λ A A A相似标准形

    • 充要条件 n n n 阶矩阵 A A A 可相似对角化 ⇔ \Leftrightarrow A A A n n n 个线性无关的特征向量 ⇔ \Leftrightarrow A A A 对应于每个 k k k 重特征值都有 k k k 个线性无关的特征向量
    • 充分条件 n n n 阶矩阵 A A A n n n 个不同特征值 ⇒ \Rightarrow A A A 可相似对角化 ; n n n 阶矩阵 A A A 为实对称矩阵 ⇒ \Rightarrow A A A 可相似对角化

1.2 性质

  • 线性变换 T T T 在基 α 1 , α 2 , . . . , α n \alpha_{1}, \alpha_2 ,..., \alpha_{n} α1,α2,...,αn 下的表示矩阵与对角阵相似(即可相似对角化)的充分必要条件是存在基 β 1 , β 2 , . . . , β n \beta_{1}, \beta_2 ,..., \beta_{n} β1,β2,...,βn ,使得 T T T 在其下完全解耦,即 T T T 在基 β 1 , β 2 , . . . , β n \beta_{1}, \beta_2 ,..., \beta_{n} β1,β2,...,βn 下的表示矩阵为对角阵。

上标H,表示埃米尔特,对原矩阵中每个元素求共轭再转置

  • n n n 阶矩阵 A A A 相似对角阵的 充分必要条件 A A A 各特征值的几何重数与代数重数相等。

1.3 Schur (舒尔)分解定理

λ 1 , λ 2 , . . . , λ n \lambda_{1}, \lambda_2 ,..., \lambda_{n} λ1,λ2,...,λn n n n 阶矩阵 A A A 的特征值,则存在酉矩阵 U U U ,使得 U H A U = T U^H AU=T UHAU=T ,其中 T T T 为上三角阵,并且对角线元素为 λ 1 , λ 2 , . . . , λ n \lambda_{1}, \lambda_2 ,..., \lambda_{n} λ1,λ2,...,λn

2、正规矩阵的酉相似对角化

2.1 定义

  • 正规矩阵: A ∈ C   n × n A\in C^{ \ n\times n} AC n×n A H A = A A H A^H A=AA^H AHA=AAH,则称 A A A正规矩阵

    • 正交矩阵、酉矩阵、对角矩阵、实对称矩阵均为正规矩阵。
  • 酉相似 :对于矩阵 A , B ∈ C n × n A, B \in C_{n \times n} A,BCn×n,若存在酉矩阵 P P P ,使得 P H A P = B P^H AP=B PHAP=B ,其中,则称 A A A B B B 酉相似 P P P 称为酉相似变换阵

    • 对于复矩阵的对角化问题,一般相似对角化失去意义,常考察其酉相似对角化。

2.2 性质

n n n 阶矩阵 A A A 酉相似于对角阵的 充分必要条件 A A A 为正规矩阵。

  • 实对称矩阵正交相似于对角阵。
  • 正规矩阵与其相似的对角阵具有相同的几何特性。

3、 H e r m i t e Hermite Hermite (埃尔米特)阵与正定矩阵

3.1 概念

  • A ∈ C   n × n A \in C^{ \ n\times n} AC n×n ,若 $ A^H=A $ ,则称 A A A H e r m i t e Hermite Hermite

  • A H = − A A^H=-A AH=A ,则称 A A A H e r m i t e Hermite Hermite

  • 对于 H e r m i t e Hermite Hermite A A A ,若对任何 x ∈ C   n , x ≠ 0 , x H A x > 0 x \in C^{ \ n} , x \neq 0 ,x^H Ax > 0 xC n,x=0xHAx>0,则称 A A A正定矩阵

  • 若将上述定义中 x H A x > 0 x^H Ax>0 xHAx>0 改为 x H A x ≥ 0 x^H Ax \geq 0 xHAx0,则称 A 为半正定矩阵

  • 对于 x ∈ C   n x \in C^{\ n} xC n x H A x x^H Ax xHAx 称为 H e r m i t e Hermite Hermite二次型

3.2 性质

  • H e r m i t e Hermite Hermite 阵为正规矩阵。

  • H e r m i t e Hermite Hermite 阵的特征值是实数,不同特征值的特征向量相互正交。

  • H e r m i t e Hermite Hermite 阵必可酉相似于对角阵。

  • A A A H e r m i t e Hermite Hermite阵,则存在酉矩阵 U U U ,使得 x H A x x^H Ax xHAx 在正交变换 x = U y x=Uy x=Uy 下变为标准形,即不含交叉乘积项。

  • 每个正定矩阵 A A A 均对应于一个 C n C^n Cn 中一个内积: < x , y > = x H A y , x , y ∈ C   n =x^HAy , x,y \in C^{\ n} <x,y>=xHAy,x,yC n

  • 充要条件: H e r m i t e Hermite Hermite A A A 为正定矩阵 ⇔ \Leftrightarrow 特征值均为正数。 ⇔ \Leftrightarrow 存在可逆矩阵 B B B ,使得 A = B H B A=B^HB A=BHB ⇔ \Leftrightarrow 各顺序主子式均大于0。

  • A ∈ C   m × n A \in C^{\ m \times n} AC m×n,则存在酉矩阵 U m , V n U_m , V_{n} Um,Vn使得 U H A V = U^HAV= UHAV= [ D 0 0 0 ] \begin{bmatrix} D & 0 \\ 0 & 0 \end{bmatrix} [D000] ,其中 D = D= D= [ d 1 d 2 ⋱ d r ] \begin{bmatrix} d_{1} & & \\ & d_{2} & \\ & & \ddots & \\ & & & d_{r} \end{bmatrix} d1d2dr d 1 ≥ d 2 ≥ . . . ≥ d r > 0 d_{1} \geq d_{2} \geq ... \geq d_{r} > 0 d1d2...dr>0

  • 矩阵 A A A 的奇异值为 A H A A^HA AHA A A H AA^H AAH 的正特征值的算术根, U U U V V V 的列向量分别为 A H A A^HA AHA A A H AA^H AAH的单位正交特征向量组。

三、特征矩阵的 S m i t h Smith Smith标准形

1、矩阵的秩、逆与初等变换

1.1 概念

  • λ \lambda λ 矩阵 :以 λ \lambda λ 的多项式为元素构成的矩阵称为 λ \lambda λ 矩阵 ,表示为 A ( λ ) A(\lambda) A(λ)
    • 显然,每个为 $\lambda $ 矩阵均可表示为矩阵系数的多项式 A 0 λ k + A 1 λ k − 1 + . . . + A k − 1 λ + A k A_{0}\lambda^k+A_{1}\lambda^{k-1}+...+A_{k-1}\lambda+A_{k} A0λk+A1λk1+...+Ak1λ+Ak
  • 纯数值矩阵 仍用 A , B , . . . A, B,... A,B,... 等符号表示。
  • 秩: λ \lambda λ 矩阵 A ( λ ) A(\lambda) A(λ) 中不恒等于 0 0 0 子式的最高阶数称为 A ( λ ) A(\lambda) A(λ),记为 R ( A ( λ ) ) R(A(\lambda)) R(A(λ))
    • 显然, n n n 阶矩阵 A A A 的特征矩阵 λ E − A \lambda E - A λEA 是一个 λ \lambda λ 矩阵,其秩为 n n n
  • 逆矩阵: 对于 n n n λ \lambda λ 矩阵 A ( λ ) A(\lambda) A(λ) ,若存在另一 n n n 阶矩阵 B ( λ ) B(\lambda) B(λ) ,使得 A ( λ ) B ( λ ) = B ( λ ) A ( λ ) = E A(\lambda)B(\lambda)=B(\lambda)A(\lambda)=E A(λ)B(λ)=B(λ)A(λ)=E 则称 A ( λ ) A(\lambda) A(λ) 可逆, B ( λ ) B(\lambda) B(λ) A ( λ ) A(\lambda) A(λ)逆矩阵,并记为 A − 1 ( λ ) A^{-1}(\lambda) A1(λ)
  • 初等变换 : 如下变换称为对 λ \lambda λ 矩阵的初等变换
    • 互换两行(列);
    • 某行(列)乘以一个非0常数;
    • 将某行(列)的 λ \lambda λ多项式倍加到另一行(列)上。
  • 等价:若 A ( λ ) A(\lambda) A(λ) 经一系列初等变换化成 B ( λ ) B(\lambda) B(λ) ,则称 B ( λ ) B(\lambda) B(λ) A ( λ ) A(\lambda) A(λ) 等价

1.2 性质

  • n n n λ \lambda λ 矩阵 A ( λ ) A(\lambda) A(λ) 可逆充分必要条件 为其行列式不等于0

  • 初等变换是可逆变换,对应的初等矩阵(对单位阵进行一次初等变换所得的矩阵)是可逆矩阵。

  • 矩阵的在初等变换下保持不变

2、特征矩阵$\lambda E -A $的行列式因子

2.1 概念

  • 特征矩阵 λ E − A \lambda E-A λEA 中所有 k k k非零子式的最大首一公因式 D k ( λ ) ( k = 1 , 2 , . . . , n ) D_{k}(\lambda)(k=1,2,...,n) Dk(λ)(k=1,2,...,n)称为特征矩阵 λ E − A \lambda E-A λEA k k k 阶行列式因子,也称为 A A A k k k 阶行列式因子。
    • 显然,特征矩阵的行列式因子是唯一的,并且 D n ( λ ) = ∣ λ E − A ∣ Dn(\lambda)=|\lambda E-A| Dn(λ)=λEA
    • 行列式因子求法:(以三阶矩阵为例)
      • D 3 ( λ ) = ∣ λ E − A ∣ D_3(\lambda)=|\lambda E-A| D3(λ)=λEA
      • 求解 D 2 ( λ ) D_2(\lambda) D2(λ):首先,特征矩阵的行列式子式消去某行和某列,剩下元素组成行列式,如三阶矩阵对应的行列式子式有9个。那么这九个行列式子式均是 λ \lambda λ的多项式,这九个多项式(前提是这些行列式非零)因式分解,求出这九个多项式的最大公因式,即为 D 2 ( λ ) D_2(\lambda) D2(λ)
      • 求解 D 1 ( λ ) D_1(\lambda) D1(λ):特征矩阵的九个元素的最大公因式即为所求。

2.2 性质

  • D 0 ( λ ) = 1 D_0(\lambda)=1 D0(λ)=1,则 D k − 1 ( λ ) ∣ D k ( λ ) D_{k-1}(\lambda)|D_{k}(\lambda) Dk1(λ)Dk(λ)
    (竖线表示可以整除,后者可以被前者整除)
  • 特征矩阵的行列式因子 在初等变换下保持不变。

3、 S m i t h Smith Smith标准形

3.1 概念

  • n n n 阶矩阵 A A A 的特征矩阵 λ E − A \lambda E - A λEA 等价于对角阵
    D = [ d 1 ( λ ) d 2 ( λ ) ⋱ d n ( λ ) ] D=\begin{bmatrix} d_{1}(\lambda) & & \\ & d_{2}(\lambda) & \\ & & \ddots & \\ & & & d_{n}(\lambda) \end{bmatrix} D= d1(λ)d2(λ)dn(λ) 其中, d i ( λ ) ( i = 1 , 2 , . . . , n ) d_{i}(\lambda)(i=1,2,...,n) di(λ)(i=1,2,...,n) (不变因子 )为首一多项式,并且 d i ( λ ) ∣ d i + 1 ( λ ) ( i = 1 , 2 , . . . n ) d_{i}(\lambda)|d_{i+1}(\lambda)(i=1,2,...n) di(λ)di+1(λ)(i=1,2,...n) ,对角阵 D D D 称为特征矩阵 λ E − A \lambda E -A λEA S m i t h Smith Smith 标准形

    • 对于一般 λ \lambda λ矩阵 A ( λ ) A(\lambda) A(λ) S m i t h Smith Smith标准形为
      D = [ d 1 ( λ ) 0 d 2 ( λ ) ⋱ d n ( λ ) 0 0 ] D=\begin{bmatrix} d_{1}(\lambda) & & & &0\\ & d_{2}(\lambda) & \\ & & \ddots & \\ & & & d_{n}(\lambda)\\ 0& & & & 0 \end{bmatrix} D= d1(λ)0d2(λ)dn(λ)00 其中, d i ( λ ) ( i = 1 , 2 , . . . n ) d_{i}(\lambda)(i=1,2,...n) di(λ)(i=1,2,...n) 为首一多项式 ,并且 d i ( λ ) ∣ d i + 1 ( λ ) ( i = 1 , 2 , . . . n ) d_{i}(\lambda)|d_{i+1}(\lambda)(i=1,2,...n) di(λ)di+1(λ)(i=1,2,...n) , r = R ( A ( λ ) r=R(A(\lambda) r=R(A(λ)

3.2 性质

  • 特征矩阵等价的充分必要条件是不变因子或行列式因子相同。
  • 特征矩阵的 S m i t h Smith Smith 标准形是唯一的

四、矩阵的 J o r d a n Jordan Jordan标准形

1、不变因子和初等因子

1.1 概念

  • 不变因子: D k ( λ ) ( k = 1 , 2 , , n ) D_{k}(\lambda)(k=1,2, ,n) Dk(λ)(k=1,2,,n) 是矩阵 A A A k k k 阶行列式因子,则多项式 d k ( λ ) = D k ( λ ) / D k − 1 ( λ ) , k = 1 , 2 , . . . , n d_{k}(\lambda)=D_{k}(\lambda)/D_{k-1}(\lambda),k=1,2,...,n dk(λ)=Dk(λ)/Dk1(λ),k=1,2,...,n称为特征矩阵 λ E − A \lambda E -A λEA A A A不变因子

    • 另一种定义说法 : 称 A ( λ ) A(\lambda) A(λ) S m i t h Smith Smith 标准形中对角元素 d i ( λ ) ( i = 1 , 2 , . . . , r ) d_i(\lambda) (i=1,2,...,r) di(λ)(i=1,2,...,r) A ( λ ) A(\lambda) A(λ) i i i个不变因子
    • 显然, D k ( λ ) = d 1 ( λ ) . . . d k ( λ ) , k = 1 , 2 , . . . n D_{k}(\lambda)=d_{1}(\lambda)...d_{k}(\lambda),k=1,2,...n Dk(λ)=d1(λ)...dk(λ),k=1,2,...n
  • 初等因子: 特征矩阵 λ E − A \lambda E - A λEA 的所有不变因子中一次因子的方幂(包括各个不变因子中重复的因子),称为 A A A初等因子

    • 另一种定义说法: λ \lambda λ矩阵的所有次数大于1的不变因子都分解为一次因子的方幂(重复的也重复计算)为此矩阵的初等因子。
      • 次数大于一,因式分解,所有一次项或其方幂(可重复),为初等因子

1.2 性质

  • 特征矩阵的不变因子在初等变换下保持不变
  • 特征矩阵的初等因子由不变因子唯一确定,反之亦然。
  • 每个初等因子是且仅是一个不变因子的因子,无初等因子的不变因子均为 1。
  • 对角 λ \lambda λ 矩阵中对角线上元素的一次因子的方幂(包括对角线上元素中重复的因子),为其初等因子。
  • 分块对角 λ \lambda λ 矩阵上个对角块的初等因子合在一起即为整个 λ \lambda λ 矩阵的初等因子。

2、矩阵相似的特征

矩阵相似的充要条件 : n n n 阶矩阵 A A A B B B相似 ⇔ \Leftrightarrow 存在可逆矩阵 P P P Q Q Q,使得 λ E − A = P ( λ E − B ) Q \lambda E-A=P(\lambda E -B)Q λEA=P(λEB)Q ⇔ \Leftrightarrow 它们的特征矩阵等价 ⇔ \Leftrightarrow 不变因子或初等因子相同

3、 J o r d a n Jordan Jordan 块与标准形

3.1 定义

  • J o r d a n Jordan Jordan 块: 初等因子为 ( λ − λ k ) m k (\lambda - \lambda_{k})^{m_k} (λλk)mk m k m_k mk 阶矩阵 J k = [ λ k 1 λ k ⋱ ⋱ 1 λ k ] J_k = \begin{bmatrix} \lambda_{k} & 1 & & \\ & \lambda_{k} & \ddots & \\ & & \ddots & 1 \\ & & & \lambda_{k}\\ \end{bmatrix} Jk= λk1λk1λk

  • J o r d a n Jordan Jordan 标准形: 初等因子为 ( λ − λ 1 ) m 1 (\lambda-\lambda_1)^{m_1} (λλ1)m1, ( λ − λ 2 ) m 2 (\lambda-\lambda_2)^{m_2} (λλ2)m2,…, ( λ − λ s ) m s (\lambda-\lambda_s)^{m_s} (λλs)ms 的矩阵 J = [ J 1 J 2 ⋱ J S ] J=\begin{bmatrix} J_{1} & & & \\ & J_{2} & & \\ & & \ddots & \\ & & & J_{S}\\ \end{bmatrix} J= J1J2JS (其中 j k j_k jk 为上述 J o r d a n Jordan Jordan 块)

3.2 性质

  • 每个 n n n 阶矩阵均可相似化为 J o r d a n Jordan Jordan 标准形。
  • n n n 阶矩阵可相似对角化的充分必要条件是其初等因子均为一次的。

3.3 约当标准型变换矩阵(另外矩阵函数章详见)

约当标准型变换矩阵 P P P 求法: ( P − 1 A P = J ) (P^{-1} AP =J) P1AP=J

  • A A A n n n 维矩阵, J J J t t t个约当块, P P P的列向量 p i p_i pi
  • 对于一个对角元素 λ 0 : A P 1 = λ 0 P 1 , A P 2 = P 1 + λ 0 P 2 , . . . , A P m = P m − 1 + λ 0 P m \lambda_0 : AP_1 = \lambda_0 P_1 , AP_2= P_1 + \lambda_0 P_2 , . . . , AP_m= P_{m-1} + \lambda_0 P_m λ0:AP1=λ0P1,AP2=P1+λ0P2,...,APm=Pm1+λ0Pm
  • A ( p 1 , p 2 , . . . , p n ) = ( p 1 , p 2 , . . . , p n ) [ J 1 ⋱ J t ] A(p_1,p_2,...,p_n) = (p_1,p_2,...,p_n) \begin{bmatrix}J_1& &\\& \ddots & \\& & J_t \end{bmatrix} A(p1,p2,...,pn)=(p1,p2,...,pn) J1Jt

五、 C a y l e y − H a m i l t o n Cayley-Hamilton CayleyHamilton 定理与矩阵的最小多项式

1、矩阵多项式

f ( A ) = a 0 A m + a 1 A m − 1 + ⋅ ⋅ ⋅ + a m − 1 A + a m E f(A)=a_0A^m+a_1A^{m-1}+···+a_{m-1}A+a_mE f(A)=a0Am+a1Am1+⋅⋅⋅+am1A+amE , 为$ n$ 阶矩阵 A A A 的多项式

  • n n n 阶矩阵的多项式仍为 n n n 阶矩阵
  • 相似矩阵的多项式仍然相似,且具有相同的相似变换阵。
  • 对角阵的多项式仍为对角阵,分块对角阵的多项式仍为分块对角阵。
  • 对于 n n n 阶矩阵 A A A 和多项式 f ( λ ) f(\lambda) f(λ) f ( A ) f (A) f(A) 必相似于 [ f ( J 1 ) f ( J 2 ) ⋱ f ( J S ) ] \begin{bmatrix} f(J_{1}) & & & \\ & f(J_{2}) & & \\ & & \ddots & \\ & & & f(J_{S})\\ \end{bmatrix} f(J1)f(J2)f(JS)
    其中 J k J_k Jk , k = 1 , 2 , . . , s k=1, 2,.., s k=1,2,..,s A A A 的各个 J o r d a n Jordan Jordan块。

2、 C a y l e y − H a m i l t o n Cayley-Hamilton CayleyHamilton 定理

  • N = [ 0 1 0 ⋱ ⋱ 1 0 ] k N=\begin{bmatrix} 0 & 1 & & \\ & 0 & \ddots & \\ & & \ddots & 1 \\ & & & 0\\ \end{bmatrix}_k N= 01010 k N k = 0 N^k = 0 Nk=0 ,并称 N N N幂零矩阵

  • C a y l e y − H a m i l t o n Cayley-Hamilton CayleyHamilton 定理 :对于 n n n 阶矩阵 A A A ,设 f ( λ ) = ∣ λ E − A ∣ f (\lambda) =|\lambda E - A| f(λ)=λEA,则 f ( A ) = 0 f (A) = 0 f(A)=0

3、矩阵的零化多项式与最小多项式

对于多项式 g ( λ ) g(\lambda) g(λ) n n n 阶矩阵 A A A ,若 g ( A ) = 0 g(A) = 0 g(A)=0 ,则称 g ( λ ) g(\lambda) g(λ) A A A 的零化多项式。 A A A的次数最低的首一零化多项式称为 A A A最小多项式

  • A A A 的特征多项式为其零化多项式,但不一定是最小多项式。
  • 多项式 g ( λ ) g(\lambda) g(λ) n n n 阶矩阵 A A A 最小多项式的充分必要条件是 g ( λ ) g(\lambda) g(λ) 能整除 A A A 的任何零化多项式。
  • 矩阵的最高阶不变因子就是其最小多项式,因而最小多项式是初等因子中各最高幂的乘积。
  • 相似矩阵具有相同的最小多项式。
  • 矩阵最小多项式的根为特征多项式的根,反之亦然,但重数不一定相同。
  • 矩阵可相似对角化的充分必要条件是最小多项式无重根。

你可能感兴趣的:(矩阵理论学习,矩阵,线性代数)