设 A = [ a i j ] ∈ F n × n A=[a_{ij}]\in F^{n\times n} A=[aij]∈Fn×n, λ \lambda λ 为文字1,称:
λ E − A = [ λ − a 11 − a 12 ⋯ − a 1 n − a 21 λ − a 22 ⋯ − a 2 n ⋮ ⋮ ⋮ − a n 1 − a n 2 ⋯ λ − a m m ] \lambda E-A= \begin{bmatrix} \lambda-a_{11} & -a_{12} & \cdots & -a_{1n} \\ -a_{21} & \lambda-a_{22} & \cdots & -a_{2n} \\ \vdots & \vdots & & \vdots \\ -a_{n1} & -a_{n2} & \cdots & \lambda-a_{mm} \\ \end{bmatrix} λE−A= λ−a11−a21⋮−an1−a12λ−a22⋮−an2⋯⋯⋯−a1n−a2n⋮λ−amm
为 A A A 的特征矩阵det ( λ E − A ) = λ n + a 1 λ n − 1 + ⋯ + a n − 1 λ + a n \det(\lambda E-A) = \lambda^n + a_1\lambda^{n-1}+\cdots+a_{n-1}\lambda+a_n det(λE−A)=λn+a1λn−1+⋯+an−1λ+an 2
称为方阵 A A A 的特征多项式
设 A ∈ F n × n A\in F^{n\times n} A∈Fn×n, U ( λ ) , V ( λ ) ∈ F n × n U(\lambda),V(\lambda)\in F^{n\times n} U(λ),V(λ)∈Fn×n,则 ∃ Q ( λ ) \exist Q(\lambda) ∃Q(λ), R ( λ ) ∈ F [ λ ] n × n R(\lambda)\in F[\lambda]^{n\times n} R(λ)∈F[λ]n×n, U 0 , V 0 ∈ F n × n U_0,V_0\in F^{n\times n} U0,V0∈Fn×n,使得
U ( λ ) = ( λ E − A ) Q ( λ ) + U 0 V ( λ ) = R ( λ ) ( λ E − A ) + V 0 \begin{align*} U(\lambda)&=(\lambda E-A)Q(\lambda)+U_0 \\ V(\lambda)&=R(\lambda)(\lambda E-A)+V_0 \\ \end{align*} U(λ)V(λ)=(λE−A)Q(λ)+U0=R(λ)(λE−A)+V0
方阵可以由特征矩阵表示,这里的 Q ( λ ) Q(\lambda) Q(λ)、 R ( λ ) R(\lambda) R(λ) 相当于系数,只不过这个系数是个方阵。这种表示方法存在且唯一
设 A ( λ ) , B ( λ ) ∈ F [ λ ] n × n A(\lambda),B(\lambda)\in F[\lambda]^{n\times n} A(λ),B(λ)∈F[λ]n×n,则 A ( λ ) ≃ B ( λ ) A(\lambda)\simeq B(\lambda) A(λ)≃B(λ),3当且仅当存在 m 阶可逆多项式矩阵 U ( λ ) U(\lambda) U(λ) 和 n 阶可逆多项式矩阵 V ( λ ) V(\lambda) V(λ),使得
B ( λ ) = U ( λ ) A ( λ ) V ( λ ) B(\lambda)=U(\lambda)A(\lambda)V(\lambda) B(λ)=U(λ)A(λ)V(λ)
这里的 U ( λ ) U(\lambda) U(λ) 和 V ( λ ) V(\lambda) V(λ) 分别对应初等行变换和初等列变换
A、B 是两个方阵,若存在可逆矩阵 P ,使得
P − 1 A P = B P^{-1}AP=B P−1AP=B
则称 A A A 相似于 B B B,记为 A ∼ B A\sim B A∼B
设 A , B ∈ F n × n A,B \in F^{n\times n} A,B∈Fn×n,则 A ∼ B A\sim B A∼B 的充分必要条件是 λ E − A ≃ λ E − B \lambda E-A\simeq \lambda E-B λE−A≃λE−B
设 A ∈ C n × n A\in\mathbb C^{n\times n} A∈Cn×n,称 λ E − A \lambda E-A λE−A 的行列式因子、不变因子、初等因子分别为 A A A 的行列式因子、不变因子、初等因子
设 A A A、 B ∈ C n × n B\in \mathbb C^{n\times n} B∈Cn×n,则
A ∼ B ⇔ A 与 B 有相同的行列式因子 ⇔ A 与 B 有相同的不变因子 ⇔ A 与 B 有相同的初等因子 \begin{align*} A\sim B &\Leftrightarrow A 与 B 有相同的行列式因子 \\ &\Leftrightarrow A 与 B 有相同的不变因子 \\ &\Leftrightarrow A 与 B 有相同的初等因子 \\ \end{align*} A∼B⇔A与B有相同的行列式因子⇔A与B有相同的不变因子⇔A与B有相同的初等因子
即可以借助因子推相似,比如 λ E − A \lambda E-A λE−A 与 λ E − A T \lambda E-A^T λE−AT 有相同的行列式因子,所以 A A A 与 A T A^T AT 相似
任何一个方阵都可以找到有理标准型(Jordan标准型更重要)
设 A ∈ F n × n A\in F^{n\times n} A∈Fn×n,其非常数不变因子有 k 个:
φ 1 ( λ ) , φ 2 ( λ ) , ⋯ , φ k ( λ ) , φ i ( λ ) ∣ φ i + 1 ( λ ) , i = 1 , 2 , ⋯ , k − 1 \varphi_1(\lambda),\varphi_2(\lambda),\cdots,\varphi_{k}(\lambda),\varphi_i(\lambda)\mid\varphi_{i+1}(\lambda),i=1,2,\cdots,k-1 φ1(λ),φ2(λ),⋯,φk(λ),φi(λ)∣φi+1(λ),i=1,2,⋯,k−1
设 φ i ( λ ) = λ n i + a 1 λ n i − 1 + ⋯ + a i n i − 1 λ + a i n i \varphi_i(\lambda)=\lambda^{n_i}+a_1\lambda^{n_i-1}+\cdots+a_{in_{i-1}}\lambda+a_{in_{i}} φi(λ)=λni+a1λni−1+⋯+aini−1λ+aini, i = 1 , 2 , ⋯ , k i=1,2,\cdots,k i=1,2,⋯,k。由于4
D n ( λ ) = det ( λ E − A ) = φ 1 ( λ ) φ 2 ( λ ) ⋯ φ k ( λ ) D_n(\lambda)=\det(\lambda E-A)=\varphi_1(\lambda)\varphi_2(\lambda)\cdots\varphi_k(\lambda) Dn(λ)=det(λE−A)=φ1(λ)φ2(λ)⋯φk(λ)
故 n 1 + n 2 + ⋯ + n k = n n_1+n_2+\cdots+n_k=n n1+n2+⋯+nk=n∀ φ i ( λ ) \forall \varphi_i(\lambda) ∀φi(λ),令
F i = [ 0 − a i n i 1 0 − a i n i − 1 1 ⋱ ⋮ ⋱ 0 − a i 2 1 − a i 1 ] F_i= \begin{bmatrix} 0 &&&& -a_{in_i} \\ 1 & 0 &&& -a_{in_{i-1}} \\ & 1 & \ddots && \vdots \\ && \ddots & 0 & -a_{i2} \\ &&& 1 & -a_{i1} \\ \end{bmatrix} Fi= 0101⋱⋱01−aini−aini−1⋮−ai2−ai1
可知 F i F_i Fi 的不变因子为 1 , 1 , ⋯ , 1 , φ i ( λ ) 1,1,\cdots,1,\varphi_i(\lambda) 1,1,⋯,1,φi(λ)(一共 n i − 1 n_i-1 ni−1 个 1 1 1,令
F = [ F 1 F 2 ⋱ F k ] F= \begin{bmatrix} F_1 \\ & F_2 \\ && \ddots \\ &&& F_k \\ \end{bmatrix} F= F1F2⋱Fk
∵ φ i ( λ ) ∣ φ i + 1 ( λ ) , i = 1 , 2 , ⋯ , k − 1 \because \varphi_i(\lambda)\mid\varphi_{i+1}(\lambda),i=1,2,\cdots,k-1 ∵φi(λ)∣φi+1(λ),i=1,2,⋯,k−1, ∴ \therefore ∴ F F F 的不变因子为
1 , 1 , ⋯ , 1 ⏞ n − k 个 , φ 1 ( λ ) , φ 2 ( λ ) , ⋯ , φ k ( λ ) \overbrace{1,1,\cdots,1}^{n-k个},\varphi_1(\lambda),\varphi_2(\lambda),\cdots,\varphi_k(\lambda) 1,1,⋯,1 n−k个,φ1(λ),φ2(λ),⋯,φk(λ)
这表明 A A A 与 F F F 具有相同的不变因子,从而 A ∼ F A\sim F A∼F我们称 F F F 为 A A A 的有理标准型, F i F_i Fi 为有理块
比如求矩阵 A A A 的有理标准型
A = [ − 1 − 2 6 − 1 0 3 − 1 − 1 4 ] A= \begin{bmatrix} -1 & -2 & 6 \\ -1 & 0 & 3 \\ -1 & -1 & 4 \\ \end{bmatrix} A= −1−1−1−20−1634
利用初等变换,有
λ E − A = [ λ + 1 2 − 6 1 λ − 3 1 1 λ − 4 ] ≃ [ 1 0 0 0 λ − 1 0 0 0 ( λ − 1 ) 2 ] \lambda E-A= \begin{bmatrix} \lambda+1 & 2 & -6 \\ 1 & \lambda & -3 \\ 1 & 1 & \lambda-4 \\ \end{bmatrix} \simeq \begin{bmatrix} 1 & 0 & 0 \\ 0 & \lambda-1 & 0 \\ 0 & 0 & (\lambda-1)^2 \\ \end{bmatrix} λE−A= λ+1112λ1−6−3λ−4 ≃ 1000λ−1000(λ−1)2
所以 A A A 的不变因子为 1 , λ − 1 , ( λ − 1 ) 2 1,\lambda-1,(\lambda-1)^2 1,λ−1,(λ−1)2
对于 φ 1 ( λ ) = λ − 1 \varphi_1(\lambda)=\lambda-1 φ1(λ)=λ−1,其除最高项系数为 -1,得到 F 1 = [ 1 ] F_1=[1] F1=[1]
对于 φ 2 ( λ ) = λ 2 − 2 λ + 1 \varphi_2(\lambda)=\lambda^2-2\lambda+1 φ2(λ)=λ2−2λ+1,其除最高项系数为 1,-2,得到
F 2 = [ 0 − 1 1 2 ] F_2= \begin{bmatrix} 0 & -1 \\ 1 & 2 \\ \end{bmatrix} F2=[01−12]
则 A A A 的有理标准型为
F = [ 1 0 0 0 0 − 1 0 1 2 ] F= \begin{bmatrix} 1 & 0 & 0 \\ 0 & 0 & -1 \\ 0 & 1 & 2 \\ \end{bmatrix} F= 1000010−12
设 A ∈ C n × n A\in \mathbb C^{n\times n} A∈Cn×n,其全部初等因子为
( λ − λ 1 ) n 1 , ( λ − λ 2 ) n 2 , ⋯ , ( λ − λ s ) n s (\lambda-\lambda_1)^{n_1},(\lambda-\lambda_2)^{n_2},\cdots,(\lambda-\lambda_s)^{n_s} (λ−λ1)n1,(λ−λ2)n2,⋯,(λ−λs)ns
其中 λ 1 , λ 2 , ⋯ , λ s ∈ C \lambda_1,\lambda_2,\cdots,\lambda_s\in \mathbb C λ1,λ2,⋯,λs∈C,允许相同由于4 D n ( λ ) = det ( λ E − A ) = ( λ − λ 1 ) n 1 ( λ − λ 2 ) n 2 ⋯ ( λ − λ s ) n s D_n(\lambda)=\det(\lambda E-A)=(\lambda-\lambda_1)^{n_1}(\lambda-\lambda_2)^{n_2}\cdots(\lambda-\lambda_s)^{n_s} Dn(λ)=det(λE−A)=(λ−λ1)n1(λ−λ2)n2⋯(λ−λs)ns,故 n 1 + n 2 + ⋯ + n s = n n_1+n_2+\cdots+n_s=n n1+n2+⋯+ns=n
对每一个 ( λ − λ i ) n i (\lambda-\lambda_i)^{n_i} (λ−λi)ni,令
J i = [ λ i 1 λ i ⋱ ⋱ 1 λ i ] n i × n i J_i= \begin{bmatrix} \lambda_i \\ 1 & \lambda_i \\ & \ddots & \ddots \\ && 1 & \lambda_i \end{bmatrix}_{n_i\times n_i} Ji= λi1λi⋱⋱1λi ni×ni
此时 J i J_i Ji 的初等因子为 ( λ − λ i ) n i (\lambda-\lambda_i)^{n_i} (λ−λi)ni,令
J = [ J 1 J 2 ⋱ J s ] J= \begin{bmatrix} J_1 \\ & J_2 \\ && \ddots \\ &&& J_s \\ \end{bmatrix} J= J1J2⋱Js
此时 J J J 的全部初等因子为 ( λ − λ 1 ) n 1 , ( λ − λ 2 ) n 2 , ⋯ , ( λ − λ s ) n s (\lambda-\lambda_1)^{n_1},(\lambda-\lambda_2)^{n_2},\cdots,(\lambda-\lambda_s)^{n_s} (λ−λ1)n1,(λ−λ2)n2,⋯,(λ−λs)ns,与 A A A 具有相同的初等因子,所以 A ∼ J A\sim J A∼J于是我们称 J J J 为 A A A 的 Jordan 标准型, J i J_i Ji 为 Jordan 块
比如求矩阵 A A A 的 Jordan 标准型
A = [ − 1 − 2 6 − 1 0 3 − 1 − 1 4 ] A= \begin{bmatrix} -1 & -2 & 6 \\ -1 & 0 & 3 \\ -1 & -1 & 4 \\ \end{bmatrix} A= −1−1−1−20−1634
利用初等变换,有
λ E − A = [ λ + 1 2 − 6 1 λ − 3 1 1 λ − 4 ] ≃ [ 1 0 0 0 λ − 1 0 0 0 ( λ − 1 ) 2 ] \lambda E-A= \begin{bmatrix} \lambda+1 & 2 & -6 \\ 1 & \lambda & -3 \\ 1 & 1 & \lambda-4 \\ \end{bmatrix} \simeq \begin{bmatrix} 1 & 0 & 0 \\ 0 & \lambda-1 & 0 \\ 0 & 0 & (\lambda-1)^2 \\ \end{bmatrix} λE−A= λ+1112λ1−6−3λ−4 ≃ 1000λ−1000(λ−1)2
所以 A A A 的不变因子为 1 , λ − 1 , ( λ − 1 ) 2 1,\lambda-1,(\lambda-1)^2 1,λ−1,(λ−1)2
对于 λ − 1 \lambda-1 λ−1,作 J 1 = [ 1 ] J_1=[1] J1=[1];
对于 λ 2 − 2 λ + 1 \lambda^2-2\lambda+1 λ2−2λ+1,作
J 2 = [ 1 0 1 1 ] J_2= \begin{bmatrix} 1 & 0 \\ 1 & 1 \\ \end{bmatrix} J2=[1101]
故 A A A 的 Jordan 标准型为
J = [ 1 0 0 0 1 0 0 1 1 ] J= \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 1 & 1 \\ \end{bmatrix} J= 100011001
设 A ∈ C n × n A\in\mathbb C^{n\times n} A∈Cn×n,则下列命题等价:
- A A A 相似于对角矩阵
- A A A 的初等因子都是一次的
- A A A 的非常数不变因子无重根
- d n ( λ ) d_n(\lambda) dn(λ) 无重根
所有方阵都有Jordan标准型(分块对角矩阵),但不是所有的方阵能相似于对角矩阵
设 A ∈ F n × n A\in F^{n\times n} A∈Fn×n 且 A ≠ 0 A\neq0 A=0,若存在非零多项式
φ ( λ ) = a 0 λ m + a 1 λ m − 1 + ⋯ + a m − 1 λ + a m \varphi(\lambda)=a_0\lambda^{m}+a_1\lambda^{m-1}+\cdots+a_{m-1}\lambda+a_m φ(λ)=a0λm+a1λm−1+⋯+am−1λ+am
使得
φ ( λ ) = a 0 A m + a 1 A m − 1 + ⋯ + a m − 1 A + a m E = O \varphi(\lambda)=a_0A^m+a_1A^{m-1}+\cdots+a_{m-1}A+a_mE=O φ(λ)=a0Am+a1Am−1+⋯+am−1A+amE=O
则称 φ ( λ ) \varphi(\lambda) φ(λ) 为 A A A 的一个零化多项式
零化多项式不是唯一的,只要有个零化多项式,它乘任意多项式最后结果仍为0(如 φ ( λ ) ⋅ g ( λ ) \varphi(\lambda)\cdot g(\lambda) φ(λ)⋅g(λ) );既然有无穷多个零化多项式,我们肯定求不完,那么能不能定义出一个唯一的零化多项式?于是给出最小多项式的定义。
方阵 A A A 的次数最低 且 首1的零化多项式称为 A A A 的最小多项式,用 m ( λ ) m(\lambda) m(λ) 或 m A ( λ ) m_A(\lambda) mA(λ) 表示
那么如何计算零化多项式/最小多项式?
设 A ∈ F n × n A\in F^{n\times n} A∈Fn×n, f ( λ ) f(\lambda) f(λ) 是 A A A 的特征多项式,即
f ( λ ) = det ( λ E − A ) = λ n + a 1 λ n − 1 + ⋯ + a n − 1 λ + a n f(\lambda)=\det(\lambda E-A)=\lambda^n+a_1\lambda^{n-1}+\cdots+a_{n-1}\lambda+a_n f(λ)=det(λE−A)=λn+a1λn−1+⋯+an−1λ+an
则 f ( A ) = O f(A)=O f(A)=O
【注】方阵的特征多项式一定是它的零化多项式
- A A A 的最小多项式 可以整除 A A A 的零化多项式
- A A A 的最小多项式唯一
- 相似矩阵具有相同的最小多项式
- A A A 的最小多项式的根必定是其特征多项式的根,反之亦然
设 A ∈ F n × n A\in F^{n\times n} A∈Fn×n, d n ( λ ) d_n(\lambda) dn(λ) 为 A A A 的最后一个不变因子,则 A A A 的最小多项式 m A ( λ ) = d n ( λ ) m_A(\lambda)=d_n(\lambda) mA(λ)=dn(λ)
【 λ \lambda λ为文字】指关于 λ \lambda λ 的方程 ↩︎
【det】determinant:行列式 ↩︎
【 ≃ \simeq ≃】等价,可以通过初等变换得到的矩阵等价 ↩︎
【 D n ( λ ) D_n(\lambda) Dn(λ)】表示 n 阶行列式因子。 A ( λ ) A(\lambda) A(λ) 中全部 k k k 阶子式的首1最大公因式 D k ( λ ) D_k(\lambda) Dk(λ) 称为 A ( λ ) A(\lambda) A(λ) 的 k k k 阶行列式因子,( 1 ≤ k ≤ r 1\leq k\leq r 1≤k≤r) ↩︎ ↩︎