jordan标准 相似_Jordan 标准型定理

将学习到什么

就算两个矩阵有相同的特征多项式,它们也有可能不相似,那么如何判断两个矩阵是相似的?答案是它们有一样的 Jordan 标准型.

Jordan 标准型定理

这节目的:证明**每个复矩阵都与一个本质上唯一的 Jordan 矩阵相似**. 分三步证明这个结论。其中前两步已经在其它章节中给出,

- 第一步 [Schur 定理](http://www.cnblogs.com/zhoukui/p/7782688.html) 确保每个复矩阵都相似于一个上三角矩阵,这个上三角矩阵的特征值出现在其对角线上,且相等的特征值放在一起.

- 第二步 [Schur 三角化定理推论](http://www.cnblogs.com/zhoukui/p/7786648.html) 中定理 1.3 确保第一步中所描述的那种形式的矩阵相似于一个分块对角的上三角矩阵, 其中每个对角分块都有相等的对角元素.

- 第三步 在本节,要证明:**有相等对角元素的上三角矩阵相似于一个 Jordan 矩阵**.

同时我们还对如下结论感兴趣:如果一个矩阵是实的,且只有实的特征值,那么它可以通过实相似化简为 Jordan 矩阵. 如果实矩阵 \(A\) 只有实的特征值,那么第一步与第二步确保存在一个相似矩阵 \(S\), 使得 \(S^{-1}AS\) 是一个实的分块对角的上三角矩阵. 于是,只要证明有相等主对角元素的实的上三角矩阵可以通过实相似化简成 Jordan 块的直和就足够了.

下面给出一个有用的引理,它的证明完全是直接的计算. 特征值为零的 \(k \times k\) Jordan 块称为 幂零 Jordan 块.

证明:如果 \(n=1\), 就有 \(A=[0]\), 故而结论是平凡的. 我们对 \(n\) 用归纳法. 假设 \(n>1\) 且结论对所有阶小于 \(n\) 的所有严格上三角矩阵都成立. 分划 \(A=\begin{bmatrix} 0 & a^T \\ 0 & A_1 \end{bmatrix}\), 其中 \(a \in \mathbb{C}^{n-1}\), 且 \(A_1 \in M_{n-1}\) 是严格上三角矩阵. 根据归纳假设,存在一个非奇异的 \(S_1 \in M_{n-1}\), 使得 \(S_1^{-1}A_1S_1\) 有形式

\begin{align}

S_1^{-1}A_1S_1= \begin{bmatrix} J_{k_1} && \\ & \ddots & \\ && J_{k_s} \end{bmatrix} = \begin{bmatrix} J_{k_1} & 0 \\ 0 & J \end{bmatrix}

\end{align}

其中 \(k_1 \geqslant k_2 \geqslant \cdots \geqslant k_s \geqslant 1\) , \(k_1+k_2+\cdots+k_s=n-1\), \(J_{k_i}=J_{k_i}(0)\), 且 \(J=J_{k_2}\oplus \cdots \oplus J_{k_s} \in M_{n-k_1-1}\). \(J\) 中没有大于 \(k_1\) 的对角块,所以 \(J^{k_1}=0\). 计算表明

\begin{align} \label{e1}

\begin{bmatrix} 1 & 0 \\ 0 & S_1^{-1} \end{bmatrix} A \begin{bmatrix} 1 & 0 \\ 0 & S_1 \end{bmatrix} =\begin{bmatrix} 0 & a^TS_1 \\ 0 & S_1^{-1}A_1 S_1 \end{bmatrix}

\end{align}

分划 \(a^TS_1=[a_1^T \quad a_2^T]\), 其中 \(a_1 \in \mathbb{C}^{k_1}\). 而 \(a_2 \in \mathbb{C}^{n-k_1-1}\), 并将 \ref{e1} 写成

\begin{align}

\begin{bmatrix} 1 & 0 \\ 0 & S_1^{-1} \end{bmatrix} A \begin{bmatrix} 1 & 0 \\ 0 & S_1 \end{bmatrix} =\begin{bmatrix} 0 & a_1^T & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix}

\end{align}

现在考虑相似性

\begin{align}

& \begin{bmatrix} 1 & -a_1^T J_{k_1}^T & 0 \\ 0 & I & 0 \\ 0 & 0 & I \end{bmatrix} \begin{bmatrix} 0 & a_1^T & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix} \begin{bmatrix} 1 & a_1TJ_{k_1}T & 0 \\ 0 & I & 0 \\ 0 & 0 & I \end{bmatrix} \notag \\ \label{e22}

&= \begin{bmatrix} 0 & a_1T(I-J_{k_1}TJ_{k_1}) & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix}= \begin{bmatrix} 0 & (a_1Te_1)e_1T & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix}

\end{align}

其中用到恒等式 \([I-J_k^T J_k]x=(x^Te_1)e_1\). 现在有两种可能性,它们要根据 \(a_1^Te_1 \neq 0\) 还是 \(a_1^Te_1 = 0\) 而定.

如果 \(a_1^Te_1 \neq 0\), 那么

\begin{align}

& \begin{bmatrix} 1/a_1^Te_1 & 0 & 0 \\ 0 & I & 0 \\ 0 & 0 & (1/a_1^Te_1) I \end{bmatrix} \begin{bmatrix} 0 & (a_1Te_1)e_1T & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix}

\begin{bmatrix} a_1^Te_1 & 0 & 0 \\ 0 & I & 0 \\ 0 & 0 & a_1^Te_1 I \end{bmatrix} \notag \\

&= \begin{bmatrix} 0 & e_1^T & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix}= \begin{bmatrix} \tilde{J} & e_1a_2^T \\ 0 & J \end{bmatrix} \notag

\end{align}

注意到 \(\tilde{J}=\begin{bmatrix} 0 & e_1^T \\ 0 & J_{k_1} \end{bmatrix}=J_{k_1+1}(0)\). 由于 \(\tilde{J}e_{i+1}=e_i\)(对 \(i=1,2,\cdots,k_1\)), 计算表明

\begin{align}

\begin{bmatrix} I & e_2a_2^T \\ 0 & I \end{bmatrix} \begin{bmatrix} \tilde{J} & e_1a_2^T \\ 0 & J \end{bmatrix} \begin{bmatrix} I & -e_2a_2^T \\ 0 & I \end{bmatrix} =\begin{bmatrix} \tilde{J} & - \tilde{J} e_2a_2T+e_1a_2T+e_2a_2^TJ \\ 0 & J \end{bmatrix} = \begin{bmatrix} \tilde{J} & e_2a_2^T J \\ 0 & J \end{bmatrix} \notag

\end{align}

我们可以用递推方式对 \(i=2,3,\cdots\) 计算相似矩阵序列

\begin{align}

\begin{bmatrix} I & e_{i+1}a_2^T J^{i-1} \\ 0 & I \end{bmatrix} \begin{bmatrix} \tilde{J} & e_i a_2^T J^{i-1} \\ 0 & J \end{bmatrix} \begin{bmatrix} I & -e_{i+1}a_2^T J^{i-1}\\ 0 & I \end{bmatrix} = \begin{bmatrix} \tilde{J} & e_{i+1}a_2^T J^i \\ 0 & J \end{bmatrix} \notag

\end{align}

由于 \(J^{k_1} = 0\),经过至多 \(k_1\) 步计算之后,这个相似矩阵序列中不在对角线上的元素最终都变为零. 我们得出结论: \(A\) 相似于 $ \begin{bmatrix} \tilde{J} & 0 \\ 0 & J \end{bmatrix} $, 它就是一个有所要求形状的严格上三角 Jordan 矩阵.

如果 \(a_1^Te_1 = 0\), 则 \ref{e22} 表明 \(A\) 相似于

\begin{align}

\begin{bmatrix} 0 & 0 & a_2^T \\ 0 & J_{k_1} & 0 \\ 0 & 0 & J \end{bmatrix} \notag

\end{align}

它与

\begin{align} \label{e3}

\begin{bmatrix} J_{k_1} & 0 & 0 \\ 0 & 0 & a_2^T \\ 0 & 0 & J \end{bmatrix}

\end{align}

置换相似. 根据归纳假设,存在一个非奇异的 \(S_2 \in M_{n-k_1}\), 使得 \(S_2^{-1}\begin{bmatrix} 0 & a_2^T \\ 0 & J \end{bmatrix} S_2=\hat{J} \in M_{n-k_1}\) 是主对角线为零的 Jordan 矩阵. 这样一来,矩阵 \ref{e3} , \(A\) 本身都与 \(\begin{bmatrix} J_{k_1} & 0 \\ 0 & \hat{J} \end{bmatrix}\) 相似,这就是所要求形式的 Jordan 矩阵,除了对角 Jordan 块有可能不是按照其大小非增的次序排列. 如果需要的话,用分块置换相似就产生出所需要的形式.

最后注意到,如果 \(A\) 是实的,那么这一证明中所有相似矩阵都是实的,所以 \(A\) 通过实相似与所要求形式的 Jordan 矩阵相似.

由于一般情形是幂零情形的简单推论,所以定理 (1.1) 基本完成了第 3 步. 如果 \(A \in M_n\) 是所有对角元素都为 \(\lambda\) 的上三角矩阵,那么 \(A_0=A-\lambda I\) 就是一个严格上三角矩阵. 如果 \(S \in M_n\) 是非奇异的,且 \(S^{-1}A_0S\) 是幂零 Jordan 块 \(J_{n_i}(0)\) 的直和,那么 \(S^{-1}AS=S^{-1}A_0S+\lambda I\) 就是特征值为 \(\lambda\) 的 Jordan 块 \(J_{n_i}(\lambda)\) 的直和. 下面给出 Jordan 标准型定理 中的存在性结论.

定理 (1.2) 中的 Jordan 矩阵就是 \(A\) 的 Jordan 标准型(相差不过直和项的排列). 矩阵 \(J_k(\lambda),\lambda \in \mathbb{C},k=1,2,\cdots\) 是 相似的标准分块. 两个事实为理解 Jordan 标准型定理中的唯一性提供了关键思路:(1) 如果两个矩阵都用同样的纯量矩阵来做平移,其相似性保持不变;(2) 秩是一个相似不变量.

一些重要结论

如果 \(A,B,S\in M_n\), \(S\) 是非奇异的,且 \(A=SBS^{-1}\), 那么对任何 \(\lambda\in \mathbb{C}\), 有 \(A-\lambda I=SBS^{-1}-\lambda SS^{-1}=S(B-\lambda I)S^{-1}\). 对每个 \(k=1,2,\cdots\), 矩阵 \((A-\lambda I)^k\) 与 \((B-\lambda I)^k\) 相似,当然它们的秩相等. 我们着手于与 \(A\) 相似的 Jordan 矩阵 \(B=J=J_{n_1}(\lambda_1) \oplus \cdots \oplus J_{n_q}(\lambda_q)\) 以及 \(\lambda\) 是 \(A\) 的一个特征值时的结论. 在对 \(J\) 的对角块用置换相似作排列之后。可以假设 \(J=J_{m_1}(\lambda) \oplus \cdots \oplus J_{m_p}(\lambda)\oplus \hat{J}\), 其中的 Jordan 矩阵 \(\hat{J}\) 是异于 \(\lambda\) 的特征值对应的 Jordan 块的直和. 这样 \(A-\lambda I\) 就相似于

\begin{align}

J-\lambda I&=(J_{m_1}(\lambda)-\lambda I) \oplus \cdots \oplus (J_{m_p}(\lambda)-\lambda I)\oplus( \hat{J}-\lambda I) \notag \\

&=J_{m_1}(0) \oplus \cdots \oplus J_{m_p}(0)\oplus ( \hat{J}-\lambda I) \notag

\end{align}

它是 \(p\) 个不同阶的幂零 Jordan 块和一个非奇异 Jordan 矩阵 $ \hat{J}-\lambda I \in M_m$ 的直和, 其中 \(m=n-(m_1+\cdots+m_p)\). 此外,对每个 \(k=1,2,\cdots\), \((A-\lambda I)^k\) 与 $(J-\lambda I)k=J_{m_1}(0)k \oplus \cdots \oplus J_{m_p}(0)^k\oplus ( \hat{J}-\lambda I)^k $ 相似. 由于直和的秩等于各个直和项的秩之和,故而对每个 \(k=1,2,\cdots\), 我们有

\begin{align}

\mathrm{rank}\,(A-\lambda I)^k &=\mathrm{rank}\,(J-\lambda I)^k= \mathrm{rank}\, J_{m_1}(0)^k \oplus \cdots \oplus \mathrm{rank}\,J_{m_p}(0)^k \oplus \mathrm{rank}\, (\hat{J}-\lambda I)^k \notag \\ \label{equ444}

&=\mathrm{rank}\, J_{m_1}(0)^k \oplus \cdots \oplus \mathrm{rank} \, J_{m_p}(0)^k +m

\end{align}

幂零 Jordan 块的幂的秩等于什么?\(J_{\ell}(0)\) 的第一列是零,而它的后 \(\ell-1\) 列是线性无关的(第一条超对角元素中仅有的非零元素是 1),所以 \(\mathrm{rank}\, J_{\ell}(0)=\ell-1\). \(J_{\ell}(0)^2\) 中仅有的非零元素是在第二条超对角线中的 1,所以它的前两列都是零,它的后 \(\ell-2\) 列是线性无关的,且 \(\mathrm{rank}\, J_{\ell}(0)^2=\ell-2\). 随着幂每提高一次,这些 1 就向上移动一条超对角线(所以为零的列的个数就增加 1,而秩则减少 1),直到 \(J_{\ell}(0)^{\ell-1}\) 时恰好只有一个非零的元素(在位置 \((1,\ell)\) 处),且 \(\mathrm{rank}\,J_{\ell}(0)^{\ell-1}=1=\ell-(\ell-1)\). 当然,对所有 \(k=\ell,\ell+1,\cdots\), 都有 \(J_{\ell}(0)^k=0\). 一般来说,对每个 \(k=1,2,\cdots\), 我们有 \(\mathrm{rank}\,J_{\ell}(0)^k=\max \{\ell-k,0\}\), 所以

\begin{align} \label{equ555}

\mathrm{rank}\,J_{\ell}(0){k-1}-\mathrm{rank}\,J_{\ell}(0)k= \begin{cases} 1 \quad \text{如果} k \leqslant \ell \\ 0 \quad \text{如果} k>\ell \end{cases} ,\quad k=1,2,\cdots

\end{align}

其中我们标注 \(\mathrm{rank}\,J_{\ell}(0)^0=\ell\).

现在我们设 \(A\in M_n,\lambda \in \mathbb{C}\), 令 \(k\) 是一个正整数,设

\begin{align}

r_k(A,\lambda)=\mathrm{rank} \, (A-\lambda I)^k, \quad r_0(A,\lambda):=n

\end{align}

又定义

\begin{align}

w_k(A,\lambda)=r_{k-1}(A,\lambda)-r_k(A,\lambda), \quad w_1(A,\lambda)=n-r_1(A,\lambda)

\end{align}

如果 \(A\in M_n\), 且 \(\lambda \in \mathbb{C}\) 不是 \(A\) 的特征值,对所有 \(k=1,2,\cdots\), 有 \(w_k(A,\lambda)=0\). 考虑 Jordan 矩阵

\begin{align} \label{equ888}

J=J_3(0)\oplus J_3(0)\oplus J_2(0) \oplus J_2(0) \oplus J_2(0) \oplus J_1(0)

\end{align}

容易验证 \(r_1(J,0)=7\), \(r_2(J,0)=2\) 以及 \(r_3(J,0)=r_4 (J,0)=0\), \(w_1(J,0)=6\) 是阶至少为 1 的分块的个数, \(w_2(J,0)=5\) 是阶至少为 2 的分块的个数, \(w_3(J,0)=2\) 是阶至少为 3 的分块的个数, \(w_4(J,0)=0\) 是阶至少为 4 的分块的个数。又注意到 \(w_1(J,0)-w_2(J,0)=1\) 是阶为 1 的分块的个数, \(w_2(J,0)-w_3(J,0)=3\) 是阶为 2 的分块的个数, \(w_3(J,0)-w_4(J,0)=2\) 是阶为 3 的分块的个数,这不是偶然的。

利用式 \ref{equ444} 和 \ref{equ555} 来说明 \(w_k(A,\lambda)\) 的代数意义:

\begin{align}

w_k (A,\lambda) &= \Big ( \mathrm{rank}\,J_{m_1}(0){k-1}-\mathrm{rank}\,J_{m_1}(0)k \Big ) + \cdots + \Big ( \mathrm{rank}\,J_{m_p}(0){k-1}-\mathrm{rank}\,J_{m_p}(0)k \Big) \notag \\

&=(1, \,\text{如果}\, m_1 \geqslant k)+ \cdots +(1, \,\text{如果} \, m_p \geqslant k) \notag \\ \label{equ666}

&= \text{特征值为}\, \lambda \,\, \text{且阶至少为} \, k \,\, \text{的分块的个数}

\end{align}

特别地,\(w_1(A,\lambda)\) 是 \(A\) 的以 \(\lambda\) 为特征值的所有各阶的 Jordan 块的个数,由定义知:\(w_1(A,\lambda)\) 也是 \(\lambda\) 作为 \(A\) 的特征值的几何重数.

利用特征刻画 \ref{equ666},我们看出 \(w_k(A,\lambda)-w_{k+1}(A,\lambda)\) 是以 \(\lambda\) 为特征值而阶至少为 \(k\) 且不含阶至少为 \(k+1\) 的 Jordan 块的个数,这也就是以 \(\lambda\) 为特征值且阶恰好为 \(k\) 的 Jordan 块的个数.

由秩恒等式 \ref{equ444} 知,用 \(q\) 表示 \(A\in M_n\) 的以 \(\lambda \in \mathbb{C}\) 为特征值的最大的 Jordan 块的阶,则当 \(k \geqslant q\) 时,都有 \(\mathrm{rank} \, (A-\lambda I)^k=\mathrm{rank} \, (A-\lambda I)^q\), 这个整数 \(q\) 称为 \(\lambda\) 作为 \(A\) 的特征值的指数. \(w_1(A,\lambda)+w_2(A,\lambda)+\cdots+w_q(A,\lambda)\) 是 \(\lambda\) 的代数重数.

Weyr 特征

\(A\in M_n\) 的与 \(\lambda \in \mathbb{C}\) 相关的 Weyr 特征定义为

\begin{align}

w(A,\lambda)=(w_1(A,\lambda),\cdots,w_q(A,\lambda))

\end{align}

其中 \(q\) 是 \(\lambda\) 作为 \(A\) 的特征值的指数.

如前所述,与 \(A\) 相似的 Jordan 矩阵 \(J\) 的构造完全由 \(A\) 的与不同的特征值相关的 Weyr 特征所决定的,这就意味着两个本质上不同的 Jordan 矩阵不可能都与 \(A\) 相似,因为它们的 Weyr 特征必定是不相同的. 我们可以说:两个复方阵 \(A,B\in M_n\) 相似,当且仅当它们特征值相同,且每个特征值相关的 Weyr 特征相同.

Segre 特征

对 \(A\) 的每个不同的特征值 \(\lambda\),列出 \(A\) 的以 \(\lambda\) 为特征值的所有 Jordan 块的阶,则给定的 \(A\in M_n\) 的 Jordan 块构造就可以完全确定. 将 \(A\) 的以 \(\lambda\) 为特征值的 Jordan 块的阶按照非增次序排列而成的表

\begin{align}

s_1(A,\lambda) \geqslant s_2(A,\lambda) \geqslant \cdots \geqslant s_{w_1(A,\lambda)}(A,\lambda) >0= s_{w_1(A,\lambda)+1}(A,\lambda) =\cdots

\end{align}

称为 \(A\) 的特征值 \(\lambda\) 想关的 \(Segre\) 特征. 注意到 \(s_1(A,\lambda)\) 是 \(\lambda\) 作为 \(A\) 的特征值的指数,而 \(s_{w_1}(A,\lambda)\) 是 \(A\) 的以 \(\lambda\) 为特征值的最小的 Jordan 块的阶. 如矩阵 \ref{equ888} 的与零这个特征值相关的 Segre 特征是 \(3,3,2,2,2,1\), \(s_1(J,0)=3\) 以及 \(s_6(J,0)=1\). 如果已知 Segre 特征,那么 Weyr 特征就容易得出,反之亦然.

应该知道什么

每个复矩阵都与一个本质上唯一的 Jordan 矩阵相似

Weyr 特征与 Segre 特征及其元素代表的意义

你可能感兴趣的:(jordan标准,相似)