[问题2014S06] 解答 (本解答由巴闻嘉同学给出)
设特征多项式 \[f(x)=\det(xI_V-\varphi)=x^n+a_{n-1}x^{n-1}+\cdots+a_1x+a_0,\] 则由 Cayley-Hamilton 定理可得 \[\varphi^n+a_{n-1}\varphi^{n-1}+\cdots+a_1\varphi+a_0I_V=0.\] 特别地, 上式作用在向量 \(\alpha\) 上可得 \[\varphi^n(\alpha)=-a_{n-1}\varphi^{n-1}(\alpha)-\cdots-a_1\varphi(\alpha)-a_0(\alpha). \cdots\cdots(1)\] 通过数学归纳法不难证明: 对任意的 \(k\geq n\), \(\varphi^k(\alpha)\) 都是 \(\varphi^{n-1}(\alpha)\), \(\cdots\), \(\varphi(\alpha)\), \(\alpha\) 的线性组合, 从而 \[V=L(\alpha,\varphi(\alpha),\cdots)=L(\alpha,\varphi(\alpha),\cdots,\varphi^{n-1}(\alpha)).\] 因为 \(\dim V=n\), 所以 \(\{\alpha,\varphi(\alpha),\cdots,\varphi^{n-1}(\alpha))\}\) 是 \(V\) 的一组基. 由 (1) 式可知 \(\varphi\) 在基 \(\{\alpha,\varphi(\alpha),\cdots,\varphi^{n-1}(\alpha))\}\) 下的表示矩阵为:
\[A=\begin{bmatrix} 0 & 0 & \cdots & 0 & -a_0 \\ 1 & 0 & \cdots & 0 & -a_1 \\ 0 & 1 & \cdots & 0 & -a_2 \\ \vdots & \vdots & \vdots & \vdots & \vdots \\ 0 & 0 & \cdots & 1 & -a_{n-1} \end{bmatrix}, \cdots\cdots(2)\]
即为特征多项式 \(f(x)\) 相伴的友阵 (见复旦高代教材第 250 页复习题 15).
由复旦高代教材第 265 页引理 7.4.1 知 \(\lambda I-A\) 相抵于 \(\mathrm{diag}\{1,\cdots,1,f(\lambda)\}\). 由条件不妨设 \(f(x)=g(x)h(x)\), 其中 \((g(x),h(x))=1\). 由复旦高代教材第 261 页习题 7.2.4 或第 271 页引理 7.6.2 的证明知 \(\mathrm{diag}\{1,\cdots,1,f(\lambda)\}\) 相抵于 \(\mathrm{diag}\{1,\cdots,1,g(\lambda),h(\lambda)\}\). 设 \(B=\mathrm{diag}\{C,D\}\) 为分块对角阵, 其中 \(p\) 阶矩阵 \(C\) 是 \(g(x)\) 的友阵, \(q\) 阶矩阵 \(D\) 是 \(h(x)\) 的友阵. 再次由复旦高代教材第 265 页引理 7.4.1 知 \(\lambda I-B\) 相抵于 \(\mathrm{diag}\{1,\cdots,1,g(\lambda);1,\cdots,1,h(\lambda)\}\). 由复旦高代教材第 265 页引理 7.4.2 知 \(\lambda I-A\) 相抵于 \(\lambda I-B\), 从而由复旦高代教材第 255 页定理 7.1.2 知 \(A\) 相似于 \(B=\mathrm{diag}\{C,D\}\).
因为 \(A\) 是 \(\varphi\) 在某组基下的表示矩阵, 于是存在另一组基 \(\{\beta_1,\cdots,\beta_p;\gamma_1,\cdots,\gamma_q\}\), 使得 \(\varphi\) 在这组基下的表示矩阵为 \(B=\mathrm{diag}\{C,D\}\). 令 \(\beta=\beta_1\), \(\gamma=\gamma_1\). 由于 \(C,D\) 也是形如 (2) 式那样的友阵, 不难验证 \[L(\beta,\varphi(\beta),\cdots)=L(\beta_1,\cdots,\beta_p);\,\,L(\gamma,\varphi(\gamma),\cdots)=L(\gamma_1,\cdots,\gamma_q),\] 因此 \[V=L(\beta_1,\cdots,\beta_p)\oplus L(\gamma_1,\cdots,\gamma_q)=L(\beta,\varphi(\beta),\cdots)\oplus L(\gamma,\varphi(\gamma),\cdots). \quad\Box\]