矩阵论(补充知识):特征多项式的展开式

国内线性代数教材上关于n阶矩阵 A A A的特征多项式的系数只讲了常数项、n-1次项和n次项的,分别为 ( − 1 ) n d e t ( A ) , − t r ( A ) , 1 (-1)^ndet(A),-tr(A),1 (1)ndet(A),tr(A),1。一直很好奇其他项的系数是什么样的。查资料知有如下定理:

  • 定理:设 A ∈ C n × n A\in C^{n\times n} ACn×n,则 A A A的特征多项式 d e t ( λ I − A ) = λ n + a 1 λ n − 1 + a 2 λ n − 2 + . . . + a n − 1 λ + a n det(\lambda I-A)=\lambda^n+a_1\lambda^{n-1}+a_2\lambda^{n-2}+...+a_{n-1}\lambda+a_n det(λIA)=λn+a1λn1+a2λn2+...+an1λ+an,其中 n − k n-k nk次项的系数 a k = ( − 1 ) k p k a_k=(-1)^kp_k ak=(1)kpk p k p_k pk A A A的全部 k k k阶主子式之和

其中,主子式的定义如下:

  • 定义:主子式:设 A = ( a i j ) n × n A=(a_{ij})_{n\times n} A=(aij)n×n 1 ⩽ i 1 < i 2 < ⋯ < i k ⩽ n 1\leqslant i_1\lt i_2\lt \cdots \lt i_k\leqslant n 1i1<i2<<ikn,称 A ( i 1 i 2 ⋯ i k i 1 i 2 ⋯ i k ) = [ a i 1 i 1 a i 1 i 2 ⋯ a i 1 i k a i 2 i 1 a i 2 i 2 ⋯ a i 2 i k ⋯ ⋯ ⋯ ⋯ a i k i 1 a i k i 2 ⋯ a i k i k ] A\begin{pmatrix}i_1&i_2&\cdots&i_k\\i_1&i_2&\cdots&i_k\end{pmatrix}=\begin{bmatrix}a_{i_1i_1}&a_{i_1i_2}&\cdots&a_{i_1i_k}\\a_{i_2i_1}&a_{i_2i_2}&\cdots&a_{i_2i_k}\\\cdots&\cdots&\cdots&\cdots\\a_{i_ki_1}&a_{i_ki_2}&\cdots&a_{i_ki_k}\end{bmatrix} A(i1i1i2i2ikik)=ai1i1ai2i1aiki1ai1i2ai2i2aiki2ai1ikai2ikaikik为A的一个k阶主子矩阵,其行列式为A的k阶主子式
    【注】主子式的一个重要特点是取 A A A中的哪几行,就得对应地取 A A A中的哪几列,这样行列相交处的元素取出来才是一个主子式。例如 A A A的一阶主子式有n个,均为 A A A的主对角线上的元素, A A A n n n阶主子式只有1个,为 d e t ( A ) det(A) det(A)

知道这个定理,应用是没问题的,但要知道怎么证,就有点麻烦了。用google搜了半天,没找到一个既正确又容易看懂的证明,最后没想到用百度搜到了几个国内学者的证明,比较简明易懂。下面用两种方法证明该定理。

(这里补充一个显而易见的推论)

  • 推论:设 A ∈ C n × n A\in C^{n\times n} ACn×n,则 d e t ( λ I + A ) = λ n + p 1 λ n − 1 + p 2 λ n − 2 + . . . + p n − 1 λ + p n det(\lambda I+A)=\lambda^n+p_1\lambda^{n-1}+p_2\lambda^{n-2}+...+p_{n-1}\lambda+p_n det(λI+A)=λn+p1λn1+p2λn2+...+pn1λ+pn,其中 n − k n-k nk次项的系数 p k p_k pk A A A的全部 k k k阶主子式之和
    证明:
    由上述定理可得, d e t ( λ I + A ) = d e t ( λ I − ( − A ) ) = λ n + a 1 λ n − 1 + a 2 λ n − 2 + . . . + a n − 1 λ + a n = λ n + ( − 1 ) 1 ( − 1 ) 1 p 1 λ n − 1 + ( − 1 ) 2 ( − 1 ) 2 p 2 λ n − 2 + . . . + ( − 1 ) n − 1 ( − 1 ) n − 1 p n − 1 λ + a n = λ n + p 1 λ n − 1 + p 2 λ n − 2 + . . . + p n − 1 λ + p n \begin{aligned}det(\lambda I +A)&=det(\lambda I-(-A))\\&=\lambda^n+a_1\lambda^{n-1}+a_2\lambda^{n-2}+...+a_{n-1}\lambda+a_n\\&=\lambda^n+(-1)^1(-1)^1p_1\lambda^{n-1}+(-1)^2(-1)^2p_2\lambda^{n-2}+...+(-1)^{n-1}(-1)^{n-1}p_{n-1}\lambda+a_n\\&=\lambda^n+p_1\lambda^{n-1}+p_2\lambda^{n-2}+...+p_{n-1}\lambda+p_n\end{aligned} det(λI+A)=det(λI(A))=λn+a1λn1+a2λn2+...+an1λ+an=λn+(1)1(1)1p1λn1+(1)2(1)2p2λn2+...+(1)n1(1)n1pn1λ+an=λn+p1λn1+p2λn2+...+pn1λ+pn其中, a k a_k ak − A -A A的全部 k k k阶主子式之和的 ( − 1 ) k (-1)^k (1)k倍。

方法1

  • 定义:设 A ∈ C n × n A\in C^{n\times n} ACn×n,固定 − A -A A的某 k k k列元素不动,其他列上对角线位置元素填 λ \lambda λ,非对角线位置元素填 0 0 0,这样得到的矩阵的行列式称为 A A A的一个 n − k n-k nk列正规代换式。
    例:图中是 A A A的一个 2 2 2列正规代换式,其中 − A -A A的第2列和第 n n n列被代换了,而其他列均不变。
    矩阵论(补充知识):特征多项式的展开式_第1张图片
    接下来我们通过行列式暴力展开的方式(差不多就是暴力展开吧)来证明定理:
    首先,为了方便,我们将 A A A的全部 k k k阶主子式按照任意指定的一种顺序排列。设 A A A k k k阶主子式有 N ( k ) N(k) N(k)个,显然 N ( k ) = C n k N(k)=C_n^k N(k)=Cnk,将它们记为 M ( k , 1 ) , M ( k , 2 ) , . . . , M ( k , N ( k ) ) M(k,1),M(k,2),...,M(k,N(k)) M(k,1),M(k,2),...,M(k,N(k))。接下来,我们将 A A A n − k n-k nk列正规代换式与 A A A k k k阶主子式对应起来,对应方式为:设 A A A的某 n − k n-k nk列正规代换式是将 − A -A A的第 i 1 < i 2 < . . . < i k i_1i1<i2<...<ik列保持不变,而将其余列进行代换得到的,那么该正规代换式对应的主子式为 A ( i 1 i 2 ⋯ i k i 1 i 2 ⋯ i k ) A\begin{pmatrix}i_1&i_2&\cdots&i_k\\i_1&i_2&\cdots&i_k\end{pmatrix} A(i1i1i2i2ikik)即取 A A A的第 i 1 < i 2 < . . . < i k i_1i1<i2<...<ik行和相应列的交叉位置上的元素构成的行列式。显然该对应关系是一一对应。于是,针对 A A A k k k阶主子式的一个排列 M ( k , 1 ) , M ( k , 2 ) , . . . , M ( k , N ( k ) ) M(k,1),M(k,2),...,M(k,N(k)) M(k,1),M(k,2),...,M(k,N(k)),我们根据上述的对应关系,可以得到 A A A n − k n-k nk列正规代换式的一个排列,记为 A ( n − k , 1 ) , A ( n − k , 2 ) , . . . , A ( n − k , N ( k ) ) A(n-k,1),A(n-k,2),...,A(n-k,N(k)) A(nk,1),A(nk,2),...,A(nk,N(k))。并且,如果我们将正规代换式按照被代换的列进行展开,就能得到如下关系: A ( n − k , i ) = ( − 1 ) k λ n − k M ( k , i ) , i = 1 , 2 , . . . , N ( k ) A(n-k,i)=(-1)^k\lambda^{n-k}M(k,i),i=1,2,...,N(k) A(nk,i)=(1)kλnkM(k,i),i=1,2,...,N(k)例如,对于上面举的 2 2 2列正规代换式的例子,先按照第2列展开,再按照最后一列展开,即可发现其与相对应的主子式之间的关系。
    接下来,利用行列式的性质对特征多项式进行暴力展开: d e t ( λ I − A ) = ∣ λ − a 11 0 − a 12 ⋯ 0 − a 1 n 0 − a 21 λ − a 22 ⋯ 0 − a 2 n ⋮ ⋮ ⋱ ⋮ 0 − a n 1 0 − a n 2 ⋯ λ − a n n ∣ \begin{aligned}det(\lambda I-A)&=\begin{vmatrix}\lambda-a_{11}&0-a_{12}&\cdots&0-a_{1n}\\0-a_{21}&\lambda-a_{22}&\cdots&0-a_{2n}\\\vdots&\vdots&\ddots&\vdots\\0-a_{n1}&0-a_{n2}&\cdots&\lambda-a_{nn}\end{vmatrix}\end{aligned} det(λIA)=λa110a210an10a12λa220an20a1n0a2nλann上述行列式的每个元素都是两个元素相减的形式,利用行列式的加法性质,将该行列式的每一列展开,最终将得到 2 n 2^n 2n个行列式( d e t ( λ I − A ) det(\lambda I-A) det(λIA)有n列,每展开一列,行列式的总数就翻倍)。注意,这 2 n 2^n 2n个行列式均具备如下特征:任取其中一列,例如第 i i i列,则只有两种可能,即取出来的要么是 − A -A A的第 i i i列,要么满足第 i i i个元素为 λ \lambda λ,而该列的其他元素均为零。例如下述行列式就在这 2 n 2^n 2n个行列式中: ∣ − a 11 0 ⋯ − a 1 , n − 1 0 − a 21 λ ⋯ − a 2 , n − 1 0 ⋮ ⋮ ⋱ ⋮ ⋮ − a n 1 0 ⋯ − a n , n − 1 λ ∣ \begin{vmatrix}-a_{11}&0&\cdots&-a_{1,n-1}&0\\-a_{21}&\lambda&\cdots&-a_{2,n-1}&0\\\vdots&\vdots&\ddots&\vdots&\vdots\\-a_{n1}&0&\cdots&-a_{n,n-1}&\lambda\end{vmatrix} a11a21an10λ0a1,n1a2,n1an,n100λ这不就是 A A A的正规代换式吗?举个 n = 3 n=3 n=3的例子: ∣ λ − a 11 0 − a 12 0 − a 13 0 − a 21 λ − a 22 0 − a 23 0 − a 31 0 − a 32 λ − a 33 ∣ = ∣ λ 0 − a 12 0 − a 13 0 λ − a 22 0 − a 23 0 0 − a 32 λ − a 33 ∣ + ∣ − a 11 0 − a 12 0 − a 13 − a 21 λ − a 22 0 − a 23 − a 31 0 − a 32 λ − a 33 ∣ = ∣ λ 0 0 − a 13 0 λ 0 − a 23 0 0 λ − a 33 ∣ + ∣ λ − a 12 0 − a 13 0 − a 22 0 − a 23 0 − a 32 λ − a 33 ∣ + ∣ − a 11 0 0 − a 13 − a 21 λ 0 − a 23 − a 31 0 λ − a 33 ∣ + ∣ − a 11 − a 12 0 − a 13 − a 21 − a 22 0 − a 23 − a 31 − a 32 λ − a 33 ∣ = ∣ λ 0 0 0 λ 0 0 0 λ ∣ + ∣ λ 0 − a 13 0 λ − a 23 0 0 − a 33 ∣ + ∣ λ − a 12 0 0 − a 22 0 0 − a 32 λ ∣ + ∣ λ − a 12 − a 13 0 − a 22 − a 23 0 − a 32 − a 33 ∣ + ∣ − a 11 0 0 − a 21 λ 0 − a 31 0 λ ∣ + ∣ − a 11 0 − a 13 − a 21 λ − a 23 − a 31 0 − a 33 ∣ + ∣ − a 11 − a 12 0 − a 21 − a 22 0 − a 31 − a 32 λ ∣ + ∣ − a 11 − a 12 − a 13 − a 21 − a 22 − a 23 − a 31 − a 32 − a 33 ∣ \begin{aligned}\begin{vmatrix}\lambda-a_{11}&0-a_{12}&0-a_{13}\\0-a_{21}&\lambda-a_{22}&0-a_{23}\\0-a_{31}&0-a_{32}&\lambda-a_{33}\end{vmatrix}&=\begin{vmatrix}\lambda&0-a_{12}&0-a_{13}\\0&\lambda-a_{22}&0-a_{23}\\0&0-a_{32}&\lambda-a_{33}\end{vmatrix}+\begin{vmatrix}-a_{11}&0-a_{12}&0-a_{13}\\-a_{21}&\lambda-a_{22}&0-a_{23}\\-a_{31}&0-a_{32}&\lambda-a_{33}\end{vmatrix}\\&=\begin{vmatrix}\lambda&0&0-a_{13}\\0&\lambda&0-a_{23}\\0&0&\lambda-a_{33}\end{vmatrix}+\begin{vmatrix}\lambda&-a_{12}&0-a_{13}\\0&-a_{22}&0-a_{23}\\0&-a_{32}&\lambda-a_{33}\end{vmatrix}+\begin{vmatrix}-a_{11}&0&0-a_{13}\\-a_{21}&\lambda&0-a_{23}\\-a_{31}&0&\lambda-a_{33}\end{vmatrix}\\&+\begin{vmatrix}-a_{11}&-a_{12}&0-a_{13}\\-a_{21}&-a_{22}&0-a_{23}\\-a_{31}&-a_{32}&\lambda-a_{33}\end{vmatrix}\\&=\begin{vmatrix}\lambda&0&0\\0&\lambda&0\\0&0&\lambda\end{vmatrix}+\begin{vmatrix}\lambda&0&-a_{13}\\0&\lambda&-a_{23}\\0&0&-a_{33}\end{vmatrix}+\begin{vmatrix}\lambda&-a_{12}&0\\0&-a_{22}&0\\0&-a_{32}&\lambda\end{vmatrix}\\&+\begin{vmatrix}\lambda&-a_{12}&-a_{13}\\0&-a_{22}&-a_{23}\\0&-a_{32}&-a_{33}\end{vmatrix}+\begin{vmatrix}-a_{11}&0&0\\-a_{21}&\lambda&0\\-a_{31}&0&\lambda\end{vmatrix}+\begin{vmatrix}-a_{11}&0&-a_{13}\\-a_{21}&\lambda&-a_{23}\\-a_{31}&0&-a_{33}\end{vmatrix}\\&+\begin{vmatrix}-a_{11}&-a_{12}&0\\-a_{21}&-a_{22}&0\\-a_{31}&-a_{32}&\lambda\end{vmatrix}+\begin{vmatrix}-a_{11}&-a_{12}&-a_{13}\\-a_{21}&-a_{22}&-a_{23}\\-a_{31}&-a_{32}&-a_{33}\end{vmatrix}\end{aligned} λa110a210a310a12λa220a320a130a23λa33=λ000a12λa220a320a130a23λa33+a11a21a310a12λa220a320a130a23λa33=λ000λ00a130a23λa33+λ00a12a22a320a130a23λa33+a11a21a310λ00a130a23λa33+a11a21a31a12a22a320a130a23λa33=λ000λ000λ+λ000λ0a13a23a33+λ00a12a22a3200λ+λ00a12a22a32a13a23a33+a11a21a310λ000λ+a11a21a310λ0a13a23a33+a11a21a31a12a22a3200λ+a11a21a31a12a22a32a13a23a33
    可见,我们可以通过行列式的加法性质,将特征多项式展开成 A A A的全部正规代换式之和。于是有 d e t ( λ I − A ) = A ( n , 1 ) + A ( n − 1 , 1 ) + A ( n − 1 , 2 ) + . . + A ( n − 1 , n ) + A ( n − 2 , 1 ) + A ( n − 2 , 2 ) + . . . + A ( n − 2 , N ( 2 ) ) + . . . + A ( 1 , 1 ) + A ( 1 , 2 ) + . . . + A ( 1 , n ) + A ( 0 , 1 ) = λ n + ( − 1 ) 1 ( M ( 1 , 1 ) + M ( 1 , 2 ) + . . + M ( 1 , n ) ) λ n − 1 + ( − 1 ) 2 ( M ( 2 , 1 ) + M ( 2 , 2 ) + . . . + M ( 2 , N ( 2 ) ) ) λ n − 2 + . . . + ( − 1 ) n − 1 ( M ( n − 1 , 1 ) + M ( n − 1 , 2 ) + . . . + M ( n − 1 , n ) ) λ + ( − 1 ) n d e t ( A ) \begin{aligned}det(\lambda I-A)&=A(n,1)+A(n-1,1)+A(n-1,2)+..+A(n-1,n)\\&+A(n-2,1)+A(n-2,2)+...+A(n-2,N(2))\\&+...+A(1,1)+A(1,2)+...+A(1,n)+A(0,1)\\&=\lambda^n+(-1)^1(M(1,1)+M(1,2)+..+M(1,n))\lambda^{n-1}\\&+(-1)^2(M(2,1)+M(2,2)+...+M(2,N(2)))\lambda^{n-2}\\&+...+(-1)^{n-1}(M(n-1,1)+M(n-1,2)+...+M(n-1,n))\lambda+(-1)^ndet(A)\end{aligned} det(λIA)=A(n,1)+A(n1,1)+A(n1,2)+..+A(n1,n)+A(n2,1)+A(n2,2)+...+A(n2,N(2))+...+A(1,1)+A(1,2)+...+A(1,n)+A(0,1)=λn+(1)1(M(1,1)+M(1,2)+..+M(1,n))λn1+(1)2(M(2,1)+M(2,2)+...+M(2,N(2)))λn2+...+(1)n1(M(n1,1)+M(n1,2)+...+M(n1,n))λ+(1)ndet(A)这就证明了 λ n − k \lambda^{n-k} λnk的系数为 ( − 1 ) k p k (-1)^kp_k (1)kpk,其中 p k = ∑ i = 1 N ( k ) M ( k , i ) p_k=\sum_{i=1}^{N(k)}M(k,i) pk=i=1N(k)M(k,i) A A A的全部 k k k阶主子式之和。

方法2

方法2是利用复合阵(compound matrix)的性质去证明的,但由于复合阵的性质本身具有一定的复杂性,所以有点大材小用的感觉。。。感兴趣的同学可以参考下面的参考文献2,以及维基百科。

参考文献:
1、王莉.n阶矩阵的特征多项式的一般项系数[J].鞍山师范学院学报,1988(04):4-6.
(链接:http://xueshu.baidu.com/usercenter/paper/show?paperid=045718b9e25184a576eb98aa8c8e44ca&site=xueshu_se)
2、李巍,胡方景.关于矩阵的特征多项式的展开式[J].青海师专学报,2001(06):8-10.
(链接:https://www.ixueshu.com/document/87cdb46781e796a8318947a18e7f9386.html)

你可能感兴趣的:(机器学习的数学基础)