简单推导:关于矩阵主子式的几点性质

1.名词介绍:

特征多项式:在数域P上的某个n*n方阵A,则行列式|\lambda E-A |即为其特征多项式,简记为A\left ( \lambda \right );

逆序数:1,2,...n的某个排序j_1,j_2,...j_n相对自然序列相反的个数;记为:\tau(j_1j_2\hdots j_n)

主子式:某个行列式的部分列和部分行:行号和列号一样交线处的元素按相对位置不变交出来的方阵的行列式:

按照子阵的表达方式:\begin{pmatrix} r_1& r_2&...r_k\\ c_1& c_2 &...c_k\end{pmatrix} \quad即行列交出来的子阵,其行列式记为det \begin{pmatrix} r_1 & r_2&r_3 \\ c_1 & c_2 &c_3\end{pmatrix} \quad;

2.下面介绍两个引理:

引理1:行列式乘积表达式:

\begin{vmatrix} a_{11} & a_{12} &...&a_{1n} \\ a_{21} & a_{22} &...&a_{2n} \\\vdots &\vdots &&\vdots \\a_{n1}&a_{n2}&\hdots&a_{nn}\end{vmatrix} \quad=\sum_{j_1j_2j_3\hdots j_n} (-1)^{\tau(j_1j_2\hdots j_n)}a_{1j_1}a_{2j_2}\hdots a_{nj_n}

这个引理的证明可参看《高等代数》王萼芳,石生萌 著,第四版的56页

引理2:行列式求导:

对于某个行列式求导等于对其每一行求导并且将其还原到原矩阵并求和:

也即:

{ \begin{vmatrix} a_{11} & a_{12} &\hdots&a_{1n}\\a_{21} & a_{22} &\hdots&a_{2n} \\ \vdots & \vdots&& \vdots\\ a_{n1} & a_{n2}&\hdots&a_{nn}\end{vmatrix} \quad}'= \begin{vmatrix} {a_{11}}' & {a_{12}}' &\hdots&{a_{1n}}'\\a_{21} & a_{22} &\hdots&a_{2n} \\ \vdots & \vdots&& \vdots\\ a_{n1} & a_{n2}&\hdots&a_{nn}\end{vmatrix} \quad+\begin{vmatrix} a_{11} & a_{12}&\hdots&a_{1n}\\{a_{21}}' & {a_{22}}' &\hdots&{a_{2n}}' \\ \vdots & \vdots&& \vdots\\ a_{n1} & a_{n2}&\hdots&a_{nn}\end{vmatrix} \quad+\begin{vmatrix} a_{11} & a_{12} &\hdots&a_{1n}\\a_{21} & a_{22} &\hdots&a_{2n} \\ \vdots & \vdots&& \vdots\\ {a_{n1}}' & {a_{n2}}'&\hdots&{a_{nn}}'\end{vmatrix} \quad

这个引理很显然,利用引理1,和乘积求导的公式,并把每次被求导的元素按照位置不变的带回原来的行列式就能得到引理2

定理1:

对于一个实数域上n阶方阵A,其特征多项式A\left ( \lambda \right )被表示为:

f(\lambda)=\lambda^{n}+d_{n-1}\lambda^{n-1}+\hdots+d_1\lambda+d_0,其中d_0,d_1,\hdots,d_{n-1}\in \mathbb{R}

d_{k}=(-1)^{n-k}\sum_{1\leq j_1<j_2<\hdots<j_k\leq n}det\begin{pmatrix} j_1 & j_2&\hdots&j_k \\ j_1 & j_2&\hdots&j_k \end{pmatrix} \quad

证明:利用多项式麦克劳林展开式可以得到以下关系:

f(0)=d_0;{f}'(0)=d_1\hdots f^{(n-1)}(0)=(n-1)!d_{n-1}

利用行列式求导法:

{f}'\left ( \lambda \right )= {\begin{vmatrix} \1 & 0&\hdots&0\\ -a_{21}&\lambda-a_{22}&\hdots&-a_{2n} \\ \vdots&\vdots&&\vdots \\-a_{n1}&-a_{n2}&\hdots&\lambda-a_{nn} \end{vmatrix} \quad}_n +{\begin{vmatrix} \lambda-a_{11}&-a_{12}&\hdots&-a_{1n}\\ 0 & 1&\hdots&0 \\ \vdots&\vdots&&\vdots \\-a_{n1}&-a_{n2}&\hdots&\lambda-a_{nn} \end{vmatrix} \quad}_n +\hdots+ +{\begin{vmatrix} \lambda-a_{11}&-a_{12}&\hdots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\hdots&-a_{2n}\\ \vdots&\vdots&&\vdots \\0&0&\hdots&1 \end{vmatrix} \quad}_n

1由于都在主对角线上,按行降阶:

{f}'\left ( \lambda \right )=\sum_{j_1j_2\hdots j_{n-1}}det\begin{pmatrix} j_1 & j_2&\hdots&j_{n-1} \\ j_1 & j_2&\hdots&j_{n-1} \end{pmatrix} \quad\left ( \lambda \right )

{f}'\left ( \lambda \right )表示成了所有n-1阶主子阵的特征多项式之和

{f}'\left ( 0 \right )=\left ( -1\right )^{n-1}\sum_{j_1j_2\hdots j_{n-1}}det\begin{pmatrix} j_1 & j_2&\hdots&j_{n-1} \\ j_1 & j_2&\hdots&j_{n-1} \end{pmatrix} \quad

对于任意一个n-2阶主子阵,一定真包含且只包含在两个n-1阶主子阵中:

\begin{pmatrix} j_1 & j_2&\hdots&j_{n-2} \\ j_1 & j_2&\hdots&j_{n-2} \end{pmatrix} \quad只真包含在\begin{pmatrix} j_1 & j_2 &\hdots&j_{n-2}&j_{n-1}\\j_1 & j_2 &\hdots&j_{n-2}&j_{n-1} \end{pmatrix} \quad

\begin{pmatrix} j_1 & j_2 &\hdots&j_{n-2}&j_{n}\\j_1 & j_2 &\hdots&j_{n-2}&j_{n} \end{pmatrix} \quad中,因此对于{f}''\left ( 0 \right )\left ( -1 \right )^{n-2}要除以2才是d_{2}

依次类推:

\begin{pmatrix} j_1 & j_2 &\hdots&j_{k}\\j_1 & j_2 &\hdots&j_{k} \end{pmatrix} \quad包含且只包含在n-k个k+1阶主子阵中,故\left ( -1 \right )^{k}f^{(n-k)}\left ( 0 \right )要除以\left ( n-k \right )!才是d_{n-k}:1\leq k\leq n-1

定理1证毕;

证明到这里我们可以看到方阵的迹就是这里k取1

利用定理1我们可以得到关于方阵主子式的又一个性质:这在最优化的海森矩阵判断正定性里有部分应用:

定理2:

对于实对称矩阵A是半正定的充分必要条件是A的一切主子式大于等于0:

A=\begin{bmatrix} a_{11} & a_{12} & \hdots& a_{1n}\\ a_{21} & a_{22} & \hdots& a_{2n}\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \hdots& a_{nn} \end{bmatrix} \quad

实对称,取其主子式:A_{k}=\begin{pmatrix} j_{1} & j_{2}&\hdots&j_{k} \\ j_{1} & j_{2}&\hdots&j_{k} \end{pmatrix} \quad,\left (1 \le k \le n,1\le j_{1}<j_{2}<\hdots<j_{k}\le n \right )

则存在一个可逆阵C:s.t. C^{T}AC=\begin{bmatrix} A_{k} & B \\ B^{T} & D_{n-k} \end{bmatrix} \quad其中B,D是除去A_{k}的一定规格的矩阵

事实上:对于A的行与列做对等的第二类初等变换(交换)就可得到该矩阵:

这里运用到一个常用的求实对称矩阵合同变换矩阵的方法:

构造:

M=\begin{bmatrix} A & E_{n} \\ E_{n} & \forall \end{bmatrix} \quad矩阵,这里的\forall表示可以取任意n阶方阵,每次交换两行的同时交换两列:最终的得到A下方E_{n}位置的矩阵就是C:

事实上,这里根据初等矩阵的理论:每次对M做一对对等的初等行变换:相当于给M左乘一个初等阵\begin{bmatrix} P_{n} & O \\ O & E_{n} \end{bmatrix} \quad

结果为:

\begin{bmatrix} P_{n}A & P_{n} \\ E_{n} & \forall \end{bmatrix} \quad在此结果上做一次对等的列变换:等价于右乘一个初等阵:\begin{bmatrix} Q_{n} & O \\ O & E_{n} \end{bmatrix} \quad:结果为:\begin{bmatrix} P_{n}AQ_{n} & P_{n} \\ Q_{n} & \forall \end{bmatrix} \quad

依次类推可得经过n次该变换的矩阵为:

\begin{bmatrix} P_{n}P_{n-1}\hdots P_{1}AQ_{1}Q_{2}\hdots Q_{n} & P_{n}P_{n-1}\hdots P_{1} \\Q_{1}Q_{2}\hdots Q_{n} & \forall \end{bmatrix} \quad

即根据初等矩阵的性质:P_{i}Q_{i}=E;P_{i}=Q_{i}^{T}即可证明经过m次该对等的行列初等变换的A_{m}和A合同;

必要性:

按照交换排列的方法:就比如选择排序,操作M,使得被选中的行列在上或左,得到的A_{m}的前k行k列交出来的矩阵是排序之前的

A_{k},注意这里的A_{m},A_{k}形式相同,表达着不同的含义:前者是m经过m次对等初等行列变换后原本的A位置的矩阵;而A_{k}是原本A矩阵的k阶主子式;

现在证明这个k阶主子阵也是半正定的:

取向量:\left ( x_{1},x_{2},\hdots,x_{k},0,\hdots ,0 \right )_{n}^{T}由于合同变换前后的矩阵A,A_{m}正定性相同,即A_{m}也是半正定的故对于A_{m}分块:

\begin{pmatrix}\underset{\xi}{\rightarrow}^{T}& \underset{0}{\rightarrow}^{T} \end{pmatrix} \quad\begin{bmatrix} A_{k} & \forall_{1} \\ \forall_{2} & \forall_{3} \end{bmatrix} \quad\begin{pmatrix} \underset{\xi}{\rightarrow} \\ \underset{0}{\rightarrow} \end{pmatrix} \quad= \underset{\xi}{\rightarrow}^{T}A_{k}\underset{\xi}{\rightarrow}\ \ge 0

A_{k}也为半正定,故其行列式大于等于零:如若不然则存在负的特征根;注意这个反之不然;

充分性:

因为A的任意主子式都大于或等于0,故考虑A+\epsilon E的正定性:这里\epsilon>0可取任意小

判断正定性的方法其一就是其充要条件:所有顺序主子式都大于等于0,那么这里的A+\epsilon E的任意一个k阶顺序主子式即:

\begin{pmatrix} a_{11}+\epsilon & a_{12}&\hdots &a_{1k} \\ a_{21} & a_{22}+\epsilon& \hdots&a_{2k}\\ \vdots &\vdots&&\vdots\\ a_{k1}&a_{k2}&\hdots&a_{kk}+\epsilon \end{pmatrix} \quad

的展开式为\epsilon^{k}+d_{k-1}\epsilon^{k-1}+\hdots+d_{1}\epsilon+d_{0}(***),而同样考虑A_{k}的特征多项式

\begin{pmatrix} -a_{11}+\lambda & -a_{12}&\hdots &-a_{1k} \\ -a_{21} & -a_{22}+\lambda& \hdots&-a_{2k}\\ \vdots &\vdots&&\vdots\\ -a_{k1}&-a_{k2}&\hdots&-a_{kk}+\lambda \end{pmatrix} \quad

其展开式为

化为首一多项式为:

\lambda^{k}-d_{k-1}\lambda^{k-1}+d_{k-2}\lambda^{k-2}+\hdots+\left ( -1 \right )^{i}d_{k-i}\lambda^{k-i}+\hdots+(-1)^{k}d_{0}

由定理1:

\left ( -1 \right )^{i}d_{k-i}=\left ( -1 \right )^{k-(k-i)}\sum_{1 \le j_{1} \le j_{2} \le \hdots j_{k-i}\le k} det \begin{pmatrix} j_{1}&j_{2}&\hdots j_{k-i} \\ j_{1}&j_{2}&\hdots j_{k-i} \end{pmatrix} \quad

故:

d_{k-i}=\sum_{1 \le j_{1} \le j_{2} \le \hdots j_{k-i}\le k} det \begin{pmatrix} j_{1}&j_{2}&\hdots j_{k-i} \\ j_{1}&j_{2}&\hdots j_{k-i} \end{pmatrix} \quad \ge0

\epsilon^{k}+d_{k-1}\epsilon^{k-1}+\hdots+d_{1}\epsilon+d_{0}\epsilon>0时恒正

即推导出任意阶A+\epsilon E的顺序主子式大于0,即A+\epsilon E正定;

故考虑非零实向量\underset{X}{\rightarrow}=\left ( x_{1},x_{2},\hdots x_{n} \right )^{T}:\underset{X}{\rightarrow}^{T}\left ( A+\epsilon E \right )\underset{X}{\rightarrow}>0对任意\epsilon>0恒成立,然而其一定可以看成

关于\epsilon的有限阶多项式,一定在R上连续,令\epsilon从正向趋于0可得\underset{X}{\rightarrow}^{T}\left ( A\right )\underset{X}{\rightarrow} \ge 0

这就证明了A的半正定性

定理2证毕

你可能感兴趣的:(数理逻辑,线性代数,矩阵)