定理: f = x T A x f = x^TAx f=xTAx 正定的充要条件是 A A A 的全部顺序主子式大于零。
必要性:即 f = x T A x f = x^TAx f=xTAx 正定 ⇒ \Rightarrow ⇒ A A A 的全部顺序主子式大于零。
首先,由于 f = x T A x f = x^TAx f=xTAx 正定,即对称矩阵 A A A 是正定矩阵(有人会问为什么 A A A 是对称矩阵,这是研究二次型的必然要求,将二次多项式转换成 f = x T A x f = x^TAx f=xTAx的形式的时候,交叉项的系数可以全部是对称的),由于实对称矩阵必可正交对角化,所以矩阵 A A A 可以表示为:
A = Q T [ λ 1 ⋯ 0 ⋯ ⋮ λ 2 0 ⋯ 0 ⋮ ⋱ ⋯ 0 λ n ] Q A = Q^T \begin{bmatrix} \lambda_1 & \cdots& 0 & \cdots& \\ \vdots&\lambda_2&0 &\cdots& \\ 0 & & && \\ \vdots&&\ddots &\cdots& \\ 0&& &\lambda_n& \end{bmatrix} Q A=QT λ1⋮0⋮0⋯λ200⋱⋯⋯⋯λn Q
所以 f = x T A x = x T Q T ∧ Q x f = x^TAx = x^TQ^T \wedge Q x f=xTAx=xTQT∧Qx, 令 y = Q x y = Qx y=Qx, f = λ 1 y 1 2 + ⋯ + λ n y n 2 f = \lambda_1 y_1^2+\cdots+\lambda_n y_n^2 f=λ1y12+⋯+λnyn2,对任意的 y = ( y 1 , . . . , y n ) y = (y_1,...,y_n) y=(y1,...,yn),都有 f f f 大于 0,由于 Q Q Q是正交矩阵,所以 x = ( x 1 , . . . , x n ) x= (x_1, ..., x_n) x=(x1,...,xn) 能够铺满整个n维空间,则 y = Q x = ( y 1 , . . . , y n ) y = Qx = (y_1,...,y_n) y=Qx=(y1,...,yn) 也能铺满整个n维空间。所以对任意非零 y y y 都有 f > 0 f >0 f>0 ,取 y i ≠ 0 , y j = 0 ( j ≠ i ) y_i\neq 0,y_j = 0(j\neq i) yi=0,yj=0(j=i),能够得到 λ i y i 2 > 0 \lambda_iy_i^2>0 λiyi2>0,从而 λ i > 0 \lambda_i>0 λi>0,即正定矩阵的所有特征值全大于0,自然,行列式的值 ∣ A ∣ = λ 1 λ 2 . . . λ n > 0 |A|=\lambda_1\lambda_2...\lambda_n>0 ∣A∣=λ1λ2...λn>0。
记 A k A_k Ak 为 矩阵 A A A 左上角的 k k k 阶矩阵, k = 1 , 2 , ⋯ , n − 1 k = 1, 2, \cdots, n-1 k=1,2,⋯,n−1,由 f = x T A x f = x^TAx f=xTAx 对任意 x ≠ 0 x\neq0 x=0 成立,取 x = ( x 1 , x 2 , ⋯ , x k , 0 , ⋯ , 0 ) x=(x_1,x_2,\cdots,x_k,0,\cdots,0) x=(x1,x2,⋯,xk,0,⋯,0),并记 x ′ = ( x 1 , x 2 , ⋯ , x k ) x'=(x_1, x_2, \cdots, x_k) x′=(x1,x2,⋯,xk),则 x T A x = x ′ T A k x ′ > 0 x\ ^TAx = x'\ ^TA_k x'>0 x TAx=x′ TAkx′>0,我们可以得到 A k A_k Ak也是正定矩阵,自然有 ∣ A k ∣ > 0 |A_k|>0 ∣Ak∣>0。从而,我们有正定矩阵 A A A 的顺序主子式全部大于0.
充分性: A A A 的全部顺序主子式大于零 ⇒ \Rightarrow ⇒ f = x T A x f = x^TAx f=xTAx 正定 。
对于 1 阶矩阵,任意1 阶矩阵 A = [ a ] A = [a] A=[a] 的行列式为该矩阵的元素值,该矩阵的顺序主子式只有1个,即 ∣ A ∣ = a |A|=a ∣A∣=a,该矩阵的行列式大于 0 时,自然有对任意 x x x, x T A x = a x 2 > 0 x^TAx = a x^2>0 xTAx=ax2>0 。
假设:对任意的 n - 1 阶矩阵,结论“ A A A 的全部顺序主子式大于零 ⇒ \Rightarrow ⇒ f = x T A x f = x^TAx f=xTAx 正定” 成立。
对于 n 阶矩阵,
x T A x = ( x 1 , x 2 , . . . , x n ) [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ a n 1 a n 2 ⋯ a n n ] ( x 1 x 2 ⋮ x n ) = a 11 x 1 2 + a 12 x 1 x 2 + a 13 x 1 x 3 + ⋯ + a 1 n x 1 x n a 21 x 2 x 1 + a 22 x 2 2 + a 23 x 2 x 3 + ⋯ + a 2 n x 2 x n ⋮ a n 1 x n x 1 + a n 2 x n x 2 + a n 3 x n x 3 + ⋯ + a n n x n 2 \begin{align*} x^TAx &= (x_1,x_2,...,x_n) \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{bmatrix} \left( \begin{array}{rrrr} x_1\\ x_2\\ \vdots \\ x_n \end{array} \right) \\ &= \begin{align*} a_{11}x_1^2 + a_{12}x_1x_2 + a_{13}x_1x_3+\cdots+a_{1n}x_1x_n\\ a_{21}x_2x_1 + a_{22}x_2^2 + a_{23}x_2x_3+\cdots+a_{2n}x_2x_n\\ \vdots \\ a_{n1}x_nx_1 + a_{n2}x_nx_2 + a_{n3}x_nx_3+\cdots + a_{nn}x_n^2 \end{align*} \end{align*} xTAx=(x1,x2,...,xn) a11a21⋮an1a12a22an2⋯⋯⋯a1na2nann x1x2⋮xn =a11x12+a12x1x2+a13x1x3+⋯+a1nx1xna21x2x1+a22x22+a23x2x3+⋯+a2nx2xn⋮an1xnx1+an2xnx2+an3xnx3+⋯+annxn2
将 x T A X x^TAX xTAX 表示为:
x T A x = 1 a 11 ( a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n ) 2 + ∑ i = 2 n ∑ j = 2 n b i j x i x j \begin{align*} x^TAx &= \frac{1}{a_{11}} ( a_{11}x_1 + a_{12}x_2+\cdots+a_{1n}x_n)^2+\sum_{i=2}^n\sum_{j=2}^n b_{ij} x_ix_j \end{align*} xTAx=a111(a11x1+a12x2+⋯+a1nxn)2+i=2∑nj=2∑nbijxixj
其中, b i j = a i j − a 1 i a 1 j a 11 b_{ij}= a_{ij} - \frac{a_{1i}a_{1j}}{a_{11}} bij=aij−a11a1ia1j,由于 A A A 是实对称矩阵,所以 a i j = a j i a_{ij} = a_{ji} aij=aji,所以 b j i = a j i − a 1 j a 1 i a 11 = a i j − a 1 i a 1 j a 11 = b i j b_{ji} = a_{ji} - \frac{a_{1j}a_{1i}}{a_{11}} = a_{ij} - \frac{a_{1i}a_{1j}}{a_{11}} =b_{ij} bji=aji−a11a1ja1i=aij−a11a1ia1j=bij.
∑ i = 2 n ∑ j = 2 n b i j x i x j = ( x 2 , x 3 , ⋯ , x n ) [ b 22 b 23 ⋯ b 2 n b 32 b 33 ⋯ b 3 n ⋮ ⋱ ⋮ b n 2 b n 3 ⋯ b n n ] ( x 2 x 3 ⋮ x n ) \sum_{i=2}^n\sum_{j=2}^n b_{ij} x_ix_j = (x_2, x_3,\cdots,x_n) \begin{bmatrix} b_{22} & b_{23} & \cdots & b_{2n} \\ b_{32} & b_{33} & \cdots & b_{3n} \\ \vdots & & \ddots & \vdots \\ b_{n2} & b_{n3} & \cdots & b_{nn} \end{bmatrix} \begin{pmatrix} x_2\\ x_3\\ \vdots\\ x_n \end{pmatrix} i=2∑nj=2∑nbijxixj=(x2,x3,⋯,xn) b22b32⋮bn2b23b33bn3⋯⋯⋱⋯b2nb3n⋮bnn x2x3⋮xn
记 ∑ i = 2 n ∑ j = 2 n b i j x i x j = x ′ T B x ′ \sum_{i=2}^n\sum_{j=2}^n b_{ij} x_ix_j = x'^TBx' ∑i=2n∑j=2nbijxixj=x′TBx′,则 B 也是实对称矩阵。
记矩阵 A A A 左上角的 k 阶矩阵为 A k , k = 2 , 3 , ⋯ , n A_k,k=2,3,\cdots,n Ak,k=2,3,⋯,n,则
∣ A k ∣ = ∣ a 11 a 12 a 13 ⋯ a 1 k a 21 a 22 a 23 ⋯ a 2 k a 31 a 32 a 33 ⋯ a 3 k ⋮ ⋱ ⋮ a k 1 a k 2 a k 3 ⋯ a k k ∣ = ∣ a 11 a 12 a 13 ⋯ a 1 k 0 a 22 − a 12 a 21 a 11 a 23 − a 13 a 21 a 11 ⋯ a 2 k − a 1 k a 21 a 11 0 a 32 − a 12 a 31 a 11 a 33 − a 13 a 31 a 11 ⋯ a 3 k − a 1 k a 31 a 11 ⋮ ⋱ 0 a k 2 − a 12 a k 1 a 11 a k 3 − a 13 a k 1 a 11 ⋯ a k k − a 1 k a k 1 a 11 ∣ = ∣ a 11 a 12 a 13 ⋯ a 1 k 0 b 22 b 23 ⋯ b 2 k 0 b 32 b 33 ⋯ b 3 k ⋮ ⋱ 0 b k 2 b k 3 ⋯ b k k ∣ = a 11 ∣ b 22 b 23 ⋯ b 2 k b 32 b 33 ⋯ b 3 k ⋮ ⋱ b k 2 b k 3 ⋯ b k k ∣ \begin{align*} |A_k| &= \begin{vmatrix} a_{11} & a_{12} & a_{13} & \cdots & a_{1k}\\ a_{21} & a_{22} & a_{23} & \cdots & a_{2k}\\ a_{31} & a_{32} & a_{33} & \cdots & a_{3k}\\ \vdots & & & \ddots & \vdots \\ a_{k1} & a_{k2} & a_{k3} & \cdots & a_{kk} \end{vmatrix}\\ & = \begin{vmatrix} a_{11} & a_{12} & a_{13} & \cdots & a_{1k}\\ 0 & a_{22}-\frac{a_{12}a_{21}}{a_{11}} & a_{23} -\frac{a_{13}a_{21}}{a_{11}}& \cdots & a_{2k}-\frac{a_{1k}a_{21}}{a_{11}}\\ 0 & a_{32}-\frac{a_{12}a_{31}}{a_{11}} & a_{33} -\frac{a_{13}a_{31}}{a_{11}}& \cdots & a_{3k}-\frac{a_{1k}a_{31}}{a_{11}}\\ \vdots & & & \ddots & \\ 0 & a_{k2}-\frac{a_{12}a_{k1}}{a_{11}} & a_{k3} -\frac{a_{13}a_{k1}}{a_{11}}& \cdots & a_{kk}-\frac{a_{1k}a_{k1}}{a_{11}}\\ \end{vmatrix}\\ &= \begin{vmatrix} a_{11} & a_{12} & a_{13} & \cdots & a_{1k}\\ 0 & b_{22} & b_{23} & \cdots & b_{2k} \\ 0 & b_{32} & b_{33} & \cdots & b_{3k} \\ \vdots & & & \ddots & \\ 0 & b_{k2} & b_{k3} & \cdots & b_{kk}\\ \end{vmatrix} \\ &= a_{11}\begin{vmatrix} b_{22} & b_{23} & \cdots & b_{2k} \\ b_{32} & b_{33} & \cdots & b_{3k} \\ \vdots & & \ddots & \\ b_{k2} & b_{k3} & \cdots & b_{kk}\\ \end{vmatrix} \\ \end{align*} ∣Ak∣= a11a21a31⋮ak1a12a22a32ak2a13a23a33ak3⋯⋯⋯⋱⋯a1ka2ka3k⋮akk = a1100⋮0a12a22−a11a12a21a32−a11a12a31ak2−a11a12ak1a13a23−a11a13a21a33−a11a13a31ak3−a11a13ak1⋯⋯⋯⋱⋯a1ka2k−a11a1ka21a3k−a11a1ka31akk−a11a1kak1 = a1100⋮0a12b22b32bk2a13b23b33bk3⋯⋯⋯⋱⋯a1kb2kb3kbkk =a11 b22b32⋮bk2b23b33bk3⋯⋯⋱⋯b2kb3kbkk
由 A A A 的全部顺序主子式大于0, 有 a 11 > 0 , ∣ A k ∣ > 0 a_{11}>0, |A_k|>0 a11>0,∣Ak∣>0,可得 ∣ B k ∣ = ∣ A k ∣ a 11 > 0 |B_k| = \frac{|A_k|}{a_{11}}>0 ∣Bk∣=a11∣Ak∣>0
由此可得实对称矩阵 B B B 的所有顺序主子式大于0。
根据假设,对于任意n-1阶矩阵,全部顺序主子式大于0能够得到该矩阵正定,所以 ∑ i = 2 n ∑ j = 2 n b i j x i x j = x ′ T B x ′ \sum_{i=2}^n\sum_{j=2}^n b_{ij} x_ix_j = x'^TBx' ∑i=2n∑j=2nbijxixj=x′TBx′ 对于任意 x ′ ≠ 0 x'\neq 0 x′=0,都大于0. 则:
x T A x = 1 a 11 ( a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n ) 2 + ∑ i = 2 n ∑ j = 2 n b i j x i x j > 0 \begin{align*} x^TAx &= \frac{1}{a_{11}} ( a_{11}x_1 + a_{12}x_2+\cdots+a_{1n}x_n)^2+\sum_{i=2}^n\sum_{j=2}^n b_{ij} x_ix_j \\ &>0 \end{align*} xTAx=a111(a11x1+a12x2+⋯+a1nxn)2+i=2∑nj=2∑nbijxixj>0
由此我们可以得到,在假设对于n-1阶矩阵结论成立的情况下,能够推出对于n阶矩阵结论仍然成立,又对于1阶矩阵结论显然是成立的。所以我们就能得到:
A A A 的全部顺序主子式大于零 ⇒ \Rightarrow ⇒ f = x T A x f = x^TAx f=xTAx 正定 。
必要性和充分性都得到了证明,所以我们就证明了最开始的定理。