引理 1: 实对称矩阵的特征值都是实数。
证明:设 A A A 为 n n n 阶实对称阵, λ 0 ∈ C \lambda_0 \in C λ0∈C 是 A A A 的任一特征值, α = ( a 1 , a 2 , ⋯ , a n ) T ∈ C n \alpha = (a_1, a_2, \cdots, a_n)^T \in C^n α=(a1,a2,⋯,an)T∈Cn 是对应的特征向量,即 A α = λ 0 α A\alpha = \lambda_0\alpha Aα=λ0α。上式两边同时左乘 α ‾ \overline \alpha α,即 α \alpha α 的共轭,则有 α ‾ T A α = λ 0 α ‾ T α \overline \alpha ^T A \alpha = \lambda_0 \overline \alpha^T \alpha αTAα=λ0αTα。由于 α \alpha α 是特征向量,所以 α \alpha α非零,故 α ‾ T α = ∣ ∣ α ∣ ∣ > 0 \overline \alpha^T \alpha = ||\alpha||>0 αTα=∣∣α∣∣>0。对于共轭矩阵,有 A B ‾ = A ‾ ⋅ B ‾ \overline{AB} = \overline{A}\cdot \overline{B} AB=A⋅B 注意到 A A A 为实对称阵,所以 A ‾ = A \overline A = A A=A,所以有 α ‾ T A α ‾ = α T A α ‾ \overline{\overline \alpha^T A \alpha} = \alpha^T A \overline \alpha αTAα=αTAα,由于 A A A 是实对称矩阵,显然有 α T A α ‾ = α ‾ T A α \alpha^T A \overline \alpha = \overline \alpha^T A \alpha αTAα=αTAα。由此可得 α ‾ T A α ‾ = α ‾ T A α \overline{\overline \alpha^T A \alpha} = \overline \alpha^T A \alpha αTAα=αTAα,即 α ‾ T A α \overline \alpha ^T A \alpha αTAα 是一个实数。从而, λ 0 = α ‾ T A α α ‾ T α \lambda_0 = \frac{\overline \alpha ^T A \alpha}{\overline\alpha^T \alpha} λ0=αTααTAα 也是实数。
引理2: 设 A A A 为 n n n 阶实对称阵,则 r ( A ) = r ( A 2 ) = r ( A 3 ) = ⋯ r(A) = r(A^2) =r(A^3)=\cdots r(A)=r(A2)=r(A3)=⋯
证明:先证明 r ( A T A ) = r ( A ) r(A^T A) = r(A) r(ATA)=r(A),若 x x x 是 A x = 0 Ax=0 Ax=0 的解,显然 x x x 也是 A T A x = 0 A^TAx=0 ATAx=0 的解;若 x x x 是 A T A x = 0 A^TAx = 0 ATAx=0 的解,两边同乘 x T x^T xT,就有 x T A T A x = 0 x^T A^TAx = 0 xTATAx=0,即 ( A x ) T A x = 0 (Ax)^TAx = 0 (Ax)TAx=0,即 ∣ ∣ A x ∣ ∣ = 0 ||Ax||=0 ∣∣Ax∣∣=0 ,也就是说 A x = 0 Ax=0 Ax=0。由此可以得到 A T A x = 0 A^TAx = 0 ATAx=0 与 A x = 0 Ax=0 Ax=0 是同解的,所以 A T A x = 0 A^TAx = 0 ATAx=0 与 A x = 0 Ax=0 Ax=0 维度相同,假设维度都是 r r r,所以 r ( A T A ) r(A^TA) r(ATA) 与 r ( A ) r(A) r(A) 都是 n − r n-r n−r 维。又 A A A 是实对称矩阵,即 A T = A A^T=A AT=A,所以 r ( A ) = r ( A T A ) = r ( A 2 ) r(A) = r(A^TA) = r(A^2) r(A)=r(ATA)=r(A2)。进一步我们就有 r ( A ) = r ( A 2 ) = r ( A 4 ) = ⋯ = r ( A 2 n ) r(A) = r(A^2) = r(A^4)=\cdots=r(A^{2n}) r(A)=r(A2)=r(A4)=⋯=r(A2n)。又根据 r ( A B ) ≤ r ( A ) r(AB)\leq r(A) r(AB)≤r(A) 可得 r ( A 2 ( n − 1 ) ) ≤ r ( A 2 n − 1 ) ≤ r ( A 2 n ) r(A^{2(n-1)}) \leq r(A^{2n-1})\leq r(A^{2n}) r(A2(n−1))≤r(A2n−1)≤r(A2n),就可以得到 r ( A ) = r ( A 2 ) = r ( A 3 ) = r ( A 4 ) = ⋯ r(A) = r(A^2) = r(A^3) = r(A^4) = \cdots r(A)=r(A2)=r(A3)=r(A4)=⋯。
引理3: 设 A A A 为 n n n 阶实对称阵,则 k e r ( A ) ∩ i m ( A ) = ∅ ker(A)\cap im(A) = \emptyset ker(A)∩im(A)=∅ 并且 k e r ( A ) = k e r ( A 2 ) = k e r ( A 3 ) = ⋯ ker(A) = ker(A^2) = ker(A^3) = \cdots ker(A)=ker(A2)=ker(A3)=⋯。
证明:关于 k e r ( A ) ker(A) ker(A)和 i m ( A ) im(A) im(A)是什么:首先矩阵A的image就是,矩阵A所有列向量的线性组合,也就是A的列空间。然后,矩阵A的kernel就是,矩阵Ax=0的解集(齐次方程组全部的解),也就是A的零空间。矩阵 A A A的列空间和零空间中的向量是相互正交的,肯定不线性相关,所以它们的交集自然是空集。
由引理2下的证明, A x = 0 Ax=0 Ax=0 与 A T A x = 0 A^TAx=0 ATAx=0同解,而对于实对称矩阵, A A A 与 A 2 A^2 A2 同解。可以推广到 A 、 A 2 、 A 3 、 ⋯ A、A^2、A^3、\cdots A、A2、A3、⋯ 同解。自然有 k e r ( A ) = k e r ( A 2 ) = k e r ( A 3 ) = ⋯ ker(A) = ker(A^2) = ker(A^3) = \cdots ker(A)=ker(A2)=ker(A3)=⋯.
定理: 实对称矩阵必可相似对角化。
证明:
当 n = 1 时
A = [ a 11 ] A=[a_{11}] A=[a11] , E = [ 1 ] E = [1] E=[1] , E − 1 A E = A = ∧ E^{-1}AE=A=\wedge E−1AE=A=∧
假设 n = k - 1 时成立
当 n = k 时,假设其中一个特征值为 λ 1 \lambda_1 λ1,由引理1可知, λ 1 \lambda_1 λ1必为实数,它对应的特征向量也是实数,所以可以找到它对应的特征向量中的一个单位向量 η 1 \eta_1 η1。另外再可以找到一个正交阵 T = ( η 1 , η 2 , ⋯ , η n ) T=(\eta_1,\eta_2,\cdots,\eta_n) T=(η1,η2,⋯,ηn)。
T − 1 A T = ( T − 1 A η 1 , T − 1 A η 2 , ⋯ , T − 1 A η n ) T^{-1} A T = (T^{-1}A \eta_1, T^{-1}A \eta_2,\cdots, T^{-1} A \eta_n) T−1AT=(T−1Aη1,T−1Aη2,⋯,T−1Aηn)
其中, A η 1 = λ 1 η 1 A\eta_1=\lambda_1\eta_1 Aη1=λ1η1,所以 T − 1 A T T^{-1}AT T−1AT 可以表示为:
T − 1 A T = ( T − 1 λ 1 η 1 , T − 1 A η 2 , ⋯ , T − 1 A η n ) T^{-1} A T = (T^{-1}\lambda_1 \eta_1, T^{-1}A \eta_2,\cdots, T^{-1} A \eta_n) T−1AT=(T−1λ1η1,T−1Aη2,⋯,T−1Aηn)
根据正交矩阵的定义, T − 1 T = E T^{-1}T = E T−1T=E,即:
( T − 1 η 1 , T − 1 η 2 , ⋯ , T − 1 η n ) = E (T^{-1}\eta_1,T^{-1}\eta_2,\cdots,T^{-1}\eta_n) = E (T−1η1,T−1η2,⋯,T−1ηn)=E
由此可得:
T − 1 η 1 = ( 1 , 0 , ⋯ , 0 ) T T − 1 η 2 = ( 0 , 1 , ⋯ , 0 ) T ⋯ T − 1 η n = ( 0 , 0 , ⋯ , 1 ) T T^{-1}\eta_1 = (1,0,\cdots,0)^T\\ T^{-1}\eta_2 = (0,1,\cdots,0)^T\\ \cdots\\ T^{-1}\eta_n = (0,0,\cdots,1)^T T−1η1=(1,0,⋯,0)TT−1η2=(0,1,⋯,0)T⋯T−1ηn=(0,0,⋯,1)T
则:
T − 1 A T = ( T − 1 λ 1 η 1 , T − 1 A η 2 , ⋯ , T − 1 A η n ) = ( λ 1 T − 1 η 1 , T − 1 A η 2 , ⋯ , T − 1 A η n ) = [ λ 1 α 2 ⋯ α n ⋮ 0 P n − 1 ⋮ ] \begin{align*} T^{-1} A T &= (T^{-1}\lambda_1 \eta_1, T^{-1}A \eta_2,\cdots, T^{-1} A \eta_n)\\ & = (\lambda_1T^{-1} \eta_1, T^{-1}A \eta_2,\cdots, T^{-1} A \eta_n) \\ & = \begin{bmatrix} \lambda_1&\alpha_2&\cdots&\alpha_n&\\ \vdots&&&&\\ 0&&P_{n-1}&&\\ \vdots&& &&\\ \end{bmatrix} \end{align*} T−1AT=(T−1λ1η1,T−1Aη2,⋯,T−1Aηn)=(λ1T−1η1,T−1Aη2,⋯,T−1Aηn)= λ1⋮0⋮α2⋯Pn−1αn
由于 A A A 为实对称矩阵,所以 A T = A A^T = A AT=A,由于 T T T 为正交矩阵,所以 T − 1 = T T T^{-1} = T^T T−1=TT,则:
( T − 1 A T ) T = T T A T ( T − 1 ) T = T − 1 A ( T T ) T = T − 1 A T \begin{align*} (T^{-1}AT)^T & = T^TA^T(T^{-1})^T \\ & = T^{-1}A(T^T)^T \\ & = T^{-1}A T \end{align*} (T−1AT)T=TTAT(T−1)T=T−1A(TT)T=T−1AT
也就是 T − 1 A T T^{-1} A T T−1AT 也是实对称矩阵,所以向量 ( α 2 , ⋯ , α n ) = 0 (\alpha_2,\cdots,\alpha_n)=0 (α2,⋯,αn)=0,且 P P P 为 n − 1 n-1 n−1 阶实对称矩阵。
根据假设,存在可逆矩阵 T 2 T_2 T2 使得 T 2 − 1 P T 2 = ∧ n − 1 T_2^{-1}P T_2 = \wedge_{n-1} T2−1PT2=∧n−1。
所以我们就可以找到一个可逆矩阵 T f T_f Tf ( T f T_f Tf必然可逆,因为 ∣ T f ∣ = ∣ T 2 ∣ ≠ 0 |T_f|=|T_2|\neq 0 ∣Tf∣=∣T2∣=0):
T f = T [ 1 ⋯ 0 ⋯ ⋮ 0 T 2 ⋮ ] T f − 1 = [ 1 ⋯ 0 ⋯ ⋮ 0 T 2 − 1 ⋮ ] T − 1 T f − 1 A T f = [ 1 ⋯ 0 ⋯ ⋮ 0 T 2 − 1 ⋮ ] T − 1 A T [ 1 ⋯ 0 ⋯ ⋮ 0 T 2 ⋮ ] = [ 1 ⋯ 0 ⋯ ⋮ 0 T 2 − 1 ⋮ ] [ λ 1 ⋯ 0 ⋯ ⋮ 0 P n − 1 ⋮ ] [ 1 ⋯ 0 ⋯ ⋮ 0 T 2 ⋮ ] = [ λ 1 ⋯ 0 ⋯ ⋮ 0 T 2 − 1 P n − 1 T 2 ⋮ ] = [ λ 1 ⋯ 0 ⋯ ⋮ 0 ∧ n − 1 ⋮ ] \begin{align*} T_f &= T\begin{bmatrix} 1 & \cdots& 0 & \cdots& \\ \vdots&& && \\ 0 & & T_2 && \\ \vdots&& && \\ && && \end{bmatrix} \\ T_f^{-1} &=\begin{bmatrix} 1 & \cdots& 0 & \cdots& \\ \vdots&& && \\ 0 & & T_2^{-1} && \\ \vdots&& && \\ && && \end{bmatrix} T^{-1}\\ T_f^{-1}AT_f & =\begin{bmatrix} 1 & \cdots& 0 & \cdots& \\ \vdots&& && \\ 0 & & T_2^{-1} && \\ \vdots&& && \\ && && \end{bmatrix}T^{-1} A T \begin{bmatrix} 1 & \cdots& 0 & \cdots& \\ \vdots&& && \\ 0 & & T_2 && \\ \vdots&& && \\ && && \end{bmatrix} \\ &= \begin{bmatrix} 1 & \cdots& 0 & \cdots& \\ \vdots&& && \\ 0 & & T_2^{-1} && \\ \vdots&& && \\ && && \end{bmatrix} \begin{bmatrix} \lambda_1&\cdots&0&\cdots\\ \vdots&&&&\\ 0&&P_{n-1}&&\\ \vdots&& &&\\ && && \end{bmatrix} \begin{bmatrix} 1 & \cdots& 0 & \cdots& \\ \vdots&& && \\ 0 & & T_2 && \\ \vdots&& && \\ && && \end{bmatrix} \\ &= \begin{bmatrix} \lambda_1 & \cdots& 0 & \cdots& \\ \vdots&& && \\ 0 & & T_2^{-1}P_{n-1}T_2 && \\ \vdots&& && \\ && && \end{bmatrix} \\ &= \begin{bmatrix} \lambda_1 & \cdots& 0 & \cdots& \\ \vdots&& && \\ 0 & & \wedge_{n-1}&& \\ \vdots&& && \\ && && \end{bmatrix} \end{align*} TfTf−1Tf−1ATf=T 1⋮0⋮⋯0T2⋯ = 1⋮0⋮⋯0T2−1⋯ T−1= 1⋮0⋮⋯0T2−1⋯ T−1AT 1⋮0⋮⋯0T2⋯ = 1⋮0⋮⋯0T2−1⋯ λ1⋮0⋮⋯0Pn−1⋯ 1⋮0⋮⋯0T2⋯ = λ1⋮0⋮⋯0T2−1Pn−1T2⋯ = λ1⋮0⋮⋯0∧n−1⋯
这就得到了A的相似对角阵了。
事实上,这个证明不仅证明了实对称矩阵必可相似对角化,还证明了实对称矩阵必可以使用正交矩阵相似对角化。
但是我感觉数学归纳法并没有触及到实对称矩阵可以相似对角化的本质,触及灵魂的证明我还在思考和寻找中。