文章目录
- 版权声明
- 补充知识
-
- 特征值和特征向量
- 相似矩阵
- 相似对角化
- 实对称矩阵
版权声明
本文大部分内容皆来自李永乐老师考研教材和视频课。
补充知识
求和公式的性质
- ∑ i = 1 n k a i = k ∑ i = 1 n a i \sum_{i=1}^nka_i=k\sum_{i=1}^na_i i=1∑nkai=ki=1∑nai
- ∑ i = 1 n ( a i + b i ) = ∑ i = 1 n a i + ∑ i = 1 n b i \sum_{i=1}^n(a_i+b_i)=\sum_{i=1}^na_i+\sum_{i=1}^nb_i i=1∑n(ai+bi)=i=1∑nai+i=1∑nbi
- ∑ i = 1 m ∑ j = 1 n a i j = ∑ j = 1 n ∑ i = 1 m a i j \sum_{i=1}^m\sum_{j=1}^na_{ij}=\sum_{j=1}^n\sum_{i=1}^ma_{ij} i=1∑mj=1∑naij=j=1∑ni=1∑maij
常用希腊字符读音
- α \alpha α:/ælfə/
- β \beta β:/betə/
- Γ \Gamma Γ、 γ \gamma γ:/gama/
- Δ \Delta Δ、 δ \delta δ:/deltə/
- ε \varepsilon ε:/epsilon/
- υ \upsilon υ:/apsilon/
- θ \theta θ:/θitə/
- π \pi π:/paɪ/
- η \eta η:/ita/
- Λ \Lambda Λ、 λ \lambda λ:/læmdə/
- μ \mu μ:/mju/
- ξ \xi ξ:/ksi/
- Σ \Sigma Σ、 σ \sigma σ:/sigmə/
- τ \tau τ:/taʊ/
- Φ \varPhi Φ、 φ \varphi φ:/faɪ/
- ψ \psi ψ:/psi/
- Ω \Omega Ω、 ω \omega ω:/omiga/
- ρ \rho ρ:/ru:/
特征值和特征向量
设 A = [ a i j ] A=[a_{ij}] A=[aij]为一个 n n n阶矩阵,如果存在一个数 λ \lambda λ及非零的 n n n维向量 α \alpha α,使得
A α = λ α ① \tag*{①} A\alpha=\lambda\alpha Aα=λα①
成立,则称 λ \lambda λ是矩阵 A A A的一个特征值,称非零向量 α \alpha α是矩阵 A A A属于特征值 λ \lambda λ的一个特征向量。则行列式
∣ λ E − A ∣ = ∣ λ − a 11 − a 12 … − a 1 n − a 21 λ − a 22 … − a 2 n ⋮ ⋮ ⋮ − a n 1 − a n 2 … λ − a n n ∣ |\lambda E-A|= \begin{vmatrix} \lambda-a_{11}&-a_{12}&\dots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\dots&-a_{2n}\\ \vdots&\vdots&&\vdots\\ -a_{n1}&-a_{n2}&\dots&\lambda-a_{nn} \end{vmatrix} ∣λE−A∣= λ−a11−a21⋮−an1−a12λ−a22⋮−an2………−a1n−a2n⋮λ−ann
称为矩阵 A A A的特征多项式, ∣ λ E − A ∣ = 0 |\lambda E-A|=0 ∣λE−A∣=0称为 A A A的特征方程。由①可知
( λ E − A ) α = O , α ≠ O ② \tag*{②}(\lambda E-A)\alpha=O,\alpha\neq O (λE−A)α=O,α=O②
即 α \alpha α是方程②的非零解,那么求特征向量的步骤如下:
- (1)先由特征方程求出矩阵 A A A的特征值 λ \lambda λ,共 n n n个。
- (2)再由②求基础解系,即矩阵 A A A属于特征值 λ i \lambda_i λi的线性无关的特征向量。
特征值的性质如下:
- 如果 α \alpha α是矩阵 A A A针对于特征值 λ \lambda λ的特征向量,那么只要 k ≠ 0 k\neq0 k=0,则 k α k\alpha kα仍是 A A A针对于特征值 λ \lambda λ的特征向量。
证明:
A α = λ α A ( k α ) = k A α = k ( λ α ) = λ ( k α ) A\alpha=\lambda\alpha\\ A(k\alpha)=kA\alpha=k(\lambda\alpha)=\lambda(k\alpha) Aα=λαA(kα)=kAα=k(λα)=λ(kα)
- 如果 α 1 , α 2 … , α t \alpha_1,\alpha_2\dots,\alpha_t α1,α2…,αt都是属于矩阵 A A A的特征值 λ \lambda λ的特征向量,那么当 k 1 α 1 + k 2 α 2 + ⋯ + k t α t k_1\alpha_1+k_2\alpha_2+\dots+k_t\alpha_t k1α1+k2α2+⋯+ktαt非零时, k 1 α 1 + k 2 α 2 + ⋯ + k t α t k_1\alpha_1+k_2\alpha_2+\dots+k_t\alpha_t k1α1+k2α2+⋯+ktαt仍然是属于矩阵 A A A的特征值 λ \lambda λ的特征向量。
证明:由 A α 1 = λ α 1 , A α 2 = λ α 2 A\alpha_1=\lambda\alpha_1,A\alpha_2=\lambda\alpha_2 Aα1=λα1,Aα2=λα2得:
A ( k 1 α 1 + k 2 α 2 ) = k 1 A α 1 + k 2 A α 2 = k 1 ( λ α 1 ) + k 2 ( λ α 2 ) = λ ( k 1 α 1 + k 2 α 2 2 ) A(k_1\alpha_1+k_2\alpha_2)=k_1A\alpha_1+k_2A\alpha_2=k_1(\lambda\alpha_1)+k_2(\lambda\alpha_2)=\lambda(k_1\alpha_1+k_2\alpha_22) A(k1α1+k2α2)=k1Aα1+k2Aα2=k1(λα1)+k2(λα2)=λ(k1α1+k2α22)
- 设 A A A是 n n n阶矩阵, λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1,λ2,…,λn是矩阵 A A A的特征值,则:
∑ λ i = ∑ a i i , ∏ λ i = ∣ A ∣ \sum\lambda_i=\sum a_{ii},\prod\lambda_i=|A| ∑λi=∑aii,∏λi=∣A∣
证明:设三阶矩阵 A A A,则有
∣ λ E − A ∣ = ∣ λ − a 11 − a 12 − a 13 − a 21 λ − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ = ∣ λ − a 12 − a 13 0 λ − a 22 − a 23 0 − a 32 λ − a 33 ∣ + ∣ − a 11 − a 12 − a 13 − a 21 λ − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ = ∣ λ 0 − a 13 0 λ − a 23 0 0 λ − a 33 ∣ + ∣ λ − a 12 − a 13 0 − a 22 − a 23 0 − a 32 λ − a 33 ∣ + ∣ − a 11 0 − a 13 − a 21 λ − a 23 − a 31 0 λ − a 33 ∣ + ∣ − a 11 − a 12 − a 13 − a 21 − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ … = λ 3 − ( a 11 + a 22 + a 33 ) λ 2 + S λ − ∣ A ∣ = ( λ − λ 1 ) ( λ − λ 2 ) ( λ − λ 3 ) |\lambda E-A|= \begin{vmatrix} \lambda-a_{11}&-a_{12}&-a_{13}\\ -a_{21}&\lambda-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ = \begin{vmatrix} \lambda&-a_{12}&-a_{13}\\ 0&\lambda-a_{22}&-a_{23}\\ 0&-a_{32}&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&-a_{12}&-a_{13}\\ -a_{21}&\lambda-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ = \begin{vmatrix} \lambda&0&-a_{13}\\ 0&\lambda&-a_{23}\\ 0&0&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} \lambda&-a_{12}&-a_{13}\\ 0&-a_{22}&-a_{23}\\ 0&-a_{32}&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&0&-a_{13}\\ -a_{21}&\lambda&-a_{23}\\ -a_{31}&0&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&-a_{12}&-a_{13}\\ -a_{21}&-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ \dots\\ =\lambda^3-(a_{11}+a_{22}+a_{33})\lambda^2+S\lambda-|A|\\ =(\lambda-\lambda_1)(\lambda-\lambda_2)(\lambda-\lambda_3) ∣λE−A∣= λ−a11−a21−a31−a12λ−a22−a32−a13−a23λ−a33 = λ00−a12λ−a22−a32−a13−a23λ−a33 + −a11−a21−a31−a12λ−a22−a32−a13−a23λ−a33 = λ000λ0−a13−a23λ−a33 + λ00−a12−a22−a32−a13−a23λ−a33 + −a11−a21−a310λ0−a13−a23λ−a33 + −a11−a21−a31−a12−a22−a32−a13−a23λ−a33 …=λ3−(a11+a22+a33)λ2+Sλ−∣A∣=(λ−λ1)(λ−λ2)(λ−λ3)
设特征方程的解为 λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ1,λ2,λ3,那么
( λ − λ 1 ) ( λ − λ 2 ) ( λ − λ 3 ) = λ 3 − ( λ 1 + λ 2 + λ 3 ) λ 2 + S λ − λ 1 λ 2 λ 3 (\lambda-\lambda_1)(\lambda-\lambda_2)(\lambda-\lambda_3)=\lambda^3-(\lambda_1+\lambda_2+\lambda_3)\lambda^2+S\lambda-\lambda_1\lambda_2\lambda_3 (λ−λ1)(λ−λ2)(λ−λ3)=λ3−(λ1+λ2+λ3)λ2+Sλ−λ1λ2λ3
所以
∑ λ i = ∑ a i i , ∏ λ i = ∣ A ∣ \sum\lambda_i=\sum a_{ii},\prod\lambda_i=|A| ∑λi=∑aii,∏λi=∣A∣
其中 S S S为一次项的系数,不重要。
- 如果 λ 1 , λ 2 , … , λ m \lambda_1,\lambda_2,\dots,\lambda_m λ1,λ2,…,λm是矩阵 A A A的互不相同的特征值, α 1 , α 2 … , α m \alpha_1,\alpha_2\dots,\alpha_m α1,α2…,αm分别是与之对应的特征向量,则 α 1 , α 2 … , α m \alpha_1,\alpha_2\dots,\alpha_m α1,α2…,αm线性无关。
证明:对特征值的个数 m m m做数学归纳法,当 m = 1 m=1 m=1时, α 1 ≠ O \alpha_1\neq O α1=O,命题正确。设 m = k − 1 m=k-1 m=k−1时命题正确,当 m = k m=k m=k时,设
x 1 α 1 + x 2 α 2 + ⋯ + x k − 1 α k − 1 + x k α k = O ① \tag*{①}x_1\alpha_1+x_2\alpha_2+\dots+x_{k-1}\alpha_{k-1}+x_k\alpha_k=O x1α1+x2α2+⋯+xk−1αk−1+xkαk=O①
用 A A A左乘上式有
x 1 λ 1 α 1 + x 2 λ 2 α 2 + ⋯ + x k − 1 λ k − 1 α k − 1 + x k λ k α k = O ② \tag*{②}x_1\lambda_1\alpha_1+x_2\lambda_2\alpha_2+\dots+x_{k-1}\lambda_{k-1}\alpha_{k-1}+x_k\lambda_k\alpha_k=O x1λ1α1+x2λ2α2+⋯+xk−1λk−1αk−1+xkλkαk=O②
用 λ k \lambda_k λk乘①得
x 1 λ k α 1 + x 2 λ k α 2 + ⋯ + x k − 1 λ k α k − 1 + x k λ k α k = O ③ \tag*{③}x_1\lambda_k\alpha_1+x_2\lambda_k\alpha_2+\dots+x_{k-1}\lambda_{k}\alpha_{k-1}+x_k\lambda_k\alpha_k=O x1λkα1+x2λkα2+⋯+xk−1λkαk−1+xkλkαk=O③
② − - −③得
x 1 ( λ 1 − λ k ) α 1 + x 2 ( λ 2 − λ k ) α 2 + ⋯ + x k − 1 ( λ k − 1 − λ k ) α k − 1 = O x_1(\lambda_1-\lambda_k)\alpha_1+x_2(\lambda_2-\lambda_k)\alpha_2+\dots+x_{k-1}(\lambda_{k-1}-\lambda_k)\alpha_{k-1}=O x1(λ1−λk)α1+x2(λ2−λk)α2+⋯+xk−1(λk−1−λk)αk−1=O
由归纳假设结论得
x 1 = 0 , x 2 = 0 , … , x k − 1 = 0 x_1=0,x_2=0,\dots,x_{k-1}=0 x1=0,x2=0,…,xk−1=0
代入①得
x k α k = O x_k\alpha_k=O xkαk=O
所以 x k = 0 x_k=0 xk=0,因此 α 1 , α 2 … , α m \alpha_1,\alpha_2\dots,\alpha_m α1,α2…,αm线性无关。
- 如果 A A A是 n n n阶矩阵, λ \lambda λ是 A A A的 m m m重特征值,则属于 λ \lambda λ的线性无关的特征向量最多有 m m m个。
相似矩阵
设 A , B A,B A,B都是 n n n阶矩阵,如果存在可逆矩阵 P P P,使得
P − 1 A P = B P^{-1}AP=B P−1AP=B
则称矩阵 A A A和 B B B相似,记作 A ∼ B A\thicksim B A∼B
相似矩阵的性质如下:
- A ∼ A A\thicksim A A∼A
- A ∼ B ⇔ B ∼ A A\thicksim B\Leftrightarrow B\thicksim A A∼B⇔B∼A
- A ∼ B , B ∼ A ⇒ A ∼ C A\thicksim B,B\thicksim A\Rightarrow A\thicksim C A∼B,B∼A⇒A∼C
证明:设 P 1 − 1 A P 1 = B , P 2 − 1 B P 2 = C P_1^{-1}AP_1=B,P_2^{-1}BP_2=C P1−1AP1=B,P2−1BP2=C则
P 2 − 1 ( P 1 − 1 A P 1 ) P 2 = C P_2^{-1}(P_1^{-1}AP_1)P_2=C P2−1(P1−1AP1)P2=C
令 P = P 1 P 2 P=P_1P_2 P=P1P2,有 P − 1 = ( P 1 P 2 ) − 1 = P 2 − 1 P 1 − 1 P^{-1}=(P_1P_2)^{-1}=P_2^{-1}P_1^{-1} P−1=(P1P2)−1=P2−1P1−1所以 P − 1 A P = C P^{-1}AP=C P−1AP=C。
- 如果 A ∼ B A\thicksim B A∼B,那么
- A 2 ∼ B 2 A^2\thicksim B^2 A2∼B2
- A + k E ∼ B + k E A+kE\thicksim B+kE A+kE∼B+kE
- 如果 A A A可逆,则 A − 1 ∼ B − 1 A^{-1}\thicksim B^{-1} A−1∼B−1
- A 1 ∼ B 1 , A 2 ∼ B 2 ⇒ [ A 1 A 2 ] ∼ [ B 1 B 2 ] A_1\thicksim B_1,A_2\thicksim B_2 \Rightarrow\begin{bmatrix}A_1&\\&A_2\end{bmatrix}\thicksim\begin{bmatrix}B_1&\\&B_2\end{bmatrix} A1∼B1,A2∼B2⇒[A1A2]∼[B1B2]
- A ∼ B ⇒ r ( A ) = r ( B ) A\thicksim B\Rightarrow r(A)=r(B) A∼B⇒r(A)=r(B)
证明:
r ( B ) = r ( P − 1 A P ) = r ( A P ) = r ( A ) r(B)=r(P^{-1}AP)=r(AP)=r(A) r(B)=r(P−1AP)=r(AP)=r(A)
- A ∼ B ⇒ ∣ A ∣ = ∣ B ∣ A\thicksim B\Rightarrow |A|=|B| A∼B⇒∣A∣=∣B∣
证明:
∣ B ∣ = ∣ P − 1 A P ∣ = ∣ P − 1 ∣ ∣ A ∣ ∣ P ∣ = ∣ A ∣ |B|=|P^{-1}AP|=|P^{-1}||A||P|=|A| ∣B∣=∣P−1AP∣=∣P−1∣∣A∣∣P∣=∣A∣
- A ∼ B ⇒ ∣ λ E − A ∣ = ∣ λ E − B ∣ A\thicksim B\Rightarrow |\lambda E-A|=|\lambda E-B| A∼B⇒∣λE−A∣=∣λE−B∣
证明:
∣ λ E − B ∣ = ∣ λ E − P − 1 A P ∣ = ∣ P − 1 ( λ E − A ) P ∣ = ∣ P − 1 ∣ ∣ λ E − A ∣ ∣ P ∣ = ∣ λ E − A ∣ |\lambda E-B|=|\lambda E-P^{-1}AP|=|P^{-1}(\lambda E-A)P|=|P^{-1}||\lambda E-A||P|=|\lambda E-A|\\ ∣λE−B∣=∣λE−P−1AP∣=∣P−1(λE−A)P∣=∣P−1∣∣λE−A∣∣P∣=∣λE−A∣
相似对角化
如果 A A A能与对角矩阵相似,则称 A A A可对角化。
P − 1 A P = Λ A P = P Λ P^{-1}AP=\Lambda\\ AP=P\Lambda P−1AP=ΛAP=PΛ
假设 A A A是三阶矩阵,对 P P P按列分块:
A ( p 1 , p 2 , p 3 ) = ( p 1 , p 2 , p 3 ) [ λ 1 λ 2 λ 3 ] [ A p 1 , A p 2 , A p 3 ] = [ λ 1 p 1 , λ 2 p 2 , λ 3 p 3 ] ⇓ A p 1 = λ 1 p 1 , A p 2 = λ 2 p 2 , A p 3 = λ 3 p 3 A(p_1,p_2,p_3)=(p_1,p_2,p_3) \begin{bmatrix} \lambda_1&&\\ &\lambda_2&\\ &&\lambda_3\\ \end{bmatrix}\\ [Ap_1,Ap_2,Ap_3]=[\lambda_1p_1,\lambda_2p_2,\lambda_3p_3]\\ \Downarrow\\ Ap_1=\lambda_1p_1,Ap_2=\lambda_2p_2,Ap_3=\lambda_3p_3 A(p1,p2,p3)=(p1,p2,p3) λ1λ2λ3 [Ap1,Ap2,Ap3]=[λ1p1,λ2p2,λ3p3]⇓Ap1=λ1p1,Ap2=λ2p2,Ap3=λ3p3
那么:
- A A A的特征值: λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ1,λ2,λ3
- A A A的特征向量: p 1 , p 2 , p 3 p_1,p_2,p_3 p1,p2,p3
因为 P P P可逆,所以 p 1 , p 2 , p 3 p_1,p_2,p_3 p1,p2,p3线性无关。反之,若 A A A有 3 3 3个无关的特征向量 p 1 , p 2 , p 3 p_1,p_2,p_3 p1,p2,p3,满足 A p i = λ i p i ( i = 1 , 2 , 3 ) Ap_i=\lambda_ip_i(i=1,2,3) Api=λipi(i=1,2,3),则有
A ( p 1 , p 2 , p 3 ) = ( p 1 , p 2 , p 3 ) [ λ 1 λ 2 λ 3 ] A(p_1,p_2,p_3)=(p_1,p_2,p_3) \begin{bmatrix} \lambda_1&&\\ &\lambda_2&\\ &&\lambda_3\\ \end{bmatrix} A(p1,p2,p3)=(p1,p2,p3) λ1λ2λ3
令 P = [ p 1 , p 2 , p 3 ] , Λ = [ λ 1 λ 2 λ 3 ] P=[p_1,p_2,p_3],\Lambda=\begin{bmatrix}\lambda_1&&\\&\lambda_2&\\&&\lambda_3\\\end{bmatrix} P=[p1,p2,p3],Λ= λ1λ2λ3 ,则
P − 1 A P = Λ P^{-1}AP=\Lambda P−1AP=Λ
矩阵对角化的性质如下:
- n n n阶矩阵 A A A可对角化 ⇔ A \Leftrightarrow A ⇔A有 n n n个线性无关的特征向量,且
A ∼ [ λ 1 λ 2 ⋱ λ n ] A\thicksim \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\\ \end{bmatrix} A∼ λ1λ2⋱λn
- n n n阶矩阵 A A A可对角化 ⇔ \Leftrightarrow ⇔ λ i \lambda_i λi是 A A A的 n i n_i ni重特征值,则 λ i \lambda_i λi有 n i n_i ni个线性无关的特征向量 ⇔ \Leftrightarrow ⇔秩 r ( λ E − A ) = n − n i r(\lambda E-A)=n-n_i r(λE−A)=n−ni, λ i \lambda_i λi为 n i n_i ni重特征值。
实对称矩阵
满足以下两个条件的方阵称为实对称矩阵:
- A = A T A=A^T A=AT
- 矩阵的元素全为实数。
实对称矩阵的性质如下:
- 若矩阵 A A A是实对称矩阵,则 A A A的特征值都是实数。
证明:设 A α = λ α A\alpha=\lambda \alpha Aα=λα,则
A α ˉ = λ α ˉ A ˉ α ˉ = λ ˉ α ˉ \bar{A\alpha}=\bar{\lambda\alpha}\\ \bar{A}\bar{\alpha}=\bar{\lambda}\bar{\alpha}\\ Aαˉ=λαˉAˉαˉ=λˉαˉ
因为 A A A是实对称矩阵,所以 A ˉ = A \bar{A}=A Aˉ=A
A α ˉ = λ ˉ α ˉ α T A α ˉ = λ ˉ α T α ˉ A\bar{\alpha}=\bar{\lambda}\bar{\alpha}\\\ \alpha^TA\bar{\alpha}=\bar{\lambda}\alpha^T\bar{\alpha}\\ Aαˉ=λˉαˉ αTAαˉ=λˉαTαˉ
因为 α T A α ˉ \alpha^TA\bar{\alpha} αTAαˉ与 α T α ˉ \alpha^T\bar{\alpha} αTαˉ都是数,所以:
α T A α ˉ = ( α T A α ˉ ) T = λ α ˉ T α = λ α T α ˉ α T α ˉ = ( α T α ˉ ) T = α ˉ T α ⇓ ( λ − λ ˉ ) α T α ˉ = 0 \alpha^TA\bar{\alpha}=(\alpha^TA\bar{\alpha})^T=\lambda\bar{\alpha}^T\alpha=\lambda\alpha^T\bar{\alpha}\\ \alpha^T\bar{\alpha}=(\alpha^T\bar{\alpha})^T=\bar{\alpha}^T\alpha\\ \Downarrow\\ (\lambda-\bar{\lambda})\alpha^T\bar{\alpha}=0 αTAαˉ=(αTAαˉ)T=λαˉTα=λαTαˉαTαˉ=(αTαˉ)T=αˉTα⇓(λ−λˉ)αTαˉ=0
因为 α ≠ O \alpha\neq O α=O,所以 α T α ˉ > 0 \alpha^T\bar{\alpha}>0 αTαˉ>0,因此 λ = λ ˉ \lambda=\bar{\lambda} λ=λˉ
- 实对称矩阵 A A A的不同特征值 λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2所对应的特征向量 α 1 , α 2 \alpha_1,\alpha_2 α1,α2必正交。
证明:由 A α 1 = λ 1 α 2 , A α 2 = λ 2 α 2 , λ 1 = λ 2 A\alpha_1=\lambda_1\alpha_2,A\alpha_2=\lambda_2\alpha_2,\lambda_1=\lambda_2 Aα1=λ1α2,Aα2=λ2α2,λ1=λ2得:
λ 1 α 2 α 1 = α 1 T A α 1 = α 2 T A T α 1 = ( A α 2 ) T α 1 = ( λ 2 α 2 ) T α 1 = λ 2 α 2 T α 1 ⇓ ( λ 1 − λ 2 ) α 2 T α 1 = 0 \lambda_1\alpha_2\alpha_1=\alpha_1^TA\alpha_1=\alpha_2^TA^T\alpha_1=(A\alpha_2)^T\alpha_1=(\lambda_2\alpha_2)^T\alpha_1=\lambda_2\alpha_2^T\alpha_1\\ \Downarrow\\ (\lambda_1-\lambda_2)\alpha_2^T\alpha_1=0\\ λ1α2α1=α1TAα1=α2TATα1=(Aα2)Tα1=(λ2α2)Tα1=λ2α2Tα1⇓(λ1−λ2)α2Tα1=0
因为 λ 1 ≠ λ 2 \lambda_1\neq\lambda_2 λ1=λ2,所以 α 2 T α 1 = 0 \alpha_2^T\alpha_1=0 α2Tα1=0
- n n n阶实对称矩阵 A A A必可对角化,且总存在正交矩阵 Q Q Q,使得
Q − 1 A Q = Q T A Q = [ λ 1 λ 2 ⋱ λ n ] Q^{-1}AQ=Q^TAQ= \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\\ \end{bmatrix} Q−1AQ=QTAQ= λ1λ2⋱λn
其中 λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1,λ2,…,λn是 A A A的特征值。
证明:对 n n n用数学归纳法,当 n = 1 n=1 n=1时,命题显然成立。假设 n − 1 n-1 n−1时命题成立,对于 n n n阶矩阵 A A A,设 λ 1 \lambda_1 λ1是 A A A的特征值, α 1 \alpha_1 α1是对应于 λ 1 \lambda_1 λ1的单位特征向量,将 α 1 \alpha_1 α1扩充为 R n R^n Rn的一组规范正交基: α 1 , α 2 … , α n \alpha_1,\alpha_2\dots,\alpha_n α1,α2…,αn,即 [ α 1 , α 2 … , α n ] [\alpha_1,\alpha_2\dots,\alpha_n] [α1,α2…,αn]是 n n n阶正交矩阵。由 A α 1 = λ 1 α 1 A\alpha_1=\lambda_1\alpha_1 Aα1=λ1α1,并设
A α 2 = b 12 α 1 + b 22 α 2 + ⋯ + b n 2 α n … A α n = b 1 n α 1 + b 2 n α 2 + ⋯ + b n n α n A\alpha_2=b_{12}\alpha_1+b_{22}\alpha_2+\dots+b_{n2}\alpha_n\\ \dots\\ A\alpha_n=b_{1n}\alpha_1+b_{2n}\alpha_2+\dots+b_{nn}\alpha_n Aα2=b12α1+b22α2+⋯+bn2αn…Aαn=b1nα1+b2nα2+⋯+bnnαn