线性代数——特征值和特征向量

文章目录

  • 版权声明
  • 补充知识
    • 求和公式的性质
    • 常用希腊字符读音
  • 特征值和特征向量
  • 相似矩阵
  • 相似对角化
  • 实对称矩阵

版权声明

本文大部分内容皆来自李永乐老师考研教材和视频课。

补充知识

求和公式的性质

  • ∑ i = 1 n k a i = k ∑ i = 1 n a i \sum_{i=1}^nka_i=k\sum_{i=1}^na_i i=1nkai=ki=1nai
  • ∑ i = 1 n ( a i + b i ) = ∑ i = 1 n a i + ∑ i = 1 n b i \sum_{i=1}^n(a_i+b_i)=\sum_{i=1}^na_i+\sum_{i=1}^nb_i i=1n(ai+bi)=i=1nai+i=1nbi
  • ∑ i = 1 m ∑ j = 1 n a i j = ∑ j = 1 n ∑ i = 1 m a i j \sum_{i=1}^m\sum_{j=1}^na_{ij}=\sum_{j=1}^n\sum_{i=1}^ma_{ij} i=1mj=1naij=j=1ni=1maij

常用希腊字符读音

  • α \alpha α:/ælfə/
  • β \beta β:/betə/
  • Γ \Gamma Γ γ \gamma γ:/gama/
  • Δ \Delta Δ δ \delta δ:/deltə/
  • ε \varepsilon ε:/epsilon/
  • υ \upsilon υ:/apsilon/
  • θ \theta θ:/θitə/
  • π \pi π:/paɪ/
  • η \eta η:/ita/
  • Λ \Lambda Λ λ \lambda λ:/læmdə/
  • μ \mu μ:/mju/
  • ξ \xi ξ:/ksi/
  • Σ \Sigma Σ σ \sigma σ:/sigmə/
  • τ \tau τ:/taʊ/
  • Φ \varPhi Φ φ \varphi φ:/faɪ/
  • ψ \psi ψ:/psi/
  • Ω \Omega Ω ω \omega ω:/omiga/
  • ρ \rho ρ:/ru:/

特征值和特征向量

A = [ a i j ] A=[a_{ij}] A=[aij]为一个 n n n阶矩阵,如果存在一个数 λ \lambda λ及非零的 n n n维向量 α \alpha α,使得
A α = λ α ① \tag*{①} A\alpha=\lambda\alpha Aα=λα
成立,则称 λ \lambda λ是矩阵 A A A的一个特征值,称非零向量 α \alpha α是矩阵 A A A属于特征值 λ \lambda λ的一个特征向量。则行列式
∣ λ E − A ∣ = ∣ λ − a 11 − a 12 … − a 1 n − a 21 λ − a 22 … − a 2 n ⋮ ⋮ ⋮ − a n 1 − a n 2 … λ − a n n ∣ |\lambda E-A|= \begin{vmatrix} \lambda-a_{11}&-a_{12}&\dots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\dots&-a_{2n}\\ \vdots&\vdots&&\vdots\\ -a_{n1}&-a_{n2}&\dots&\lambda-a_{nn} \end{vmatrix} λEA= λa11a21an1a12λa22an2a1na2nλann
称为矩阵 A A A特征多项式 ∣ λ E − A ∣ = 0 |\lambda E-A|=0 λEA=0称为 A A A特征方程。由①可知
( λ E − A ) α = O , α ≠ O ② \tag*{②}(\lambda E-A)\alpha=O,\alpha\neq O (λEA)α=O,α=O
α \alpha α是方程②的非零解,那么求特征向量的步骤如下:

  • (1)先由特征方程求出矩阵 A A A的特征值 λ \lambda λ,共 n n n个。
  • (2)再由②求基础解系,即矩阵 A A A属于特征值 λ i \lambda_i λi的线性无关的特征向量。

特征值的性质如下:

  • 如果 α \alpha α是矩阵 A A A针对于特征值 λ \lambda λ的特征向量,那么只要 k ≠ 0 k\neq0 k=0,则 k α k\alpha kα仍是 A A A针对于特征值 λ \lambda λ的特征向量。
    证明:
    A α = λ α A ( k α ) = k A α = k ( λ α ) = λ ( k α ) A\alpha=\lambda\alpha\\ A(k\alpha)=kA\alpha=k(\lambda\alpha)=\lambda(k\alpha) Aα=λαA(kα)=kAα=k(λα)=λ(kα)
  • 如果 α 1 , α 2 … , α t \alpha_1,\alpha_2\dots,\alpha_t α1,α2,αt都是属于矩阵 A A A的特征值 λ \lambda λ的特征向量,那么当 k 1 α 1 + k 2 α 2 + ⋯ + k t α t k_1\alpha_1+k_2\alpha_2+\dots+k_t\alpha_t k1α1+k2α2++ktαt非零时, k 1 α 1 + k 2 α 2 + ⋯ + k t α t k_1\alpha_1+k_2\alpha_2+\dots+k_t\alpha_t k1α1+k2α2++ktαt仍然是属于矩阵 A A A的特征值 λ \lambda λ的特征向量。
    证明:由 A α 1 = λ α 1 , A α 2 = λ α 2 A\alpha_1=\lambda\alpha_1,A\alpha_2=\lambda\alpha_2 Aα1=λα1,Aα2=λα2得:
    A ( k 1 α 1 + k 2 α 2 ) = k 1 A α 1 + k 2 A α 2 = k 1 ( λ α 1 ) + k 2 ( λ α 2 ) = λ ( k 1 α 1 + k 2 α 2 2 ) A(k_1\alpha_1+k_2\alpha_2)=k_1A\alpha_1+k_2A\alpha_2=k_1(\lambda\alpha_1)+k_2(\lambda\alpha_2)=\lambda(k_1\alpha_1+k_2\alpha_22) A(k1α1+k2α2)=k1Aα1+k2Aα2=k1(λα1)+k2(λα2)=λ(k1α1+k2α22)
  • A A A n n n阶矩阵, λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1,λ2,,λn是矩阵 A A A的特征值,则:
    ∑ λ i = ∑ a i i , ∏ λ i = ∣ A ∣ \sum\lambda_i=\sum a_{ii},\prod\lambda_i=|A| λi=aii,λi=A
    证明:设三阶矩阵 A A A,则有
    ∣ λ E − A ∣ = ∣ λ − a 11 − a 12 − a 13 − a 21 λ − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ = ∣ λ − a 12 − a 13 0 λ − a 22 − a 23 0 − a 32 λ − a 33 ∣ + ∣ − a 11 − a 12 − a 13 − a 21 λ − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ = ∣ λ 0 − a 13 0 λ − a 23 0 0 λ − a 33 ∣ + ∣ λ − a 12 − a 13 0 − a 22 − a 23 0 − a 32 λ − a 33 ∣ + ∣ − a 11 0 − a 13 − a 21 λ − a 23 − a 31 0 λ − a 33 ∣ + ∣ − a 11 − a 12 − a 13 − a 21 − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ … = λ 3 − ( a 11 + a 22 + a 33 ) λ 2 + S λ − ∣ A ∣ = ( λ − λ 1 ) ( λ − λ 2 ) ( λ − λ 3 ) |\lambda E-A|= \begin{vmatrix} \lambda-a_{11}&-a_{12}&-a_{13}\\ -a_{21}&\lambda-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ = \begin{vmatrix} \lambda&-a_{12}&-a_{13}\\ 0&\lambda-a_{22}&-a_{23}\\ 0&-a_{32}&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&-a_{12}&-a_{13}\\ -a_{21}&\lambda-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ = \begin{vmatrix} \lambda&0&-a_{13}\\ 0&\lambda&-a_{23}\\ 0&0&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} \lambda&-a_{12}&-a_{13}\\ 0&-a_{22}&-a_{23}\\ 0&-a_{32}&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&0&-a_{13}\\ -a_{21}&\lambda&-a_{23}\\ -a_{31}&0&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&-a_{12}&-a_{13}\\ -a_{21}&-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ \dots\\ =\lambda^3-(a_{11}+a_{22}+a_{33})\lambda^2+S\lambda-|A|\\ =(\lambda-\lambda_1)(\lambda-\lambda_2)(\lambda-\lambda_3) λEA= λa11a21a31a12λa22a32a13a23λa33 = λ00a12λa22a32a13a23λa33 + a11a21a31a12λa22a32a13a23λa33 = λ000λ0a13a23λa33 + λ00a12a22a32a13a23λa33 + a11a21a310λ0a13a23λa33 + a11a21a31a12a22a32a13a23λa33 =λ3(a11+a22+a33)λ2+SλA=(λλ1)(λλ2)(λλ3)
    设特征方程的解为 λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ1,λ2,λ3,那么
    ( λ − λ 1 ) ( λ − λ 2 ) ( λ − λ 3 ) = λ 3 − ( λ 1 + λ 2 + λ 3 ) λ 2 + S λ − λ 1 λ 2 λ 3 (\lambda-\lambda_1)(\lambda-\lambda_2)(\lambda-\lambda_3)=\lambda^3-(\lambda_1+\lambda_2+\lambda_3)\lambda^2+S\lambda-\lambda_1\lambda_2\lambda_3 (λλ1)(λλ2)(λλ3)=λ3(λ1+λ2+λ3)λ2+Sλλ1λ2λ3
    所以
    ∑ λ i = ∑ a i i , ∏ λ i = ∣ A ∣ \sum\lambda_i=\sum a_{ii},\prod\lambda_i=|A| λi=aii,λi=A
    其中 S S S为一次项的系数,不重要。
  • 如果 λ 1 , λ 2 , … , λ m \lambda_1,\lambda_2,\dots,\lambda_m λ1,λ2,,λm是矩阵 A A A的互不相同的特征值, α 1 , α 2 … , α m \alpha_1,\alpha_2\dots,\alpha_m α1,α2,αm分别是与之对应的特征向量,则 α 1 , α 2 … , α m \alpha_1,\alpha_2\dots,\alpha_m α1,α2,αm线性无关。
    证明:对特征值的个数 m m m做数学归纳法,当 m = 1 m=1 m=1时, α 1 ≠ O \alpha_1\neq O α1=O,命题正确。设 m = k − 1 m=k-1 m=k1时命题正确,当 m = k m=k m=k时,设
    x 1 α 1 + x 2 α 2 + ⋯ + x k − 1 α k − 1 + x k α k = O ① \tag*{①}x_1\alpha_1+x_2\alpha_2+\dots+x_{k-1}\alpha_{k-1}+x_k\alpha_k=O x1α1+x2α2++xk1αk1+xkαk=O
    A A A左乘上式有
    x 1 λ 1 α 1 + x 2 λ 2 α 2 + ⋯ + x k − 1 λ k − 1 α k − 1 + x k λ k α k = O ② \tag*{②}x_1\lambda_1\alpha_1+x_2\lambda_2\alpha_2+\dots+x_{k-1}\lambda_{k-1}\alpha_{k-1}+x_k\lambda_k\alpha_k=O x1λ1α1+x2λ2α2++xk1λk1αk1+xkλkαk=O
    λ k \lambda_k λk乘①得
    x 1 λ k α 1 + x 2 λ k α 2 + ⋯ + x k − 1 λ k α k − 1 + x k λ k α k = O ③ \tag*{③}x_1\lambda_k\alpha_1+x_2\lambda_k\alpha_2+\dots+x_{k-1}\lambda_{k}\alpha_{k-1}+x_k\lambda_k\alpha_k=O x1λkα1+x2λkα2++xk1λkαk1+xkλkαk=O
    − - ③得
    x 1 ( λ 1 − λ k ) α 1 + x 2 ( λ 2 − λ k ) α 2 + ⋯ + x k − 1 ( λ k − 1 − λ k ) α k − 1 = O x_1(\lambda_1-\lambda_k)\alpha_1+x_2(\lambda_2-\lambda_k)\alpha_2+\dots+x_{k-1}(\lambda_{k-1}-\lambda_k)\alpha_{k-1}=O x1(λ1λk)α1+x2(λ2λk)α2++xk1(λk1λk)αk1=O
    由归纳假设结论得
    x 1 = 0 , x 2 = 0 , … , x k − 1 = 0 x_1=0,x_2=0,\dots,x_{k-1}=0 x1=0,x2=0,,xk1=0
    代入①得
    x k α k = O x_k\alpha_k=O xkαk=O
    所以 x k = 0 x_k=0 xk=0,因此 α 1 , α 2 … , α m \alpha_1,\alpha_2\dots,\alpha_m α1,α2,αm线性无关。
  • 如果 A A A n n n阶矩阵, λ \lambda λ A A A m m m重特征值,则属于 λ \lambda λ的线性无关的特征向量最多有 m m m个。

相似矩阵

A , B A,B A,B都是 n n n阶矩阵,如果存在可逆矩阵 P P P,使得
P − 1 A P = B P^{-1}AP=B P1AP=B
则称矩阵 A A A B B B相似,记作 A ∼ B A\thicksim B AB
相似矩阵的性质如下:

  • A ∼ A A\thicksim A AA
  • A ∼ B ⇔ B ∼ A A\thicksim B\Leftrightarrow B\thicksim A ABBA
  • A ∼ B , B ∼ A ⇒ A ∼ C A\thicksim B,B\thicksim A\Rightarrow A\thicksim C AB,BAAC
    证明:设 P 1 − 1 A P 1 = B , P 2 − 1 B P 2 = C P_1^{-1}AP_1=B,P_2^{-1}BP_2=C P11AP1=B,P21BP2=C
    P 2 − 1 ( P 1 − 1 A P 1 ) P 2 = C P_2^{-1}(P_1^{-1}AP_1)P_2=C P21(P11AP1)P2=C
    P = P 1 P 2 P=P_1P_2 P=P1P2,有 P − 1 = ( P 1 P 2 ) − 1 = P 2 − 1 P 1 − 1 P^{-1}=(P_1P_2)^{-1}=P_2^{-1}P_1^{-1} P1=(P1P2)1=P21P11所以 P − 1 A P = C P^{-1}AP=C P1AP=C
  • 如果 A ∼ B A\thicksim B AB,那么
    • A 2 ∼ B 2 A^2\thicksim B^2 A2B2
    • A + k E ∼ B + k E A+kE\thicksim B+kE A+kEB+kE
    • 如果 A A A可逆,则 A − 1 ∼ B − 1 A^{-1}\thicksim B^{-1} A1B1
  • A 1 ∼ B 1 , A 2 ∼ B 2 ⇒ [ A 1 A 2 ] ∼ [ B 1 B 2 ] A_1\thicksim B_1,A_2\thicksim B_2 \Rightarrow\begin{bmatrix}A_1&\\&A_2\end{bmatrix}\thicksim\begin{bmatrix}B_1&\\&B_2\end{bmatrix} A1B1,A2B2[A1A2][B1B2]
  • A ∼ B ⇒ r ( A ) = r ( B ) A\thicksim B\Rightarrow r(A)=r(B) ABr(A)=r(B)
    证明:
    r ( B ) = r ( P − 1 A P ) = r ( A P ) = r ( A ) r(B)=r(P^{-1}AP)=r(AP)=r(A) r(B)=r(P1AP)=r(AP)=r(A)
  • A ∼ B ⇒ ∣ A ∣ = ∣ B ∣ A\thicksim B\Rightarrow |A|=|B| ABA=B
    证明:
    ∣ B ∣ = ∣ P − 1 A P ∣ = ∣ P − 1 ∣ ∣ A ∣ ∣ P ∣ = ∣ A ∣ |B|=|P^{-1}AP|=|P^{-1}||A||P|=|A| B=P1AP=P1∣∣A∣∣P=A
  • A ∼ B ⇒ ∣ λ E − A ∣ = ∣ λ E − B ∣ A\thicksim B\Rightarrow |\lambda E-A|=|\lambda E-B| ABλEA=λEB
    证明:
    ∣ λ E − B ∣ = ∣ λ E − P − 1 A P ∣ = ∣ P − 1 ( λ E − A ) P ∣ = ∣ P − 1 ∣ ∣ λ E − A ∣ ∣ P ∣ = ∣ λ E − A ∣ |\lambda E-B|=|\lambda E-P^{-1}AP|=|P^{-1}(\lambda E-A)P|=|P^{-1}||\lambda E-A||P|=|\lambda E-A|\\ λEB=λEP1AP=P1(λEA)P=P1∣∣λEA∣∣P=λEA

相似对角化

如果 A A A能与对角矩阵相似,则称 A A A对角化
P − 1 A P = Λ A P = P Λ P^{-1}AP=\Lambda\\ AP=P\Lambda P1AP=ΛAP=PΛ
假设 A A A是三阶矩阵,对 P P P按列分块:
A ( p 1 , p 2 , p 3 ) = ( p 1 , p 2 , p 3 ) [ λ 1 λ 2 λ 3 ] [ A p 1 , A p 2 , A p 3 ] = [ λ 1 p 1 , λ 2 p 2 , λ 3 p 3 ] ⇓ A p 1 = λ 1 p 1 , A p 2 = λ 2 p 2 , A p 3 = λ 3 p 3 A(p_1,p_2,p_3)=(p_1,p_2,p_3) \begin{bmatrix} \lambda_1&&\\ &\lambda_2&\\ &&\lambda_3\\ \end{bmatrix}\\ [Ap_1,Ap_2,Ap_3]=[\lambda_1p_1,\lambda_2p_2,\lambda_3p_3]\\ \Downarrow\\ Ap_1=\lambda_1p_1,Ap_2=\lambda_2p_2,Ap_3=\lambda_3p_3 A(p1,p2,p3)=(p1,p2,p3) λ1λ2λ3 [Ap1,Ap2,Ap3]=[λ1p1,λ2p2,λ3p3]Ap1=λ1p1,Ap2=λ2p2,Ap3=λ3p3
那么:

  • A A A的特征值: λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ1,λ2,λ3
  • A A A的特征向量: p 1 , p 2 , p 3 p_1,p_2,p_3 p1,p2,p3

因为 P P P可逆,所以 p 1 , p 2 , p 3 p_1,p_2,p_3 p1,p2,p3线性无关。反之,若 A A A 3 3 3个无关的特征向量 p 1 , p 2 , p 3 p_1,p_2,p_3 p1,p2,p3,满足 A p i = λ i p i ( i = 1 , 2 , 3 ) Ap_i=\lambda_ip_i(i=1,2,3) Api=λipi(i=1,2,3),则有
A ( p 1 , p 2 , p 3 ) = ( p 1 , p 2 , p 3 ) [ λ 1 λ 2 λ 3 ] A(p_1,p_2,p_3)=(p_1,p_2,p_3) \begin{bmatrix} \lambda_1&&\\ &\lambda_2&\\ &&\lambda_3\\ \end{bmatrix} A(p1,p2,p3)=(p1,p2,p3) λ1λ2λ3
P = [ p 1 , p 2 , p 3 ] , Λ = [ λ 1 λ 2 λ 3 ] P=[p_1,p_2,p_3],\Lambda=\begin{bmatrix}\lambda_1&&\\&\lambda_2&\\&&\lambda_3\\\end{bmatrix} P=[p1,p2,p3],Λ= λ1λ2λ3 ,则
P − 1 A P = Λ P^{-1}AP=\Lambda P1AP=Λ
矩阵对角化的性质如下:

  • n n n阶矩阵 A A A可对角化 ⇔ A \Leftrightarrow A A n n n个线性无关的特征向量,且
    A ∼ [ λ 1 λ 2 ⋱ λ n ] A\thicksim \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\\ \end{bmatrix} A λ1λ2λn
  • n n n阶矩阵 A A A可对角化 ⇔ \Leftrightarrow λ i \lambda_i λi A A A n i n_i ni重特征值,则 λ i \lambda_i λi n i n_i ni个线性无关的特征向量 ⇔ \Leftrightarrow r ( λ E − A ) = n − n i r(\lambda E-A)=n-n_i r(λEA)=nni λ i \lambda_i λi n i n_i ni重特征值。

实对称矩阵

满足以下两个条件的方阵称为实对称矩阵

  • A = A T A=A^T A=AT
  • 矩阵的元素全为实数。

实对称矩阵的性质如下:

  • 若矩阵 A A A是实对称矩阵,则 A A A的特征值都是实数。
    证明:设 A α = λ α A\alpha=\lambda \alpha Aα=λα,则
    A α ˉ = λ α ˉ A ˉ α ˉ = λ ˉ α ˉ \bar{A\alpha}=\bar{\lambda\alpha}\\ \bar{A}\bar{\alpha}=\bar{\lambda}\bar{\alpha}\\ Aαˉ=λαˉAˉαˉ=λˉαˉ
    因为 A A A是实对称矩阵,所以 A ˉ = A \bar{A}=A Aˉ=A
    A α ˉ = λ ˉ α ˉ   α T A α ˉ = λ ˉ α T α ˉ A\bar{\alpha}=\bar{\lambda}\bar{\alpha}\\\ \alpha^TA\bar{\alpha}=\bar{\lambda}\alpha^T\bar{\alpha}\\ Aαˉ=λˉαˉ αTAαˉ=λˉαTαˉ
    因为 α T A α ˉ \alpha^TA\bar{\alpha} αTAαˉ α T α ˉ \alpha^T\bar{\alpha} αTαˉ都是数,所以:
    α T A α ˉ = ( α T A α ˉ ) T = λ α ˉ T α = λ α T α ˉ α T α ˉ = ( α T α ˉ ) T = α ˉ T α ⇓ ( λ − λ ˉ ) α T α ˉ = 0 \alpha^TA\bar{\alpha}=(\alpha^TA\bar{\alpha})^T=\lambda\bar{\alpha}^T\alpha=\lambda\alpha^T\bar{\alpha}\\ \alpha^T\bar{\alpha}=(\alpha^T\bar{\alpha})^T=\bar{\alpha}^T\alpha\\ \Downarrow\\ (\lambda-\bar{\lambda})\alpha^T\bar{\alpha}=0 αTAαˉ=(αTAαˉ)T=λαˉTα=λαTαˉαTαˉ=(αTαˉ)T=αˉTα(λλˉ)αTαˉ=0
    因为 α ≠ O \alpha\neq O α=O,所以 α T α ˉ > 0 \alpha^T\bar{\alpha}>0 αTαˉ>0,因此 λ = λ ˉ \lambda=\bar{\lambda} λ=λˉ
  • 实对称矩阵 A A A的不同特征值 λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2所对应的特征向量 α 1 , α 2 \alpha_1,\alpha_2 α1,α2必正交。
    证明:由 A α 1 = λ 1 α 2 , A α 2 = λ 2 α 2 , λ 1 = λ 2 A\alpha_1=\lambda_1\alpha_2,A\alpha_2=\lambda_2\alpha_2,\lambda_1=\lambda_2 Aα1=λ1α2,Aα2=λ2α2,λ1=λ2得:
    λ 1 α 2 α 1 = α 1 T A α 1 = α 2 T A T α 1 = ( A α 2 ) T α 1 = ( λ 2 α 2 ) T α 1 = λ 2 α 2 T α 1 ⇓ ( λ 1 − λ 2 ) α 2 T α 1 = 0 \lambda_1\alpha_2\alpha_1=\alpha_1^TA\alpha_1=\alpha_2^TA^T\alpha_1=(A\alpha_2)^T\alpha_1=(\lambda_2\alpha_2)^T\alpha_1=\lambda_2\alpha_2^T\alpha_1\\ \Downarrow\\ (\lambda_1-\lambda_2)\alpha_2^T\alpha_1=0\\ λ1α2α1=α1TAα1=α2TATα1=(Aα2)Tα1=(λ2α2)Tα1=λ2α2Tα1(λ1λ2)α2Tα1=0
    因为 λ 1 ≠ λ 2 \lambda_1\neq\lambda_2 λ1=λ2,所以 α 2 T α 1 = 0 \alpha_2^T\alpha_1=0 α2Tα1=0
  • n n n阶实对称矩阵 A A A必可对角化,且总存在正交矩阵 Q Q Q,使得
    Q − 1 A Q = Q T A Q = [ λ 1 λ 2 ⋱ λ n ] Q^{-1}AQ=Q^TAQ= \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\\ \end{bmatrix} Q1AQ=QTAQ= λ1λ2λn
    其中 λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1,λ2,,λn A A A的特征值。
    证明:对 n n n用数学归纳法,当 n = 1 n=1 n=1时,命题显然成立。假设 n − 1 n-1 n1时命题成立,对于 n n n阶矩阵 A A A,设 λ 1 \lambda_1 λ1 A A A的特征值, α 1 \alpha_1 α1是对应于 λ 1 \lambda_1 λ1的单位特征向量,将 α 1 \alpha_1 α1扩充为 R n R^n Rn的一组规范正交基: α 1 , α 2 … , α n \alpha_1,\alpha_2\dots,\alpha_n α1,α2,αn,即 [ α 1 , α 2 … , α n ] [\alpha_1,\alpha_2\dots,\alpha_n] [α1,α2,αn] n n n阶正交矩阵。由 A α 1 = λ 1 α 1 A\alpha_1=\lambda_1\alpha_1 Aα1=λ1α1,并设
    A α 2 = b 12 α 1 + b 22 α 2 + ⋯ + b n 2 α n … A α n = b 1 n α 1 + b 2 n α 2 + ⋯ + b n n α n A\alpha_2=b_{12}\alpha_1+b_{22}\alpha_2+\dots+b_{n2}\alpha_n\\ \dots\\ A\alpha_n=b_{1n}\alpha_1+b_{2n}\alpha_2+\dots+b_{nn}\alpha_n Aα2=b12α1+b22α2++bn2αnAαn=b1nα1+b2nα2++bnnαn

你可能感兴趣的:(高数,线性代数,机器学习,决策树)