设A是n阶方阵,如果数 λ \lambda λ和n维非零列向量x满足关系式
A x = λ x Ax = \lambda x Ax=λx
则称 λ \lambda λ为A的特征值,x为A的属于 λ \lambda λ的一个特征向量
一般地,由 A x = λ x Ax = \lambda x Ax=λx可得
( A − λ E ) x = 0 (1) \tag*{(1)} (A-\lambda E)x=0 (A−λE)x=0(1)
(1)式有非零解的充要条件是
∣ A − λ E ∣ = 0 (2) \tag*{(2)} |A-\lambda E|=0 ∣A−λE∣=0(2)
(2)为以 λ \lambda λ为未知数的一元n次方程,称为矩阵A的特征方程,左端的 f ( λ ) = ∣ A − λ E ∣ f(\lambda)=|A-\lambda E| f(λ)=∣A−λE∣称为A的特征多项式
由此得到求解特征值与特征向量的求法:
(1)解 ∣ A − λ E ∣ = 0 |A-\lambda E|=0 ∣A−λE∣=0得特征值 λ \lambda λ;
(2)将所求 λ \lambda λ代入 ∣ A − λ E ∣ x = 0 |A-\lambda E|x=0 ∣A−λE∣x=0中,方程组的非零解即为 λ \lambda λ对应的特征向量。
矩阵A所有的特征向量合在一起不是向量空间,因特征向量不为零向量.
所以特征值对应的特征向量再加上零向量构成一个向量空间,称为特征子空间.
已知A的特征值与特征向量分别是 λ \lambda λ和微量x,m次多项式 ϕ ( A ) = a 0 E + a 1 A + ⋯ + a m A m \phi(A)=a_0E+a_1A+\cdots+a_mA^m ϕ(A)=a0E+a1A+⋯+amAm的特征值为 ϕ ( λ ) = a 0 + a 1 λ + ⋯ + a m λ m \phi(\lambda)=a_0+a_1\lambda+\cdots+a_m\lambda^m ϕ(λ)=a0+a1λ+⋯+amλm,对应于 ϕ ( λ ) \phi(\lambda) ϕ(λ)的特征向量仍为x.
若A可逆,设 λ \lambda λ为A的特征值,x为 λ \lambda λ对应的特征向量,有 A x = λ x ⇒ A − 1 A X = A − 1 λ X ⇒ A − 1 X = x λ Ax=\lambda x \Rightarrow A^{-1}AX=A^{-1}\lambda X\Rightarrow A^{-1}X=\frac{x}{\lambda} Ax=λx⇒A−1AX=A−1λX⇒A−1X=λx,所以 A − 1 A^{-1} A−1的特征值为 1 λ \frac{1}{\lambda} λ1,特征向量不变
∣ A T − λ E ∣ = ∣ ( A − λ E ) T ∣ = ∣ A − λ E ∣ |A^T-\lambda E|=|(A-\lambda E)^T|=|A-\lambda E| ∣AT−λE∣=∣(A−λE)T∣=∣A−λE∣,故 A T A^T AT与A的特征多项式相同 ,从而 A T A^T AT与A的特征值相同,但其同一特征值对应的特征向量不一定相同,需求解 ( A T − λ E ) x = 0 (A^T-\lambda E)x=0 (AT−λE)x=0
如果A可逆,已知A的特征值 λ \lambda λ与特征向量x
A x = λ x ⇒ A ∗ A x = A ∗ λ x ⇒ ∣ A ∣ x = A ∗ λ x ⇒ A ∗ x = ∣ A ∣ x λ Ax=\lambda x \Rightarrow A^*A x = A^*\lambda x \Rightarrow |A|x=A^*\lambda x \Rightarrow A^*x=\frac{|A|x}{\lambda} Ax=λx⇒A∗Ax=A∗λx⇒∣A∣x=A∗λx⇒A∗x=λ∣A∣x,故 A ∗ A^* A∗的特征值为 ∣ A ∣ λ \frac{|A|}{\lambda} λ∣A∣,对应的特征向量x
若n阶矩阵A满足 A 2 = A A^2=A A2=A,称A为幂等矩阵,它的特征值为1或0:
证明:
A 2 X = λ 2 X = A X = λ X ⇒ ( λ 2 − λ ) X = 0 ⇒ λ ( λ − 1 ) = 0 ⇒ λ = 0 , 1 A^2X=\lambda^2X=AX=\lambda X \Rightarrow (\lambda^2-\lambda)X=0 \Rightarrow \lambda(\lambda-1)=0 \Rightarrow \lambda=0,1 A2X=λ2X=AX=λX⇒(λ2−λ)X=0⇒λ(λ−1)=0⇒λ=0,1
若n阶矩阵A存在一个k,使 A k = 0 A^k=0 Ak=0,称A为幂零矩阵,它的特征值均为0.
证明:
A k X = A k − 1 ( A X ) = A k − 1 ( λ X ) = λ ( A k − 1 X ) = 0 A^k X = A^{k-1} (AX) = A^{k-1} (λX) = λ(A^{k-1} X) = 0 AkX=Ak−1(AX)=Ak−1(λX)=λ(Ak−1X)=0,根据定义, A k = 0 A^k = 0 Ak=0,因此 A k − 1 X A^{k-1}X Ak−1X 是一个零向量。
以此类推,我们可以得出 A k − 2 v = 0 , A k − 3 X = 0 A^{k-2} v = 0,A^{k-3}X = 0 Ak−2v=0,Ak−3X=0,依此类推,直到 A X = 0 A X = 0 AX=0。
所以,无论特征值 λ \lambda λ 是多少,它都会满足 A X = λ X = 0 X AX = \lambda X = 0X AX=λX=0X,即特征向量对应的特征值为 0。
综上所述,幂零矩阵的特征值总是 0,这是因为幂零矩阵的特征向量最终都会被逐步"消减"为零向量。
∣ A ∣ = λ 1 λ 2 . . . λ n |A|=\lambda_1\lambda_2...\lambda_n ∣A∣=λ1λ2...λn
证明:由于在复数范围内有
∣ A − λ E ∣ = ( λ 1 − λ ) ( λ 2 − λ ) . . . ( λ n − λ ) |A-\lambda E|=(\lambda_1 - \lambda)(\lambda_2-\lambda)...(\lambda_n - \lambda) ∣A−λE∣=(λ1−λ)(λ2−λ)...(λn−λ)
令 λ = 0 \lambda = 0 λ=0得 ∣ A ∣ = λ 1 λ 2 . . . λ n |A|=\lambda_1\lambda_2...\lambda_n ∣A∣=λ1λ2...λn
λ 1 + λ 2 + . . . + λ n = a 11 + a 22 + . . . + a n n \lambda_1+\lambda_2+...+\lambda_n = a_{11}+a_{22}+...+a_{nn} λ1+λ2+...+λn=a11+a22+...+ann
证见原文
证见原文
设 λ 1 , λ 2 , . . . , λ s \lambda_1,\lambda_2,...,\lambda_s λ1,λ2,...,λs是方阵A的互异特征值, ξ 1 , ξ 2 , . . . , ξ s \xi_1,\xi_2,...,\xi_s ξ1,ξ2,...,ξs是分别属于它们的特征向量,那么 ξ 1 , ξ 2 , . . . , ξ s \xi_1,\xi_2,...,\xi_s ξ1,ξ2,...,ξs线性无关
同一特征值的特征向量的线性组合(组合系数不全为零)仍然为该特征值的特征向量
设 λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2是A的两个 互异特征值, ξ 1 , ξ 2 , . . . , ξ s \xi_1,\xi_2,...,\xi_s ξ1,ξ2,...,ξs和 η 1 , η 2 , . . . , η t \eta_1,\eta_2,...,\eta_t η1,η2,...,ηt分别是属于 λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2的特征向量,则 ξ 1 , ξ 2 , . . . , ξ s , η 1 , η 2 , . . . , η t \xi_1,\xi_2,...,\xi_s, \eta_1,\eta_2,...,\eta_t ξ1,ξ2,...,ξs,η1,η2,...,ηt线性无关