5 特征方程, 特征多项式, 特征空间,
特征值和特征向量
设 A A A是 n n n阶方阵, λ \lambda λ和非零向量 x x x满足 A x = λ x Ax = \lambda x Ax=λx 则称 λ \lambda λ为 A A A的特征值, 对应向量 x x x称特征值 λ \lambda λ的特征向量, 丄式称特征值问题.
特征方程和特征多项式
特征值问题还可以写成 ( A − λ E ) = 0 (A - \lambda E)=0 (A−λE)=0该式是一个 n n n元齐次线性方程组, 存在非 0 0 0解的条件是 ∣ A − λ E ∣ = 0 |A - \lambda E| = 0 ∣A−λE∣=0称之为方阵 A A A的特征方程, f ( λ ) = ∣ A − λ E ∣ f(\lambda) = |A - \lambda E| f(λ)=∣A−λE∣为 λ \lambda λ的 n n n次多项式, 称 A A A的特征多项式
特征值性质
- 性质1: ∑ i = 1 n λ i = ∑ i = 1 n a i i \sum_{i=1}^n\lambda_i = \sum_{i=1}^na_{ii} i=1∑nλi=i=1∑naii ∏ i = 1 n λ i = ∣ A ∣ \prod_{i=1}^n\lambda_i = |A| i=1∏nλi=∣A∣
- 性质2: 如果 A A A可逆, λ , x \lambda, x λ,x为其特征值和对应的特征向量, 则 1 / λ , x 1/\lambda, x 1/λ,x是 A − 1 A^{-1} A−1的特征值和特征向量
- 性质3: λ , x \lambda, x λ,x为 A A A的特征值和对应的特征向量, 则 λ m , x \lambda^m, x λm,x为 A m A^m Am的特征值和对应的特征向量
- 性质4: 各不不同特征值对应的特征向量线性无关
- 性质推论: ϕ ( λ ) \phi(\lambda) ϕ(λ)是 ϕ ( A ) \phi(A) ϕ(A)的特征值, ϕ ( λ ) = a 0 + a 1 λ + ⋯ + a n λ n \phi(\lambda)=a_0 + a_1\lambda + \cdots + a_n\lambda^n ϕ(λ)=a0+a1λ+⋯+anλn ϕ ( A ) = a 0 ∗ E + a 1 A + ⋯ + a n A n \phi(A)=a_0*E+ a_1A+ \cdots + a_nA^n ϕ(A)=a0∗E+a1A+⋯+anAn其中 a 0 , a 1 , … , a n a_0, a_1, \ldots, a_n a0,a1,…,an为常数
特征空间
特征值 λ \lambda λ的特征所有特征向量和 0 0 0向量的并集称为 λ \lambda λ的特征空间
特征值问题和 A x = b Ax=b Ax=b
设 λ 1 , … , λ n \lambda_1, \ldots, \lambda_n λ1,…,λn和 x 1 , … , x n x_1, \ldots, x_n x1,…,xn分别是 A A A的特征值和特征向量, 设 A x = b Ax=b Ax=b的解为 x ∗ x^* x∗, x ∗ x^* x∗可以作如下分解 x ∗ = ∑ i = 1 n c i x i x^*=\sum_{i=1}^nc_ix_i x∗=i=1∑ncixi由 A x i = λ i x i Ax_i = \lambda_i x_i Axi=λixi A x ∗ = A ∑ i = 1 n c i x i = ∑ i = 1 n c i A x i = ∑ i = 1 n c i λ i x i = b Ax^* =A\sum_{i=1}^nc_ix_i=\sum_{i=1}^nc_iAx_i=\sum_{i=1}^nc_i\lambda_ix_i=b Ax∗=Ai=1∑ncixi=i=1∑nciAxi=i=1∑nciλixi=b因此, 可以根据 b b b计算 c i c_i ci, 再代入 x ∗ x^* x∗的分解式, 得到 A x = b Ax=b Ax=b的解
通过此例思考特征值和特征向量的意义
相似矩阵
表示同一线性变换在不同基下的的变换矩阵之间的关系
设 A , B A, B A,B均为 n n n阶方阵, 若存在可逆矩阵 P P P, 使 B = P − 1 A P B=P^{-1}AP B=P−1AP则称 A A A是 B B B的相似矩阵或 B B B是 A A A的相似矩阵
相似矩阵的性质
若 A , B A, B A,B相似, 则 A A A和 B B B的特征多项式相同, 从而二者特征值相同
若 A A A与对角矩阵 [ λ 1 ⋯ 0 ⋮ ⋮ 0 ⋯ λ n ] \left[\begin{matrix} \lambda_1 &\cdots & 0 \\ \vdots & & \vdots \\ 0 & \cdots &\lambda_n\end{matrix}\right] ⎣⎢⎡λ1⋮0⋯⋯0⋮λn⎦⎥⎤相似, 则 λ 1 , λ 2 , … , λ n \lambda_1, \lambda_2, \ldots, \lambda_n λ1,λ2,…,λn即为 A A A的 n n n个特征值
n n n阶方阵的对角化
n n n阶方阵 A A A的对角化: 若存在可逆矩阵 P P P, 使 P − 1 A P = Λ P^{-1}AP=\Lambda P−1AP=Λ为对角矩阵, 称该运算为矩阵 A A A的对角化, 且有 { P = ( P 1 , P 2 , … , P n ) , A P i = λ i P i \left\{\begin{aligned} &P = (P_1, P_2, \ldots, P_n), \\ &AP_i = \lambda_iP_i\end{aligned}\right. {P=(P1,P2,…,Pn),APi=λiPi其中 P i P_i Pi为列向量, 恰为特征值 λ i \lambda_i λi对应的特征向量, P P P不唯一, 也可能为复矩阵
方阵 A A A与对角矩阵相似的充要条件
n n n阶方阵 A A A与对角矩阵 Λ \Lambda Λ相似的充分必要条件是 A A A有 n n n个线性无关的特征向量
若 n n n阶方阵 A A A的 n n n个特征值互不相等, 则 A A A与 Λ \Lambda Λ相似
实对称矩阵
实对称矩阵的特征值也是实数
实对称矩阵的特征向量也可以为实向量, 因 λ i \lambda_i λi为实数, 则齐次线性方程组有 ( A − λ i E ) x i = 0 (A-\lambda_iE)x_i=0 (A−λiE)xi=0是实系数方程组, …
实对称矩阵必可以对角化
一般二次型
含有 n n n个变量 x 1 , x 2 , … , x n x_1, x_2, \ldots, x_n x1,x2,…,xn的二次齐次函数 f ( x 1 , x 2 , … , x n ) = ∑ i = 1 n ∑ j = 1 n a i j x i x j f(x_1, x_2, \ldots,x_n)=\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_ix_j f(x1,x2,…,xn)=i=1∑nj=1∑naijxixj称为一般二次型, 可以表示为矩阵形式 f ( x 1 , x 2 , … , x n ) = [ x 1 , x 2 , … , x n ] [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋯ ⋮ a n 1 a n 2 ⋯ a n n ] [ x 1 x 2 ⋮ x n ] f(x_1, x_2, \ldots, x_n)=[x_1, x_2, \ldots, x_n]\left[\begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \cdots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix}\right] \left[\begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n\end{matrix}\right] f(x1,x2,…,xn)=[x1,x2,…,xn]⎣⎢⎢⎢⎡a11a21⋮an1a12a22⋮an2⋯⋯⋯⋯a1na2n⋮ann⎦⎥⎥⎥⎤⎣⎢⎢⎢⎡x1x2⋮xn⎦⎥⎥⎥⎤, 可简记为 f ( x ) = x T A x f(x) = x^T A x f(x)=xTAx注意, 矩阵 A A A为对称矩阵, 即 A T = A A^T=A AT=A
标准二次型
若一般二次型没有变量的交叉相乘项, 即 f ( x 1 , x 2 , … , x n ) = ∑ i = 1 n a i i x i 2 f(x_1, x_2, \ldots, x_n) = \sum_{i=1}^n a_{ii}x_i^2 f(x1,x2,…,xn)=i=1∑naiixi2称为标准二次型, 矩阵表示下 A A A为对角矩阵
二次型对角化 : 正交变换法
给定一般二次型 f ( x ) = x T A x f(x) = x^TAx f(x)=xTAx, 寻找可逆矩阵 C C C, 使得 f ( y ) = x T A x = ( C y ) T A ( C y ) = y T ( C T A C ) y = y T B y f(y)=x^TAx=(Cy)^TA(Cy)=y^T(C^TAC)y=y^TBy f(y)=xTAx=(Cy)TA(Cy)=yT(CTAC)y=yTBy为 y y y的标准二次型, 式中, B = C T A C B=C^TAC B=CTAC次过程称为二次型的对角化
任给可逆矩阵 C C C, 令 B = C T A C B=C^TAC B=CTAC, 若 A A A为对称矩阵, 则 B B B也是对称矩阵, 且 A , B A, B A,B的秩相等
任意二次型存在正交变换 x = P y x=Py x=Py, 使 f ( x ) f(x) f(x)变换为标准二次型 f ( y ) = y T B y f(y)=y^TBy f(y)=yTBy, B B B为对角矩阵, 且对角元素为 A A A的特征值,
根据 n n n阶方阵的对角化相关内容, 任意实对称矩阵 A A A存在正交矩阵 P P P, 使 P − 1 A P = Λ P^{-1}AP=\Lambda P−1AP=Λ, 而正交矩阵满足 P − 1 = P T P^{-1}=P^T P−1=PT, 即 P T A P = Λ P^TAP=\Lambda PTAP=Λ
正交矩阵: P − 1 = P T P^{-1}=P^T P−1=PT
二次型对角化 : Lagrange配方法
.略
正定二次型
设二次型 f ( x ) = x T A x f(x)=x^TAx f(x)=xTAx, 若对于任意 x ≠ 0 x\neq 0 x=0都有 f ( x ) > 0 f(x) > 0 f(x)>0, 则 f ( x ) f(x) f(x)称为正定二次型, 并称对称矩阵 A A A是正定的. 若对于任意 x ≠ 0 x\neq 0 x=0都有 f ( x ) < 0 f(x)<0 f(x)<0, 都有 f ( x ) < 0 f(x) < 0 f(x)<0, 则称其为负定二次型, 同时称对称矩阵 A A A为负定的.
惯性定理
设实二次型 f ( x ) = x T A x f(x) = x^TAx f(x)=xTAx, 其秩为 r r r, 有两个实的可逆变换 x = C Y x = CY x=CY x = P z x = Pz x=Pz使 { f ( y ) = k 1 y 1 2 + … + k r y r 2 k i ≠ 0 f ( z ) = λ 1 z 1 2 + … + λ r z r 2 λ i ≠ 0 \left\{\begin{aligned} f(y) = k_1y_1^2 + \ldots + k_ry_r^2 \quad k_i \neq 0 \\ f(z) = \lambda_1z_1^2 + \ldots + \lambda_rz_r^2 \quad \lambda_i \neq 0\end{aligned} \right. {f(y)=k1y12+…+kryr2ki=0f(z)=λ1z12+…+λrzr2λi=0则 k 1 , … , k r k_1, \ldots, k_r k1,…,kr中的正数个数与 λ 1 , … , λ r \lambda_1, \ldots, \lambda_r λ1,…,λr中正数个数相等
正二次型的充要条件
实二次型为 f ( x ) = x T A x f(x) = x^TAx f(x)=xTAx为正定的充分必要条件是, 它的标准型中 n n n个系数全为正
推论: 对称矩阵 A A A为正定的充要条件是 A A A的特征值全为正
Hermite矩阵
见矩阵论 - Part I - 对称矩阵和反对称矩阵, Hermite矩阵是实数域上的对称矩阵和反对称矩阵的推广
自共轭矩阵
实对称矩阵的推广, 实对称矩阵为转置等于本省, 共轭转置等于自身的复矩阵称Hermite矩阵
推论: 任一复矩阵可分解为Hermite矩阵和反Hermite矩阵之和
Hermite二次型
若 A A A是Hermite矩阵, 则 H ( x ) = x ∗ A x H(x) = x^* A x H(x)=x∗Ax称为Hermite二次型, 其中 [ ] ∗ []^* []∗为共轭转置
Hermite二次型的性质
性质1: Hermite二次型 H ( x ) H(x) H(x)为实数
性质2: Hermite矩阵的特征值 λ \lambda λ为实数