矩阵论 - Part III

矩阵论 - Part III

文章目录

  • 矩阵论 - Part III
    • 概念索引
    • 5 特征问题
    • 6 二次型
    • 7 矩阵变换

概念索引

5 特征方程, 特征多项式, 特征空间,

5 特征问题

特征值特征向量

A A A n n n阶方阵, λ \lambda λ非零向量 x x x满足 A x = λ x Ax = \lambda x Ax=λx 则称 λ \lambda λ A A A特征值, 对应向量 x x x称特征值 λ \lambda λ特征向量, 丄式称特征值问题.

特征方程特征多项式

特征值问题还可以写成 ( A − λ E ) = 0 (A - \lambda E)=0 (AλE)=0该式是一个 n n n元齐次线性方程组, 存在非 0 0 0解的条件是 ∣ A − λ E ∣ = 0 |A - \lambda E| = 0 AλE=0称之为方阵 A A A特征方程, f ( λ ) = ∣ A − λ E ∣ f(\lambda) = |A - \lambda E| f(λ)=AλE λ \lambda λ n n n次多项式, 称 A A A特征多项式

特征值性质

  • 性质1: ∑ i = 1 n λ i = ∑ i = 1 n a i i \sum_{i=1}^n\lambda_i = \sum_{i=1}^na_{ii} i=1nλi=i=1naii ∏ i = 1 n λ i = ∣ A ∣ \prod_{i=1}^n\lambda_i = |A| i=1nλi=A
  • 性质2: 如果 A A A可逆, λ , x \lambda, x λ,x为其特征值和对应的特征向量, 则 1 / λ , x 1/\lambda, x 1/λ,x A − 1 A^{-1} A1的特征值和特征向量
  • 性质3: λ , x \lambda, x λ,x A A A的特征值和对应的特征向量, 则 λ m , x \lambda^m, x λm,x A m A^m Am的特征值和对应的特征向量
  • 性质4: 各不不同特征值对应的特征向量线性无关
  • 性质推论: ϕ ( λ ) \phi(\lambda) ϕ(λ) ϕ ( A ) \phi(A) ϕ(A)的特征值, ϕ ( λ ) = a 0 + a 1 λ + ⋯ + a n λ n \phi(\lambda)=a_0 + a_1\lambda + \cdots + a_n\lambda^n ϕ(λ)=a0+a1λ++anλn ϕ ( A ) = a 0 ∗ E + a 1 A + ⋯ + a n A n \phi(A)=a_0*E+ a_1A+ \cdots + a_nA^n ϕ(A)=a0E+a1A++anAn其中 a 0 , a 1 , … , a n a_0, a_1, \ldots, a_n a0,a1,,an为常数

特征空间

特征值 λ \lambda λ的特征所有特征向量和 0 0 0向量的并集称为 λ \lambda λ的特征空间

特征值问题和 A x = b Ax=b Ax=b

λ 1 , … , λ n \lambda_1, \ldots, \lambda_n λ1,,λn x 1 , … , x n x_1, \ldots, x_n x1,,xn分别是 A A A的特征值和特征向量, 设 A x = b Ax=b Ax=b的解为 x ∗ x^* x, x ∗ x^* x可以作如下分解 x ∗ = ∑ i = 1 n c i x i x^*=\sum_{i=1}^nc_ix_i x=i=1ncixi A x i = λ i x i Ax_i = \lambda_i x_i Axi=λixi A x ∗ = A ∑ i = 1 n c i x i = ∑ i = 1 n c i A x i = ∑ i = 1 n c i λ i x i = b Ax^* =A\sum_{i=1}^nc_ix_i=\sum_{i=1}^nc_iAx_i=\sum_{i=1}^nc_i\lambda_ix_i=b Ax=Ai=1ncixi=i=1nciAxi=i=1nciλixi=b因此, 可以根据 b b b计算 c i c_i ci, 再代入 x ∗ x^* x的分解式, 得到 A x = b Ax=b Ax=b的解
通过此例思考特征值和特征向量的意义

相似矩阵

表示同一线性变换在不同基下的的变换矩阵之间的关系

A , B A, B A,B均为 n n n阶方阵, 若存在可逆矩阵 P P P, 使 B = P − 1 A P B=P^{-1}AP B=P1AP则称 A A A B B B相似矩阵 B B B A A A相似矩阵

相似矩阵的性质

A , B A, B A,B相似, 则 A A A B B B的特征多项式相同, 从而二者特征值相同

A A A与对角矩阵 [ λ 1 ⋯ 0 ⋮ ⋮ 0 ⋯ λ n ] \left[\begin{matrix} \lambda_1 &\cdots & 0 \\ \vdots & & \vdots \\ 0 & \cdots &\lambda_n\end{matrix}\right] λ100λn相似, 则 λ 1 , λ 2 , … , λ n \lambda_1, \lambda_2, \ldots, \lambda_n λ1,λ2,,λn即为 A A A n n n个特征值

n n n阶方阵的对角化

n n n阶方阵 A A A对角化: 若存在可逆矩阵 P P P, 使 P − 1 A P = Λ P^{-1}AP=\Lambda P1AP=Λ为对角矩阵, 称该运算为矩阵 A A A的对角化, 且有 { P = ( P 1 , P 2 , … , P n ) , A P i = λ i P i \left\{\begin{aligned} &P = (P_1, P_2, \ldots, P_n), \\ &AP_i = \lambda_iP_i\end{aligned}\right. {P=(P1,P2,,Pn),APi=λiPi其中 P i P_i Pi为列向量, 恰为特征值 λ i \lambda_i λi对应的特征向量, P P P不唯一, 也可能为复矩阵

方阵 A A A与对角矩阵相似的充要条件

n n n阶方阵 A A A与对角矩阵 Λ \Lambda Λ相似的充分必要条件是 A A A n n n个线性无关的特征向量

n n n阶方阵 A A A n n n个特征值互不相等, 则 A A A Λ \Lambda Λ相似

实对称矩阵

实对称矩阵的特征值也是实数

实对称矩阵的特征向量也可以为实向量, 因 λ i \lambda_i λi为实数, 则齐次线性方程组有 ( A − λ i E ) x i = 0 (A-\lambda_iE)x_i=0 (AλiE)xi=0是实系数方程组, …

实对称矩阵必可以对角化

6 二次型

一般二次型

含有 n n n个变量 x 1 , x 2 , … , x n x_1, x_2, \ldots, x_n x1,x2,,xn的二次齐次函数 f ( x 1 , x 2 , … , x n ) = ∑ i = 1 n ∑ j = 1 n a i j x i x j f(x_1, x_2, \ldots,x_n)=\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_ix_j f(x1,x2,,xn)=i=1nj=1naijxixj称为一般二次型, 可以表示为矩阵形式 f ( x 1 , x 2 , … , x n ) = [ x 1 , x 2 , … , x n ] [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋯ ⋮ a n 1 a n 2 ⋯ a n n ] [ x 1 x 2 ⋮ x n ] f(x_1, x_2, \ldots, x_n)=[x_1, x_2, \ldots, x_n]\left[\begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \cdots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix}\right] \left[\begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n\end{matrix}\right] f(x1,x2,,xn)=[x1,x2,,xn]a11a21an1a12a22an2a1na2nannx1x2xn, 可简记为 f ( x ) = x T A x f(x) = x^T A x f(x)=xTAx注意, 矩阵 A A A为对称矩阵, 即 A T = A A^T=A AT=A

标准二次型

一般二次型没有变量的交叉相乘项, 即 f ( x 1 , x 2 , … , x n ) = ∑ i = 1 n a i i x i 2 f(x_1, x_2, \ldots, x_n) = \sum_{i=1}^n a_{ii}x_i^2 f(x1,x2,,xn)=i=1naiixi2称为标准二次型, 矩阵表示下 A A A为对角矩阵

二次型对角化 : 正交变换法

给定一般二次型 f ( x ) = x T A x f(x) = x^TAx f(x)=xTAx, 寻找可逆矩阵 C C C, 使得 f ( y ) = x T A x = ( C y ) T A ( C y ) = y T ( C T A C ) y = y T B y f(y)=x^TAx=(Cy)^TA(Cy)=y^T(C^TAC)y=y^TBy f(y)=xTAx=(Cy)TA(Cy)=yT(CTAC)y=yTBy y y y的标准二次型, 式中, B = C T A C B=C^TAC B=CTAC次过程称为二次型的对角化

任给可逆矩阵 C C C, 令 B = C T A C B=C^TAC B=CTAC, 若 A A A为对称矩阵, 则 B B B也是对称矩阵, 且 A , B A, B A,B的秩相等

任意二次型存在正交变换 x = P y x=Py x=Py, 使 f ( x ) f(x) f(x)变换为标准二次型 f ( y ) = y T B y f(y)=y^TBy f(y)=yTBy, B B B为对角矩阵, 且对角元素为 A A A的特征值,

根据 n n n阶方阵的对角化相关内容, 任意实对称矩阵 A A A存在正交矩阵 P P P, 使 P − 1 A P = Λ P^{-1}AP=\Lambda P1AP=Λ, 而正交矩阵满足 P − 1 = P T P^{-1}=P^T P1=PT, 即 P T A P = Λ P^TAP=\Lambda PTAP=Λ

正交矩阵: P − 1 = P T P^{-1}=P^T P1=PT

二次型对角化 : Lagrange配方法

.略

正定二次型

设二次型 f ( x ) = x T A x f(x)=x^TAx f(x)=xTAx, 若对于任意 x ≠ 0 x\neq 0 x=0都有 f ( x ) > 0 f(x) > 0 f(x)>0, 则 f ( x ) f(x) f(x)称为正定二次型, 并称对称矩阵 A A A是正定的. 若对于任意 x ≠ 0 x\neq 0 x=0都有 f ( x ) < 0 f(x)<0 f(x)<0, 都有 f ( x ) < 0 f(x) < 0 f(x)<0, 则称其为负定二次型, 同时称对称矩阵 A A A为负定的.

惯性定理
设实二次型 f ( x ) = x T A x f(x) = x^TAx f(x)=xTAx, 其秩为 r r r, 有两个实的可逆变换 x = C Y x = CY x=CY x = P z x = Pz x=Pz使 { f ( y ) = k 1 y 1 2 + … + k r y r 2 k i ≠ 0 f ( z ) = λ 1 z 1 2 + … + λ r z r 2 λ i ≠ 0 \left\{\begin{aligned} f(y) = k_1y_1^2 + \ldots + k_ry_r^2 \quad k_i \neq 0 \\ f(z) = \lambda_1z_1^2 + \ldots + \lambda_rz_r^2 \quad \lambda_i \neq 0\end{aligned} \right. {f(y)=k1y12++kryr2ki=0f(z)=λ1z12++λrzr2λi=0 k 1 , … , k r k_1, \ldots, k_r k1,,kr中的正数个数与 λ 1 , … , λ r \lambda_1, \ldots, \lambda_r λ1,,λr中正数个数相等

正二次型的充要条件

实二次型为 f ( x ) = x T A x f(x) = x^TAx f(x)=xTAx为正定的充分必要条件是, 它的标准型中 n n n个系数全为正

推论: 对称矩阵 A A A为正定的充要条件是 A A A的特征值全为正

Hermite矩阵

见矩阵论 - Part I - 对称矩阵和反对称矩阵, Hermite矩阵是实数域上的对称矩阵和反对称矩阵的推广

自共轭矩阵

实对称矩阵的推广, 实对称矩阵为转置等于本省, 共轭转置等于自身的复矩阵称Hermite矩阵

推论: 任一复矩阵可分解为Hermite矩阵和反Hermite矩阵之和

Hermite二次型

A A A是Hermite矩阵, 则 H ( x ) = x ∗ A x H(x) = x^* A x H(x)=xAx称为Hermite二次型, 其中 [ ] ∗ []^* []共轭转置

Hermite二次型的性质

性质1: Hermite二次型 H ( x ) H(x) H(x)为实数

性质2: Hermite矩阵的特征值 λ \lambda λ为实数

7 矩阵变换

你可能感兴趣的:(理学)