高等数学:线性代数-第五章

文章目录

  • 第5章 相似矩阵及二次型
    • 5.1 向量的内积、长度及正交性
    • 5.2 方阵的特征值与特征向量
    • 5.3 相似矩阵
    • 5.4 对称矩阵的对角化
    • 5.5 二次型及其标准型
    • 5.6 正定二次型

第5章 相似矩阵及二次型

5.1 向量的内积、长度及正交性

内积 设有 n 维向量
x = ( x 1 x 2 ⋮ x n ) ,   y = ( y 1 y 2 ⋮ y n ) \bm x= \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ \end{pmatrix},~ \bm y= \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \\ \end{pmatrix} \\ x= x1x2xn , y= y1y2yn

[ x , y ] = ∑ i = 1 n x i y y [\bm x,\bm y]=\sum_{i=1}^{n}x_iy_y \\ [x,y]=i=1nxiyy
则称 [ x , y ] [\bm x,\bm y] [x,y]为向量 x \bm x x y \bm y y 的内积。

内积具有下列性质:
[ x , y ] = [ y , x ] [ λ x , y ] = λ [ x , y ] [ x + y , z ] = [ x , z ] + [ y , z ] [\bm x,\bm y]=[\bm y,\bm x] [\lambda\bm x,\bm y]=\lambda[\bm x,\bm y] [\bm x+\bm y,\bm z]=[\bm x,\bm z]+[\bm y,\bm z] [x,y]=[y,x][λx,y]=λ[x,y][x+y,z]=[x,z]+[y,z]
Cauchy-Schwarz不等式
[ x , y ] 2 ≤ [ x , x ] [ y , y ] [\bm x,\bm y]^2\leq[\bm x,\bm x][\bm y,\bm y] \\ [x,y]2[x,x][y,y]
向量的长度(2-范数) 令
∣ ∣ x ∣ ∣ = [ x , x ] = ∑ i = 1 n x i 2 \vert\vert\bm x\vert\vert=\sqrt{[\bm x,\bm x]}=\sqrt{\sum_{i=1}^n x_i^2} \\ ∣∣x∣∣=[x,x] =i=1nxi2
则称 ∣ ∣ x ∣ ∣ \vert\vert\bm x\vert\vert ∣∣x∣∣为向量 x \bm x x的长度,又称2-范数。

夹角 令
θ = arctan ⁡ [ x , y ] ∣ ∣ x ∣ ∣ ∣ ⋅ ∣ y ∣ ∣ \theta=\arctan{\frac{[\bm x,\bm y]}{\vert\vert\bm x\vert\vert\vert\cdot\vert\bm y\vert\vert}} \\ θ=arctan∣∣x∣∣∣y∣∣[x,y]
则称 θ \theta θ为向量 x \bm x x y \bm y y的夹角。

正交 当 [ x , y ] = 0 [\bm x,\bm y]=0 [x,y]=0时,称向量 x \bm x x y \bm y y正交。

向量 x \bm x x y \bm y y 正交时, θ = 0 \theta=0 θ=0 .

正交矩阵 如果 n 阶矩阵 A \bm A A满足
A T A = E \bm A^\mathrm T\bm A=\bm E \\ ATA=E

A − 1 = A T \bm A^{-1}=\bm A^\mathrm T \\ A1=AT
则称矩阵 \bm A 为正交矩阵,简称正交阵。

5.2 方阵的特征值与特征向量

特征值 设 A \bm A A 是 n 阶矩阵,如果数 λ \lambda λ 和 n 维非零列向量 x \bm x x 使
A x = λ x \bm{Ax}=\lambda\bm x \\ Ax=λx
成立,则 λ \lambda λ 称为矩阵 A \bm A A 的特征值, x \bm x x 称为 A \bm A A的对应于特征值 λ \lambda λ 的特征向量。

特征方程 方程 A x = λ x \bm{Ax}=\lambda\bm x Ax=λx可写成
( A − λ E ) x = 0 (\bm{A}-\lambda\bm E)\bm x=\bm 0 \\ (AλE)x=0
它有非零解的充分必要条件是 ∣ A x − λ E ∣ = 0 |\bm{Ax}-\lambda\bm E|=0 AxλE=0 ,即
∣ a 11 − λ a 12 ⋯ a 1 n a 21 a 22 − λ ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a n 1 a n 2 ⋯ a n n − λ ∣ = 0 \begin{vmatrix} a_{11}-\lambda & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22}-\lambda & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}-\lambda \\ \end{vmatrix} = 0 \\ a11λa21an1a12a22λan2a1na2nannλ =0
上式称为矩阵 A \bm A A的特征方程。多项式 f ( λ ) = ∣ A − λ E ∣ f(\lambda)=|\bm{A}-\lambda\bm E| f(λ)=AλE称为矩阵 A \bm A A 的特征多项式。矩阵 A \bm A A的特征值就是该矩阵特征方程的解。

对于矩阵 A \bm A A的 n 个特征值,满足:
∑ i = 1 n λ i = ∑ i = 1 n a i i ∏ i = 1 n λ i = ∣ A ∣ \sum_{i=1}^n\lambda_i=\sum_{i=1}^n a_{ii}\\ \prod_{i=1}^n\lambda_i=|\bm A| i=1nλi=i=1naiii=1nλi=A

5.3 相似矩阵

相似矩阵 设 A \bm A A B \bm B B 都是 n 阶矩阵,若有可逆矩阵 P \bm P P ,使得
P − 1 A P = B \bm P^{-1}\bm{AP}=\bm B \\ P1AP=B
则称矩阵 A \bm A A B \bm B B 相似,对 A \bm A A 进行 P − 1 A P \bm P^{-1}\bm{AP} P1AP 运算称为对 A \bm A A 进行相似变换,可逆矩阵 P \bm P P 称为把 A \bm A A 变成 B \bm B B 的相似变换矩阵。

若矩阵 A \bm A A B \bm B B 相似,则 A \bm A A B \bm B B的特征多项式相同,进而特征值也相同。

若 n 阶矩阵 A \bm A A与对角矩阵
Λ = ( λ 1 λ 2 ⋱ λ n ) \bm\Lambda= \begin{pmatrix} \lambda_1\\ &\lambda_2\\ &&\ddots\\ &&&\lambda_n\\ \end{pmatrix} \\ Λ= λ1λ2λn
相似,则 λ 1 , λ 2 , ⋯   , λ n \lambda_1,\lambda_2,\cdots,\lambda_n λ1,λ2,,λn即是 A \bm A A的 n 个特征值。

矩阵对角化 寻求相似变换矩阵 P \bm P P ,使得 P − 1 A P = Λ \bm P^{-1}\bm{AP}=\bm\Lambda P1AP=Λ 为对角矩阵,这样的过程称为矩阵对角化。

n 阶矩阵 A \bm A A 能对角化的充分必要条件是 A \bm A A有 n 个线性无关的特征向量。

5.4 对称矩阵的对角化

定理 设 A \bm A A为 n 阶对称矩阵, λ \lambda λ A \bm A A的特征方程的 k 重根,则矩阵 A − λ E \bm A-\lambda\bm E AλE 的秩 R ( A − λ E ) = n − k R(\bm A-\lambda\bm E)=n-k R(AλE)=nk ,从而对应特征值 λ \lambda λ 恰有 k 个线性无关的特征向量。

5.5 二次型及其标准型

二次型 含有 n 个变量 x 1 , x 2 , ⋯   , x n x_1,x_2,\cdots,x_n x1,x2,,xn的二次齐次函数
f = f ( x 1 , x 2 , ⋯   , x n ) = ∑ i , j = 1 n a i j x i x j f=f(x_1,x_2,\cdots,x_n)=\sum_{i,j=1}^{n}a_{ij}x_ix_j \\ f=f(x1,x2,,xn)=i,j=1naijxixj
称为二次型。特别地,当 a i j a_{ij} aij为复数时, f 称为复二次型;当 a i j a_{ij} aij 为实数时, f 称为实二次型。

标准型 对于二次型,若有可逆的线性变换
x i = ∑ k = 1 n c i k y k ,    1 ≤ k ∈ Z ≤ n x_i=\sum_{k=1}^nc_{ik}y_k,~~1\leq k\in\mathbb Z\leq n \\ xi=k=1ncikyk,  1kZn
使二次型只含平方项,也就是说
f = ∑ i = 1 n k i y i 2 f=\sum_{i=1}^nk_iy_i^2 \\ f=i=1nkiyi2
成立。这种只含平方项的二次型,称为二次型的标准型(或法式)。

规范型 如果标准型的系数 k i k_i ki 满足
k i ∈ { − 1 , 0 , 1 } k_i\in\{-1,0,1\} \\ ki{1,0,1}
,则该标准型称为二次型的规范型。

二次型的矩阵 二次型
f = ∑ i , j = 1 n a i j x i x j f=\sum_{i,j=1}^{n}a_{ij}x_ix_j \\ f=i,j=1naijxixj
可写成
f = ( x 1 x 2 ⋯ x n ) ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a n 1 a n 2 ⋯ a n n ) ( x 1 x 2 ⋮ x n ) f= \begin{pmatrix} x1 & x2 & \cdots & x_n \\ \end{pmatrix} \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{pmatrix} \begin{pmatrix} x1 \\ x2 \\ \vdots \\ x_n \\ \end{pmatrix} \\ f=(x1x2xn) a11a21an1a12a22an2a1na2nann x1x2xn

A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a n 1 a n 2 ⋯ a n n ) ,    x = ( x 1 x 2 ⋮ x n ) \bm A= \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{pmatrix},~~ \bm x= \begin{pmatrix} x1 \\ x2 \\ \vdots \\ x_n \\ \end{pmatrix} \\ A= a11a21an1a12a22an2a1na2nann ,  x= x1x2xn
则二次型 f 可记作
f = x T A x f=\bm x^\mathrm T\bm A\bm x \\ f=xTAx
其中,对称矩阵 A \bm A A 称为二次型 f 的矩阵,二次型 f 称为对称矩阵 A \bm A A 的二次型。

合同 设 A \bm A A B \bm B B 是 n 阶矩阵,若有可逆矩阵 C \bm C C ,使 B = C T A C \bm B=\bm C^\mathrm T\bm{AC} B=CTAC ,则称矩阵 A \bm A A B \bm B B 合同。

5.6 正定二次型

惯性定理 设二次型 f = x T A x f=\bm x^\mathrm T\bm A\bm x f=xTAx的秩为 r ,且有两个可逆变换 x = C y \bm x=\bm{Cy} x=Cy x = P z \bm x=\bm{Pz} x=Pz使
f = ∑ i = 1 r k i y i 2 ,    k i ≠ 0 f=\sum_{i=1}^rk_iy_i^2,~~k_i\ne0 \\ f=i=1rkiyi2,  ki=0

f = ∑ i = 1 r λ i z i 2 ,    λ i ≠ 0 f=\sum_{i=1}^r\lambda_iz_i^2,~~\lambda_i\ne0 \\ f=i=1rλizi2,  λi=0
k 1 , ⋯   , k r k_1,\cdots,k_r k1,,kr中正数的个数与 λ 1 , ⋯   , λ r \lambda_1,\cdots,\lambda_r λ1,,λr中正数的个数相等。

正定二次型 设二次型 f ( x ) = x T A x f(\bm x)=\bm x^\mathrm T\bm A\bm x f(x)=xTAx ,如果对 ∀ x ≠ 0 \forall \bm x\ne\bm 0 x=0 ,都有 f ( x ) > 0 f(\bm x)>0 f(x)>0,则称 f 为正定二次型,并称对称矩阵 A \bm A A是正定的;如果对 ∀ x ≠ 0 \forall \bm x\ne\bm 0 x=0 ,都有 f ( x ) < 0 f(\bm x)<0 f(x)<0,则称 f 为负定二次型,并称对称矩阵 A \bm A A 是负定的。

你可能感兴趣的:(#,线性代数,高等数学,线性代数,机器学习,人工智能)