线性代数——二次型

系列文章目录

  • 线性代数——行列式
  • 线性代数——矩阵
  • 线性代数——向量
  • 线性代数——线性方程组
  • 线性代数——特征值和特征向量
  • 线性代数——二次型

文章目录

  • 系列文章目录
  • 版权声明
  • 补充知识
    • 求和公式的性质
    • 常用希腊字符读音
  • 二次型
  • 坐标变换
  • 矩阵合同
  • 正定二次型

版权声明

本文大部分内容皆来自李永乐老师考研教材和视频课。

补充知识

求和公式的性质

  • ∑ i = 1 n k a i = k ∑ i = 1 n a i \sum_{i=1}^nka_i=k\sum_{i=1}^na_i i=1nkai=ki=1nai
  • ∑ i = 1 n ( a i + b i ) = ∑ i = 1 n a i + ∑ i = 1 n b i \sum_{i=1}^n(a_i+b_i)=\sum_{i=1}^na_i+\sum_{i=1}^nb_i i=1n(ai+bi)=i=1nai+i=1nbi
  • ∑ i = 1 m ∑ j = 1 n a i j = ∑ j = 1 n ∑ i = 1 m a i j \sum_{i=1}^m\sum_{j=1}^na_{ij}=\sum_{j=1}^n\sum_{i=1}^ma_{ij} i=1mj=1naij=j=1ni=1maij

常用希腊字符读音

  • α \alpha α:/ælfə/
  • β \beta β:/betə/
  • Γ \Gamma Γ γ \gamma γ:/gama/
  • Δ \Delta Δ δ \delta δ:/deltə/
  • ε \varepsilon ε:/epsilon/
  • υ \upsilon υ:/apsilon/
  • θ \theta θ:/θitə/
  • π \pi π:/paɪ/
  • η \eta η:/ita/
  • Λ \Lambda Λ λ \lambda λ:/læmdə/
  • μ \mu μ:/mju/
  • ξ \xi ξ:/ksi/
  • Σ \Sigma Σ σ \sigma σ:/sigmə/
  • τ \tau τ:/taʊ/
  • Φ \varPhi Φ φ \varphi φ:/faɪ/
  • ψ \psi ψ:/psi/
  • Ω \Omega Ω ω \omega ω:/omiga/
  • ρ \rho ρ:/ru:/

二次型

将含有 n n n个变量 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,,xn的二次齐次函数 f ( x 1 , x 2 , … , x n ) f(x_1,x_2,\dots,x_n) f(x1,x2,,xn)称为 n n n二次型。现有一二次型
x 1 2 + 5 x 2 2 − 4 x 3 2 − 2 x 1 x 2 + 6 x 2 x 3 = x 1 2 − x 1 x 2 − x 1 x 2 + 5 x 2 2 + 3 x 2 x 3 + 3 x 2 x 3 − 4 x 3 2 = x 1 ( x 1 − x 2 ) + x 2 ( − x 1 + 5 x 2 + 3 x 3 ) + x 3 ( 3 x 2 − 4 x 3 ) = [ x 1 x 2 x 3 ] [ x 1 − x 2 − x 1 + 5 x 2 + 3 x 3 3 x 2 − 4 x 3 ] = [ x 1 x 2 x 3 ] [ 1 − 1 0 − 1 5 3 0 3 − 4 ] [ x 1 x 2 x 3 ] x_1^2+5x_2^2-4x_3^2-2x_1x_2+6x_2x_3\\ =x_1^2-x_1x_2-x_1x_2+5x_2^2+3x_2x_3+3x_2x_3-4x_3^2\\ =x_1(x_1-x_2)+x_2(-x_1+5x_2+3x_3)+x_3(3x_2-4x_3)\\ {=} \begin{bmatrix} x_1&x_2&x_3 \end{bmatrix} \begin{bmatrix} x_1-x_2&&\\ &-x_1+5x_2+3x_3&\\ &&3x_2-4x_3 \end{bmatrix}\\ {=} \begin{bmatrix} x_1&x_2&x_3 \end{bmatrix} \begin{bmatrix} 1&-1&0\\ -1&5&3\\ 0&3&-4 \end{bmatrix} \begin{bmatrix} x_1\\ x_2\\ x_3 \end{bmatrix} x12+5x224x322x1x2+6x2x3=x12x1x2x1x2+5x22+3x2x3+3x2x34x32=x1(x1x2)+x2(x1+5x2+3x3)+x3(3x24x3)=[x1x2x3] x1x2x1+5x2+3x33x24x3 =[x1x2x3] 110153034 x1x2x3
那么对于 n n n元二次型有矩阵表示
f ( x 1 , x 2 , … , x n ) = x T A x f(x_1,x_2,\dots,x_n)=x^TAx f(x1,x2,,xn)=xTAx
其中 x = ( x 1 , x 2 , … , x n ) T , A = [ a i j ] x=(x_1,x_2,\dots,x_n)^T,A=[a_{ij}] x=(x1,x2,,xn)T,A=[aij],并且规定将 A A A化为对称矩阵,因为对称矩阵是唯一的,所以就能唯一确认一个二次型,那么就称 A A A二次型的矩阵 r ( A ) r(A) r(A)称为二次型的秩,记为 r ( f ) r(f) r(f)。 如果二次型中只含有变量的平方项,所有混合项 x i x j ( i ≠ j ) x_ix_j(i\neq j) xixj(i=j)的系数全为零,即
x T A x = d 1 x 1 2 + d 2 x 2 2 + ⋯ + d n x n 2 x^TAx=d_1x_1^2+d_2x_2^2+\dots+d_nx_n^2 xTAx=d1x12+d2x22++dnxn2
则称这样的二次型为标准型,在标准型中,若平方项的系数 d j d_j dj 1 , − 1 1,-1 1,1 0 0 0,即
x T A x = x 1 2 + x 2 2 + ⋯ + x p 2 − x p + 1 2 − ⋯ − x p + q 2 x^TAx=x_1^2+x_2^2+\dots+x_p^2-x_{p+1}^2-\dots-x_{p+q}^2 xTAx=x12+x22++xp2xp+12xp+q2
则称其为二次型的规范型。在二次型 x T A x x^TAx xTAx的标准型中,正平方项的个数 p p p称为二次型的正惯性指数,负平方项的个数 q q q称为二次型的负惯性指数

坐标变换

如果
{ x 1 = c 11 y 1 + c 12 y 2 + c 13 y 3 x 1 = c 21 y 1 + c 22 y 2 + c 23 y 3 x 1 = c 31 y 1 + c 32 y 2 + c 33 y 3 ① \tag*{①} \begin{cases} x_1=c_{11}y_1+c_{12}y_2+c_{13}y_3\\ x_1=c_{21}y_1+c_{22}y_2+c_{23}y_3\\ x_1=c_{31}y_1+c_{32}y_2+c_{33}y_3\\ \end{cases} x1=c11y1+c12y2+c13y3x1=c21y1+c22y2+c23y3x1=c31y1+c32y2+c33y3
满足
∣ C ∣ = ∣ c 11 c 12 c 13 c 21 c 22 c 23 c 31 c 32 c 33 ∣ ≠ 0 |C|= \begin{vmatrix} c_{11}&c_{12}&c_{13}\\ c_{21}&c_{22}&c_{23}\\ c_{31}&c_{32}&c_{33}\\ \end{vmatrix} \neq0 C= c11c21c31c12c22c32c13c23c33 =0
则称①为 x = ( x 1 , x 2 , x 3 ) T x=(x_1,x_2,x_3)^T x=(x1,x2,x3)T y = ( y 1 , y 2 , y 3 ) T y=(y_1,y_2,y_3)^T y=(y1,y2,y3)T坐标变换。任何一个二次型 x T A x x^TAx xTAx都可以通过坐标变换化成标准型,通常有以下两种方法:

  • 配方法
    例:将二次型 f ( x 1 , x 2 , x 3 ) = x 1 2 + 2 x 2 2 + 5 x 3 2 + 2 x 1 x 2 + 2 x 1 x 3 + 6 x 2 x 3 f(x_1,x_2,x_3)=x_1^2+2x_2^2+5x_3^2+2x_1x_2+2x_1x_3+6x_2x_3 f(x1,x2,x3)=x12+2x22+5x32+2x1x2+2x1x3+6x2x3化为标准型。
    解:
    f ( x 1 , x 2 , x 3 ) = [ x 1 2 + 2 x 1 ( x 2 + x 3 + ( x 2 + x 3 ) 2 ) ] − ( x 2 + x 3 ) 2 + 2 x 2 2 + 5 x 3 2 + 6 x 2 x 3 = ( x 1 + x 2 + x 3 ) 2 + x 2 2 + 4 x 2 x 3 + 4 x 3 2 = ( x 1 + x 2 + x 3 ) 2 + ( x 2 + x 3 ) 2 f(x_1,x_2,x_3)=[x_1^2+2x_1(x_2+x_3+(x_2+x_3)^2)]-(x_2+x_3)^2+2x_2^2+5x_3^2+6x_2x_3\\ =(x_1+x_2+x_3)^2+x_2^2+4x_2x_3+4x_3^2\\ =(x_1+x_2+x_3)^2+(x_2+x_3)^2 f(x1,x2,x3)=[x12+2x1(x2+x3+(x2+x3)2)](x2+x3)2+2x22+5x32+6x2x3=(x1+x2+x3)2+x22+4x2x3+4x32=(x1+x2+x3)2+(x2+x3)2

    { y 1 = x 1 + x 2 + x 3 y 2 = x 2 + x 3 y 3 = x 3 ⇒ { x 1 = y 1 − y 2 + y 3 x 2 = y 2 − 2 y 3 x 3 = y 3 \begin{cases} y_1=x_1+x_2+x_3\\ y_2=x_2+x_3\\ y_3=x_3 \end{cases} \Rightarrow \begin{cases} x_1=y_1-y_2+y_3\\ x_2=y_2-2y_3\\ x_3=y_3 \end{cases} y1=x1+x2+x3y2=x2+x3y3=x3 x1=y1y2+y3x2=y22y3x3=y3
    x = C y , C = [ 1 − 1 1 0 1 − 2 0 0 1 ] x=Cy,C=\begin{bmatrix}1&-1&1\\0&1&-2\\0&0&1\end{bmatrix} x=Cy,C= 100110121
  • 正交变换法
    n n n阶实对称矩阵 A A A必可对角化,且总存在正交矩阵 Q Q Q,使得
    Q − 1 A Q = Q T A Q = Λ = [ λ 1 λ 2 ⋱ λ n ] Q^{-1}AQ=Q^TAQ=\Lambda= \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\\ \end{bmatrix} Q1AQ=QTAQ=Λ= λ1λ2λn
    那么令 x = Q y x=Qy x=Qy,则
    x t A x = ( Q y ) T A ( Q y ) = y T Q T A Q y = y T Λ y = λ 1 y 1 2 + λ 2 y 2 2 + λ 3 y 3 2 x^tAx=(Qy)^TA(Qy)\\ =y^TQ^TAQy\\ =y^T\Lambda y\\ =\lambda_1y_1^2+\lambda_2y_2^2+\lambda_3y_3^2 xtAx=(Qy)TA(Qy)=yTQTAQy=yTΛy=λ1y12+λ2y22+λ3y32

坐标变换相关性质如下:

  • 对任意一个 n n n元二次型 x T A x x^TAx xTAx,其中 A A A n n n阶实对称矩阵,必存在正交变换 x = Q y x=Qy x=Qy Q Q Q是正交矩阵),使得 x T A x x^TAx xTAx化成标准型
    λ 1 y 1 2 + λ 2 y 2 2 + ⋯ + λ n y n 2 \lambda_1y_1^2+\lambda_2y_2^2+\dots+\lambda_ny_n^2 λ1y12+λ2y22++λnyn2
    这里 λ 1 , λ 2 , … λ n \lambda_1,\lambda_2,\dots\lambda_n λ1,λ2,λn A A A n n n个特征值。对标准型再次进行坐标变换即可化为规范型。
  • 惯性定理:对于一个二次型,不论选取怎样的坐标变换使其化为标准型,其中正平方项的个数 p p p,负平方项的个数 q q q都是由所给二次型唯一确定的。即二次型的规范型是唯一确认的。

矩阵合同

两个 n n n阶矩阵 A A A B B B,如果存在可逆矩阵 C C C,使得 B = C T A C B=C^TAC B=CTAC就称矩阵 A A A B B B合同,记作 A ≃ B A\simeq B AB,并称由 A A A B B B的变换为合同变换,称 C C C为合同变换的矩阵。 给定一个二次型
f ( x 1 , x 2 , x 3 ) = x T A x f(x_1,x_2,x_3)=x^TAx f(x1,x2,x3)=xTAx
对其进行一次任意的 x = C y x=Cy x=Cy坐标变换:
f ( x 1 , x 2 , x 3 ) = x T A x = ( C y ) T A ( C y ) = y T C T A C y = y T B y f(x_1,x_2,x_3)=x^TAx\\ =(Cy)^TA(Cy)\\ =y^TC^TACy\\ =y^TBy f(x1,x2,x3)=xTAx=(Cy)TA(Cy)=yTCTACy=yTBy
其中 B = C T A C B^=C^TAC B=CTAC,且有
B T = ( C T A C ) T = C T A T ( C T ) T = C T A C = B B^T=(C^TAC)^T=C^TA^T(C^T)^T=C^TAC=B\\ BT=(CTAC)T=CTAT(CT)T=CTAC=B
A ≃ B ⇔ A\simeq B\Leftrightarrow AB对二次型 x T A x x^TAx xTAx做一次 x = C y x=Cy x=Cy坐标变换。合同的性质如下:

  • A ≃ A A\simeq A AA
  • A ≃ B ⇒ B ≃ A A\simeq B\Rightarrow B\simeq A ABBA
  • A ≃ B , B ≃ C ⇒ A ≃ C A\simeq B,B\simeq C\Rightarrow A\simeq C AB,BCAC
  • 任一 n n n阶实对称矩阵 A A A,总可以合同于一个对角矩阵,即
    C T A C + [ d 1 d 2 ⋱ d n ] C^TAC+ \begin{bmatrix} d_1&&&\\ &d_2&&\\ &&\ddots&\\ &&&d_n \end{bmatrix} CTAC+ d1d2dn

正定二次型

设二次型 x T A x x^TAx xTAx,如果对任何 x ≠ O x\neq O x=O,恒有 x T A x > 0 x^TAx>0 xTAx>0,则称二次型 x T A x x^TAx xTAx正定二次型,并称矩阵 A A A正定矩阵

  • 二次型正定 ⇔ \Leftrightarrow 平方项系数大于零。
  • 正定二次型经坐标变换其正定性保持不变。
  • n n n元二次型 x T A x x^TAx xTAx正定的从要条件有:
    • A A A的正惯性指数是 n n n
    • A A A E E E合同,即存在可逆矩阵 C C C,使 C T A X = E C^TAX=E CTAX=E
    • A A A的所有特征值 λ ( i = 1 , 2 , … , n ) \lambda(i=1,2,\dots,n) λ(i=1,2,,n)均为正数
    • A A A的各阶顺序主子式均大于零

你可能感兴趣的:(高数,线性代数,机器学习,决策树)