Hermite二次型

第0章 复习与引申
第1章 线性空间与线性变换
第2章 内积空间和等距变换
第3章 矩阵的相似标准形
第4章 Hermite二次型
第5章 范数和矩阵函数
第6章 广义逆矩阵

第4章 Hermite二次型

文章目录

  • 第4章 Hermite二次型
    • 1 H阵和正规阵
    • 2 标准形
      • 共轭合同关系
      • Hermite二次型的标准形
    • 3 惯性定理

1 H阵和正规阵

A ∈ C n × n A\in C^{n\times n} ACn×n,定义一个复变量、复值函数: f ( X ) = X H A X = ∑ i , j = 1 n a i j x ‾ i x j f(X)=X^HAX=\sum_{i,j=1}^na_{ij}\overline x_i x_j f(X)=XHAX=i,j=1naijxixj,式中 X = ( x 1 , ⋯   , x n ) T X=(x_1,\cdots,x_n)^T X=(x1,,xn)T。可以证明 f ( X ) ∈ R    ⟺    A H = A f(X)\in R\iff A^H=A f(X)RAH=A

Hermite二次型的定义:若 A H = A , A ∈ C n × n A^H=A,A\in C^{n\times n} AH=A,ACn×n,则 A A A是Hermite矩阵,简称为 H H H阵,这时的 f ( x ) f(x) f(x)称为是Hermite二次型。

实对称矩阵的性质:

  1. 实对称阵的特征值都为实数;
  2. 实对称阵的属于不同特征值的特征向量相互正交。
  3. A A A是实对称阵,则存在正交阵 Q Q Q,使得 Q T A Q Q^TAQ QTAQ是对角阵。

H阵的性质:

  1. H阵的特征值均是实数;
  2. H阵的属于不同特征值的特征向量相互正交;
  3. 若A是H阵,则存在酉矩阵U,使得 U H A U U^HAU UHAU是对角阵。

正规阵的定义:设 A ∈ C n × n A\in C^{n\times n} ACn×n,若 A H A = A A H A^HA=AA^H AHA=AAH,则称A是正规阵。

定理: A ∈ C n × n A\in C^{n\times n} ACn×n是正规阵    ⟺    \iff A酉相似于对角阵。(正规阵一定可对角化),且A有n个两两正交的单位向量

幂零阵:设 A ∈ C n × n A\in C^{n\times n} ACn×n,存在 k k k,使得 A k = O A^k=O Ak=O。(特征值全为0)

2 标准形

共轭合同关系

A , B A,B A,B都是 H H H阵,且对 ∀ X ∈ C n , X H A X = X H B X \forall X\in C^{n},X^HAX=X^HBX XCn,XHAX=XHBX,则 A = B A=B A=B。(Hermite二次型由矩阵唯一确定)

f ( X ) = X H A X , g ( Y ) = Y H B Y , C f(X)=X^HAX,g(Y)=Y^HBY,C f(X)=XHAX,g(Y)=YHBY,C是可逆阵,若在 X = C Y X=CY X=CY下, f ( X ) = g ( Y ) f(X)=g(Y) f(X)=g(Y),则 B = C H A C B=C^HAC B=CHAC

共轭合同的定义:设 A , B A,B A,B H H H阵,若有可逆阵 C C C,使得 B = C H A C B=C^HAC B=CHAC,则称 A A A B B B是共轭合同的。

共轭合同的性质:

  1. 反身性, A A A A A A共轭合同
  2. 对称性,若 A A A B B B共轭合同,则 B B B A A A共轭合同
  3. 传递性:若 A A A B B B B B B C C C共轭合同,则 A A A C C C共轭合同。

Hermite二次型的标准形

标准形的定义:设Hermite二次型 f ( X ) f(X) f(X)在可逆线性变换下 X = C Y X=CY X=CY变成只含有平方项的形式:
g ( Y ) = d 1 y 1 y 1 ‾ + d 2 y 2 y 2 ‾ + ⋯ + d n y n y n ‾ = d 1 ∣ y 1 ∣ 2 + d 2 ∣ y 2 ∣ 2 + ⋯ + d n ∣ y n ∣ 2 g(Y)=d_1y_1\overline{y_1}+d_2y_2\overline{y_2}+\cdots+d_ny_n\overline{y_n}\\ =d_1|y_1|^2+d_2|y_2|^2+\cdots+d_n|y_n|^2 g(Y)=d1y1y1+d2y2y2++dnynyn=d1y12+d2y22++dnyn2
​ 则称 g ( Y ) g(Y) g(Y) f ( X ) f(X) f(X)的标准形。(一定存在,因此H阵一定酉相似于对角阵,所以可以令X=UY)

标准型的计算:配方法(初等变换法);酉变换法

3 惯性定理

f ( X ) f(X) f(X)在可逆线性变换 X = C Y X=CY X=CY下变成标准形: g ( Y ) = d 1 ∣ y 1 ∣ 2 + ⋯ + d p ∣ y p ∣ 2 − d p + 1 ∣ y p + 1 ∣ 2 − ⋯ − d r ∣ y r ∣ 2 g(Y)=d_1|y_1|^2+\cdots+d_p|y_p|^2-d_{p+1}|y_{p+1}|^2-\cdots-d_r|y_r|^2 g(Y)=d1y12++dpyp2dp+1yp+12dryr2。在可逆线性变换 X = D Z X=DZ X=DZ下变成标准形: h ( Z ) = k 1 ∣ z 1 ∣ 2 + ⋯ + k q ∣ z q ∣ 2 − k q + 1 ∣ z q + 1 ∣ 2 − ⋯ − k r ∣ z r ∣ 2 h(Z)=k_1|z_1|^2+\cdots+k_q|z_q|^2-k_{q+1}|z_{q+1}|^2-\cdots-k_r|z_r|^2 h(Z)=k1z12++kqzq2kq+1zq+12krzr2,其中 d i , k i d_i,k_i di,ki均大于0,则 p = q p=q p=q

定义:Hermite二次型的标准形中的正项个数称为其正惯性指数,负项个数称为其负惯性指数

H阵的惯性定理:对于与H阵A共轭合同的两个对角阵,其正项、负项个数相同。(正惯性指数与负惯性指数相加为矩阵A的秩)

规范形:如果 n × n n\times n n×nHermite矩阵A的正、负惯性指数分别是 p , q p,q p,q,则A必定与矩阵 ( I p O O O − I q O O O O ) \begin{pmatrix} I_p&O&O\\O&-I_q&O\\O&O&O\end{pmatrix} IpOOOIqOOOO共轭合同,称次矩阵为A的规范形。

定理:若 H H H阵A,B共轭合同    ⟺    \iff A,B有相同的正、负惯性指数。

4 有定性

**正定的定义:**设 A A A H H H阵, f ( X ) = X H A X f(X)=X^HAX f(X)=XHAX,若对 ∀ X 0 ≠ θ , f ( X 0 ) > 0 \forall X_0\neq\theta,f(X_0)>0 X0=θ,f(X0)>0,则称 f f f是正定的, A A A是正定的 H H H阵。

判别方法:

  1. 矩阵 D = d i a g ( d 1 , d 2 , … , d n ) D=diag(d_1,d_2,\dots,d_n) D=diag(d1,d2,,dn),则 D D D是正定的    ⟺    \iff ∀ d i > 0 \forall d_i>0 di>0;
  2. 若H阵A、B共轭合同,则 A A A正定    ⟺    \iff B B B正定。
  3. H H H阵A与 D = d i a g ( d 1 , d 2 , … , d n ) D=diag(d_1,d_2,\dots,d_n) D=diag(d1,d2,,dn)共轭合同,则 A A A正定    ⟺    \iff ∀ d i > 0 \forall d_i >0 di>0

正定的充要条件:

  1. A是正定的;
  2. A的特征值均大于0;
  3. A与 I I I共轭合同;
  4. 存在可逆阵P使得 A = P H P A=P^HP A=PHP
  5. A的各顺序主子式均大于0。

其它有定性:

  1. 若对 ∀ X 0 ≠ θ , f ( X 0 ) < 0 \forall X_0\neq\theta,f(X_0)<0 X0=θ,f(X0)<0,则称 f f f是负定的, A A A是负定的 H H H阵。
  2. 若对 ∀ X 0 ≠ θ , f ( X 0 ) ≥ 0 \forall X_0\neq\theta,f(X_0)\geq0 X0=θ,f(X0)0,则称 f f f是半正定的, A A A是半正定的 H H H阵。
  3. 若对 ∀ X 0 ≠ θ , f ( X 0 ) ≤ 0 \forall X_0\neq\theta,f(X_0)\leq0 X0=θ,f(X0)0,则称 f f f是半负定的, A A A是半负定的 H H H阵。

半正定的判别方法:

  1. 矩阵 D = d i a g ( d 1 , d 2 , … , d n ) D=diag(d_1,d_2,\dots,d_n) D=diag(d1,d2,,dn),则 D D D是半正定的    ⟺    \iff ∀ d i ≥ 0 \forall d_i\geq0 di0;
  2. 若H阵A、B共轭合同,则 A A A半正定    ⟺    \iff B B B半正定。
  3. H H H阵A与 D = d i a g ( d 1 , d 2 , … , d n ) D=diag(d_1,d_2,\dots,d_n) D=diag(d1,d2,,dn)共轭合同, 则 A A A半正定    ⟺    \iff ∀ d i ≥ 0 \forall d_i \geq 0 di0

半正定的充要条件:

  1. A是半正定的;
  2. A的特征值均大于等于0;
  3. A与 ( I r O ) \begin{pmatrix} I_r& \\ &O \end{pmatrix} (IrO)共轭合同;
  4. 存在矩阵阵P使得 A = P H P A=P^HP A=PHP
  5. A的各主子式均大于0或等于0。

奇值分解定理:设 A A A是秩为 r r r s × n s\times n s×n矩阵,则 A H A A^HA AHA是秩为 r r r的半正定矩阵,设其非零特征值为 λ 1 , ⋯   , λ r \lambda_1,\cdots,\lambda_r λ1,,λr,令 d i = λ i d_i=\sqrt{\lambda_i} di=λi D = d i a g { d 1 . d 2 , ⋯   , d r } D=diag\{d_1.d_2,\cdots,d_r\} D=diag{d1.d2,,dr},则一定存在 s s s阶酉矩阵 U U U n n n阶酉矩阵 V V V,使得:
A = U ( D O O O ) V A=U\begin{pmatrix}D&O\\O&O \end{pmatrix}V A=U(DOOO)V
Rayleigh商:设 A A A H H H阵, ∀ x ∈ C n , X H A X ∈ R \forall x\in C^n,X^HAX\in R xCn,XHAXR, ∀ X ≠ θ \forall X\neq\theta X=θ,定义复变量实值函数:
R ( X ) = X H A X X H X = ⟨ A X , X ⟩ ⟨ X , X ⟩ R(X)=\frac{X^HAX}{X^HX}=\frac{\lang AX,X\rang}{\lang X,X\rang} R(X)=XHXXHAX=X,XAX,X
​ 称 R R R是A的Rayleigh商。

A ∈ C n × n A\in C^{n\times n} ACn×n是H阵, λ 1 ≤ λ 2 ≤ … , λ n \lambda_1\leq\lambda_2\leq\dots,\lambda_n λ1λ2,λn是A的所有特征值,其中 λ 1 = min ⁡ X ≠ θ R ( x ) \lambda_1=\min_{X\neq\theta}R(x) λ1=minX=θR(x) λ n = max ⁡ X ≠ θ R ( x ) \lambda_n=\max_{X\neq\theta}R(x) λn=maxX=θR(x)

证:因为A是H阵,所有A有n个两两正交的单位特征向量

​ 设 η 1 , ⋯   , η n \eta_1,\cdots,\eta_n η1,,ηn是A相应于特征值的标准正交特征向量

​ 于是 η 1 , ⋯   , η n \eta_1,\cdots,\eta_n η1,,ηn是标准正交基

只证: λ 1 = min ⁡ X ≠ θ R ( x ) \lambda_1=\min_{X\neq\theta}R(x) λ1=minX=θR(x)

∀ X ∈ C n , ∃ k 1 , ⋯   , k n ∈ C , s . t . X = k 1 η 1 + ⋯ + k n η n \forall X\in C^n,\exist k_1,\cdots,k_n\in C, s.t.X=k_1\eta_1+\cdots+k_n\eta_n XCn,k1,,knC,s.t.X=k1η1++knηn

A X = k 1 A η 1 + ⋯ + k n A η n = = k 1 λ 1 η 1 + ⋯ + k n λ n η n AX = k_1A\eta_1+\cdots+k_nA\eta_n== k_1\lambda_1\eta_1+\cdots+k_n\lambda_n\eta_n AX=k1Aη1++knAηn==k1λ1η1++knλnηn
A X , X ⟩ = k 1 λ 1 k ‾ 1 + k 2 λ 2 k ‾ 2 + ⋯ + k n λ n k ‾ n = λ 1 ∣ k 1 ∣ 2 + ⋯ + λ n ∣ k n ∣ 2 ≥ λ 1 ( ∣ k 1 ∣ 2 + ⋯ + ∣ k n ∣ 2 ) = λ 1 < X , X > \begin{alignedat} \lang AX,X\rang&=k_1\lambda_1\overline k_1+k_2\lambda_2\overline k_2+\cdots+k_n\lambda_n\overline k_n\\ &=\lambda_1|k_1|^2+\cdots+\lambda_n|k_n|^2\\ &\geq\lambda_1(|k_1|^2+\cdots+|k_n|^2)\\ &=\lambda_1 \end{alignedat} AX,X=k1λ1k1+k2λ2k2++knλnkn=λ1k12++λnkn2λ1(k12++kn2)=λ1<X,X> ​所以 λ 1 ≤ ⟨ A X , X ⟩ ⟨ X , X ⟩ = R ( x ) \lambda_1\leq\frac{\lang AX,X\rang}{\lang X,X\rang}=R(x) λ1X,XAX,X=R(x)

参考文献:工程矩阵理论,张明淳著

你可能感兴趣的:(工程矩阵,线性代数,矩阵,统计学)