第0章 复习与引申
第1章 线性空间与线性变换
第2章 内积空间和等距变换
第3章 矩阵的相似标准形
第4章 Hermite二次型
第5章 范数和矩阵函数
第6章 广义逆矩阵
设 A ∈ C n × n A\in C^{n\times n} A∈Cn×n,定义一个复变量、复值函数: f ( X ) = X H A X = ∑ i , j = 1 n a i j x ‾ i x j f(X)=X^HAX=\sum_{i,j=1}^na_{ij}\overline x_i x_j f(X)=XHAX=∑i,j=1naijxixj,式中 X = ( x 1 , ⋯ , x n ) T X=(x_1,\cdots,x_n)^T X=(x1,⋯,xn)T。可以证明 f ( X ) ∈ R ⟺ A H = A f(X)\in R\iff A^H=A f(X)∈R⟺AH=A。
Hermite二次型的定义:若 A H = A , A ∈ C n × n A^H=A,A\in C^{n\times n} AH=A,A∈Cn×n,则 A A A是Hermite矩阵,简称为 H H H阵,这时的 f ( x ) f(x) f(x)称为是Hermite二次型。
实对称矩阵的性质:
H阵的性质:
正规阵的定义:设 A ∈ C n × n A\in C^{n\times n} A∈Cn×n,若 A H A = A A H A^HA=AA^H AHA=AAH,则称A是正规阵。
定理: A ∈ C n × n A\in C^{n\times n} A∈Cn×n是正规阵 ⟺ \iff ⟺A酉相似于对角阵。(正规阵一定可对角化),且A有n个两两正交的单位向量
幂零阵:设 A ∈ C n × n A\in C^{n\times n} A∈Cn×n,存在 k k k,使得 A k = O A^k=O Ak=O。(特征值全为0)
若 A , B A,B A,B都是 H H H阵,且对 ∀ X ∈ C n , X H A X = X H B X \forall X\in C^{n},X^HAX=X^HBX ∀X∈Cn,XHAX=XHBX,则 A = B A=B A=B。(Hermite二次型由矩阵唯一确定)
设 f ( X ) = X H A X , g ( Y ) = Y H B Y , C f(X)=X^HAX,g(Y)=Y^HBY,C f(X)=XHAX,g(Y)=YHBY,C是可逆阵,若在 X = C Y X=CY X=CY下, f ( X ) = g ( Y ) f(X)=g(Y) f(X)=g(Y),则 B = C H A C B=C^HAC B=CHAC。
共轭合同的定义:设 A , B A,B A,B是 H H H阵,若有可逆阵 C C C,使得 B = C H A C B=C^HAC B=CHAC,则称 A A A与 B B B是共轭合同的。
共轭合同的性质:
标准形的定义:设Hermite二次型 f ( X ) f(X) f(X)在可逆线性变换下 X = C Y X=CY X=CY变成只含有平方项的形式:
g ( Y ) = d 1 y 1 y 1 ‾ + d 2 y 2 y 2 ‾ + ⋯ + d n y n y n ‾ = d 1 ∣ y 1 ∣ 2 + d 2 ∣ y 2 ∣ 2 + ⋯ + d n ∣ y n ∣ 2 g(Y)=d_1y_1\overline{y_1}+d_2y_2\overline{y_2}+\cdots+d_ny_n\overline{y_n}\\ =d_1|y_1|^2+d_2|y_2|^2+\cdots+d_n|y_n|^2 g(Y)=d1y1y1+d2y2y2+⋯+dnynyn=d1∣y1∣2+d2∣y2∣2+⋯+dn∣yn∣2
则称 g ( Y ) g(Y) g(Y)是 f ( X ) f(X) f(X)的标准形。(一定存在,因此H阵一定酉相似于对角阵,所以可以令X=UY)
标准型的计算:配方法(初等变换法);酉变换法
若 f ( X ) f(X) f(X)在可逆线性变换 X = C Y X=CY X=CY下变成标准形: g ( Y ) = d 1 ∣ y 1 ∣ 2 + ⋯ + d p ∣ y p ∣ 2 − d p + 1 ∣ y p + 1 ∣ 2 − ⋯ − d r ∣ y r ∣ 2 g(Y)=d_1|y_1|^2+\cdots+d_p|y_p|^2-d_{p+1}|y_{p+1}|^2-\cdots-d_r|y_r|^2 g(Y)=d1∣y1∣2+⋯+dp∣yp∣2−dp+1∣yp+1∣2−⋯−dr∣yr∣2。在可逆线性变换 X = D Z X=DZ X=DZ下变成标准形: h ( Z ) = k 1 ∣ z 1 ∣ 2 + ⋯ + k q ∣ z q ∣ 2 − k q + 1 ∣ z q + 1 ∣ 2 − ⋯ − k r ∣ z r ∣ 2 h(Z)=k_1|z_1|^2+\cdots+k_q|z_q|^2-k_{q+1}|z_{q+1}|^2-\cdots-k_r|z_r|^2 h(Z)=k1∣z1∣2+⋯+kq∣zq∣2−kq+1∣zq+1∣2−⋯−kr∣zr∣2,其中 d i , k i d_i,k_i di,ki均大于0,则 p = q p=q p=q。
定义:Hermite二次型的标准形中的正项个数称为其正惯性指数,负项个数称为其负惯性指数。
H阵的惯性定理:对于与H阵A共轭合同的两个对角阵,其正项、负项个数相同。(正惯性指数与负惯性指数相加为矩阵A的秩)
规范形:如果 n × n n\times n n×nHermite矩阵A的正、负惯性指数分别是 p , q p,q p,q,则A必定与矩阵 ( I p O O O − I q O O O O ) \begin{pmatrix} I_p&O&O\\O&-I_q&O\\O&O&O\end{pmatrix} ⎝⎛IpOOO−IqOOOO⎠⎞共轭合同,称次矩阵为A的规范形。
定理:若 H H H阵A,B共轭合同 ⟺ \iff ⟺A,B有相同的正、负惯性指数。
4 有定性
**正定的定义:**设 A A A是 H H H阵, f ( X ) = X H A X f(X)=X^HAX f(X)=XHAX,若对 ∀ X 0 ≠ θ , f ( X 0 ) > 0 \forall X_0\neq\theta,f(X_0)>0 ∀X0=θ,f(X0)>0,则称 f f f是正定的, A A A是正定的 H H H阵。
判别方法:
正定的充要条件:
其它有定性:
半正定的判别方法:
半正定的充要条件:
奇值分解定理:设 A A A是秩为 r r r的 s × n s\times n s×n矩阵,则 A H A A^HA AHA是秩为 r r r的半正定矩阵,设其非零特征值为 λ 1 , ⋯ , λ r \lambda_1,\cdots,\lambda_r λ1,⋯,λr,令 d i = λ i d_i=\sqrt{\lambda_i} di=λi, D = d i a g { d 1 . d 2 , ⋯ , d r } D=diag\{d_1.d_2,\cdots,d_r\} D=diag{d1.d2,⋯,dr},则一定存在 s s s阶酉矩阵 U U U和 n n n阶酉矩阵 V V V,使得:
A = U ( D O O O ) V A=U\begin{pmatrix}D&O\\O&O \end{pmatrix}V A=U(DOOO)V
Rayleigh商:设 A A A是 H H H阵, ∀ x ∈ C n , X H A X ∈ R \forall x\in C^n,X^HAX\in R ∀x∈Cn,XHAX∈R, ∀ X ≠ θ \forall X\neq\theta ∀X=θ,定义复变量实值函数:
R ( X ) = X H A X X H X = ⟨ A X , X ⟩ ⟨ X , X ⟩ R(X)=\frac{X^HAX}{X^HX}=\frac{\lang AX,X\rang}{\lang X,X\rang} R(X)=XHXXHAX=⟨X,X⟩⟨AX,X⟩
称 R R R是A的Rayleigh商。
设 A ∈ C n × n A\in C^{n\times n} A∈Cn×n是H阵, λ 1 ≤ λ 2 ≤ … , λ n \lambda_1\leq\lambda_2\leq\dots,\lambda_n λ1≤λ2≤…,λn是A的所有特征值,其中 λ 1 = min X ≠ θ R ( x ) \lambda_1=\min_{X\neq\theta}R(x) λ1=minX=θR(x), λ n = max X ≠ θ R ( x ) \lambda_n=\max_{X\neq\theta}R(x) λn=maxX=θR(x)。
证:因为A是H阵,所有A有n个两两正交的单位特征向量
设 η 1 , ⋯ , η n \eta_1,\cdots,\eta_n η1,⋯,ηn是A相应于特征值的标准正交特征向量
于是 η 1 , ⋯ , η n \eta_1,\cdots,\eta_n η1,⋯,ηn是标准正交基
只证: λ 1 = min X ≠ θ R ( x ) \lambda_1=\min_{X\neq\theta}R(x) λ1=minX=θR(x)
∀ X ∈ C n , ∃ k 1 , ⋯ , k n ∈ C , s . t . X = k 1 η 1 + ⋯ + k n η n \forall X\in C^n,\exist k_1,\cdots,k_n\in C, s.t.X=k_1\eta_1+\cdots+k_n\eta_n ∀X∈Cn,∃k1,⋯,kn∈C,s.t.X=k1η1+⋯+knηn
A X = k 1 A η 1 + ⋯ + k n A η n = = k 1 λ 1 η 1 + ⋯ + k n λ n η n AX = k_1A\eta_1+\cdots+k_nA\eta_n== k_1\lambda_1\eta_1+\cdots+k_n\lambda_n\eta_n AX=k1Aη1+⋯+knAηn==k1λ1η1+⋯+knλnηn
A X , X ⟩ = k 1 λ 1 k ‾ 1 + k 2 λ 2 k ‾ 2 + ⋯ + k n λ n k ‾ n = λ 1 ∣ k 1 ∣ 2 + ⋯ + λ n ∣ k n ∣ 2 ≥ λ 1 ( ∣ k 1 ∣ 2 + ⋯ + ∣ k n ∣ 2 ) = λ 1 < X , X > \begin{alignedat} \lang AX,X\rang&=k_1\lambda_1\overline k_1+k_2\lambda_2\overline k_2+\cdots+k_n\lambda_n\overline k_n\\ &=\lambda_1|k_1|^2+\cdots+\lambda_n|k_n|^2\\ &\geq\lambda_1(|k_1|^2+\cdots+|k_n|^2)\\ &=\lambda_1\end{alignedat} AX,X⟩=k1λ1k1+k2λ2k2+⋯+knλnkn=λ1∣k1∣2+⋯+λn∣kn∣2≥λ1(∣k1∣2+⋯+∣kn∣2)=λ1<X,X> 所以 λ 1 ≤ ⟨ A X , X ⟩ ⟨ X , X ⟩ = R ( x ) \lambda_1\leq\frac{\lang AX,X\rang}{\lang X,X\rang}=R(x) λ1≤⟨X,X⟩⟨AX,X⟩=R(x)
参考文献:工程矩阵理论,张明淳著