【矩阵论】8. 常用矩阵总结——镜面阵,正定阵

矩阵论
1. 准备知识——复数域上矩阵,Hermite变换)
1.准备知识——复数域上的内积域正交阵
1.准备知识——Hermite阵,二次型,矩阵合同,正定阵,幂0阵,幂等阵,矩阵的秩
2. 矩阵分解——SVD准备知识——奇异值
2. 矩阵分解——SVD
2. 矩阵分解——QR分解
2. 矩阵分解——正定阵分解
2. 矩阵分解——单阵谱分解
2. 矩阵分解——正规分解——正规阵
2. 矩阵分解——正规谱分解
2. 矩阵分解——高低分解
3. 矩阵函数——常见解析函数
3. 矩阵函数——谱公式,幂0与泰勒计算矩阵函数
3. 矩阵函数——矩阵函数求导
4. 矩阵运算——观察法求矩阵特征值特征向量
4. 矩阵运算——张量积
4. 矩阵运算——矩阵拉直
4.矩阵运算——广义逆——加号逆定义性质与特殊矩阵的加号逆
4. 矩阵运算——广义逆——加号逆的计算
4. 矩阵运算——广义逆——加号逆应用
4. 矩阵运算——广义逆——减号逆
5. 线性空间与线性变换——线性空间
5. 线性空间与线性变换——生成子空间
5. 线性空间与线性变换——线性映射与自然基分解,线性变换
6. 正规方程与矩阵方程求解
7. 范数理论——基本概念——向量范数与矩阵范数
7.范数理论——基本概念——矩阵范数生成向量范数&谱范不等式
7. 矩阵理论——算子范数
7.范数理论——范数估计——许尔估计&谱估计
7. 范数理论——非负/正矩阵
8. 常用矩阵总结——秩1矩阵,优阵(单位正交阵),Hermite阵
8. 常用矩阵总结——镜面阵,正定阵
8. 常用矩阵总结——单阵,正规阵,幂0阵,幂等阵,循环阵


8.4 镜面阵

法向量确定一个镜面

【矩阵论】8. 常用矩阵总结——镜面阵,正定阵_第1张图片

8.4.1 镜面阵的作用

对法向量

  • A α = − α A\alpha=-\alpha Aα=α
  • A ( A α ) = A 2 α = α A(A\alpha)=A^2\alpha=\alpha A(Aα)=A2α=α

对镜面上向量

  • A Y = Y AY=Y AY=Y

8.4.2 镜面阵表示

A = I n − 2 α α H ∣ α ∣ 2 , 其中 α = ( x 1 x 2 ⋮ x n ) ∈ C n , 且 α ≠ 0 A=I_n-\frac{2\alpha\alpha^H}{\vert \alpha\vert^2},其中 \alpha=\left(\begin{matrix}x_1\\x_2\\\vdots\\x_n\end{matrix}\right)\in C^n,且\alpha\neq 0 A=Inα22ααH,其中α= x1x2xn Cn,α=0

ϵ = α ∣ α ∣ \epsilon=\frac{\alpha}{\vert \alpha\vert} ϵ=αα ,镜面阵 A = I − 2 ϵ ϵ H A=I-2\epsilon\epsilon^H A=I2ϵϵH ,满足 ϵ H ϵ = ∣ ϵ ∣ 2 = 1 \epsilon^H\epsilon=\vert\epsilon\vert^2=1 ϵHϵ=ϵ2=1

验证:
对于法向量 α , A α = ( I n − 2 α α H ∣ α ∣ 2 ) α = α − 2 α α H α ∣ α ∣ 2 = α − 2 α ∣ α ∣ 2 ∣ α ∣ 2 = − α 对于 Y ∈ 镜面,有 α ⊥ Y , 即内积 ( α , Y ) = ( Y , α ) = 0 , 且 ( Y , α ) = α H Y = 0 A Y = ( I n − 2 α α H ∣ α ∣ 2 ) Y = Y − 2 α α H Y ∣ α ∣ 2 = Y \begin{aligned} &对于法向量\alpha,A\alpha=(I_n-\frac{2\alpha\alpha^H}{\vert \alpha\vert^2})\alpha=\alpha-\frac{2\alpha\alpha^H\alpha}{\vert \alpha\vert^2}=\alpha-\frac{2\alpha\vert \alpha\vert^2}{\vert \alpha\vert^2}=-\alpha\\ &对于Y\in 镜面,有\alpha\bot Y,即内积(\alpha,Y)=(Y,\alpha)=0,且(Y,\alpha)=\alpha^HY=0\\ &\quad AY=(I_n-\frac{2\alpha\alpha^H}{\vert \alpha\vert^2})Y=Y-\frac{2\alpha\alpha^HY}{\vert \alpha\vert^2}=Y \end{aligned} 对于法向量αAα=(Inα22ααH)α=αα22ααHα=αα22αα2=α对于Y镜面,有αY,即内积(α,Y)=(Y,α)=0,(Y,α)=αHY=0AY=(Inα22ααH)Y=Yα22ααHY=Y

8.4.3 性质

a. 特根

镜面阵至少有两个特征向量 α \alpha α Y Y Y

  • A α = − α A\alpha=-\alpha Aα=α ,特根为 − 1 -1 1
  • A Y = Y AY=Y AY=Y ,特根为 1 1 1

代数方法求特根
平移法: A − I = − 2 α α H ∣ α ∣ 2 为秩 1 矩阵 , 特根 λ ( A − I ) = { − 2 ∣ α ∣ 2 t r ( α α H ) , 0 , ⋯   , 0 ⏟ n − 1 } = = t r ( X X H ) = X H X = ∣ X ∣ 2 { − 2 , 0 , ⋯   , 0 } ⇒ λ ( A ) = λ ( − 2 α α H ∣ α ∣ 2 ) + 1 = { − 1 , 1 , ⋯   , 1 ⏟ n − 1 } \begin{aligned} &平移法:\\ &A-I=-2\frac{\alpha\alpha^H}{\vert \alpha\vert^2}为秩1矩阵,\\ &特根\lambda(A-I)=\{\frac{-2}{\vert \alpha\vert^2}tr(\alpha\alpha^H),\underbrace{0,\cdots,0}_{n-1}\}=\xlongequal{tr(XX^H)=X^HX=\vert X\vert^2}\{-2,0,\cdots,0\}\\ &\Rightarrow \lambda(A)=\lambda\left(-2\frac{\alpha\alpha^H}{\vert \alpha\vert^2}\right)+1=\{-1,\underbrace{1,\cdots,1}_{n-1}\} \end{aligned} 平移法:AI=2α2ααH为秩1矩阵,特根λ(AI)={α22tr(ααH),n1 0,,0}=tr(XXH)=XHX=X2 {2,0,,0}λ(A)=λ(2α2ααH)+1={1,n1 1,,1}
特征多项式 ∣ λ I − A ∣ = ( λ + 1 ) ( λ − 1 ) n − 1 \vert \lambda I-A\vert=(\lambda+1)(\lambda-1)^{n-1} λIA=(λ+1)(λ1)n1

b. 特向

镜面上有 n − 1 n-1 n1 个独立的(线性无关)向量, Y 1 , Y 2 , ⋯   , Y n − 1 Y_1,Y_2,\cdots,Y_{n-1} Y1,Y2,,Yn1 ( A Y 1 = Y 1 , A Y 2 = Y 2 , ⋯   , A Y n − 1 = Y n − 1 ) (AY_1=Y_1,AY_2=Y_2,\cdots,AY_{n-1}=Y_{n-1}) (AY1=Y1,AY2=Y2,,AYn1=Yn1) 都是 1 1 1 的特向

  • Y 1 , Y 2 , ⋯   , Y n − 1 Y_1,Y_2,\cdots,Y_{n-1} Y1,Y2,,Yn1 α H X = 0 \alpha^HX=0 αHX=0 n − 1 n-1 n1 个线性无关的解

    证明:
    A − I = − 2 ∣ α ∣ 2 α α H 为秩 1 矩阵,故 α 为 A − I 的特向, r ( α H ) = 1 , α H X = 0 且 n − r ( α H ) = n − 1 , 故 α H X = 0 有 n − 1 个线性无关解 Y 1 , ⋯   , Y n − 1 ( A − I ) X = ( − 2 ∣ α ∣ 2 α α H ) X = ( − 2 ∣ α ∣ 2 α ) α H X = 0 ⇒ Y 1 , ⋯   , Y n − 1 为 ( A − I ) 特根为 0 的根 由平移矩阵性质, A − I 与 A 有相同的特根, α , Y 1 , ⋯   , Y n − 1 为 A 的特征向量 ( A − I ) α = − 2 α ⇒ A α = − α ( A − I ) Y 1 = 0 , ⋯   , ( A − I ) Y n − 1 = 0 ⇒ A Y 1 = Y 1 , ⋯   , A Y n − 1 = Y n − 1 \begin{aligned} &A-I=\frac{-2}{\vert \alpha\vert^2}\alpha\alpha^H 为秩1矩阵,故\alpha为A-I的特向,r(\alpha^H)=1,\alpha^HX=0\\ &且n-r(\alpha^H)=n-1,故 \alpha^HX=0有n-1个线性无关解Y_1,\cdots,Y_{n-1}\\ &(A-I)X=(\frac{-2}{\vert \alpha\vert^2}\alpha\alpha^H)X=(\frac{-2}{\vert \alpha\vert^2}\alpha)\alpha^HX=0\Rightarrow Y_1,\cdots,Y_{n-1}为(A-I)特根为0的根\\ &由平移矩阵性质,A-I与A有相同的特根,\alpha,Y_1,\cdots,Y_{n-1}为A的特征向量\\ &(A-I)\alpha=-2\alpha\Rightarrow A\alpha=-\alpha\\ &(A-I)Y_1=0,\cdots,(A-I)Y_{n-1}=0\Rightarrow AY_1=Y_1,\cdots,AY_{n-1}=Y_{n-1} \end{aligned} AI=α22ααH为秩1矩阵,故αAI的特向,r(αH)=1,αHX=0nr(αH)=n1,αHX=0n1个线性无关解Y1,,Yn1(AI)X=(α22ααH)X=(α22α)αHX=0Y1,,Yn1(AI)特根为0的根由平移矩阵性质,AIA有相同的特根,α,Y1,,Yn1A的特征向量(AI)α=2αAα=α(AI)Y1=0,,(AI)Yn1=0AY1=Y1,,AYn1=Yn1

【矩阵论】8. 常用矩阵总结——镜面阵,正定阵_第2张图片

  • 镜面阵内 n − 1 n-1 n1 个特征向量有不同选法,可取 Y 1 ⊥ Y 2 ⊥ ⋯ ⊥ Y n − 1 Y_1\bot Y_2\bot\cdots\bot Y_{n-1} Y1Y2Yn1 (互正交),故可对镜面阵有 n n n 个正交特向 { X ⊥ Y 1 ⊥ Y 2 ⊥ ⋯ ⊥ Y n − 1 } \{X\bot Y_1\bot Y_2\bot \cdots \bot Y_{n-1}\} {XY1Y2Yn1}

    正规阵,Hermite阵有 n n n 个相互正交的向量

A A A 的全体特根为 λ ( A ) = { − 1 , 1 , ⋯   , 1 ⏟ n − 1 个 1 } \lambda(A)=\{-1,\underbrace{1,\cdots,1}_{n-1个1}\} λ(A)={1,n11 1,,1}

c. 镜面阵为 H e r m i t e Hermite Hermite

A = I n − 2 ( α α H ) ∣ α ∣ 2 A=I_n-\frac{2(\alpha\alpha^H)}{\vert \alpha\vert^2} A=Inα22(ααH) Hermite阵的差

d. A 2 = I A^2=I A2=I

A 2 α = A ( A α ) = A ( − α ) = − ( A α ) = − ( − α ) = α A^2\alpha=A(A\alpha)=A(-\alpha)=-(A\alpha)=-(-\alpha)=\alpha A2α=A(Aα)=A(α)=(Aα)=(α)=α

即证明: A 2 = I A^2=I A2=I

【矩阵论】8. 常用矩阵总结——镜面阵,正定阵_第3张图片

任取 C n 中向量 W , 可分解为 W = Y + k α ( 直角分解 ) A W = A ( Y + k α ) = A Y + k ( A α ) = Y + k ( − α ) = Y − k α = W ~ A 2 W = A ( A W ) = A W ~ = A ( Y − k α ) = A Y − k A α = Y + k α = W ∀ W ∈ C n ,有 A 2 W = W , 故 A 2 = I \begin{aligned} &任取C^n中向量W,可分解为 W=Y+k\alpha(直角分解)\\ &AW=A(Y+k\alpha)=AY+k(A\alpha)=Y+k(-\alpha)=Y-k\alpha=\widetilde{W}\\ &A^2W=A(AW)=A\widetilde{W}=A(Y-k\alpha)=AY-kA\alpha=Y+k\alpha=W\\ &\forall W\in C^n,有A^2W=W,故 A^2=I \end{aligned} 任取Cn中向量W,可分解为W=Y+kα(直角分解)AW=A(Y+kα)=AY+k(Aα)=Y+k(α)=Ykα=W A2W=A(AW)=AW =A(Ykα)=AYkAα=Y+kα=WWCn,有A2W=W,A2=I


A 2 = ( I − 2 α α H ∣ α ∣ 2 ) 2 = I 2 − 4 α α H ∣ α ∣ 2 + 4 ∣ α ∣ 4 ( α α H ) 2 其中 ( α α H ) 2 = ( α α H ) ( α α H ) = α ( α H α ) α H = ∣ α ∣ 2 α α H ⇒ A 2 = I 2 − 4 α α H ∣ α ∣ 2 + 4 ∣ α ∣ 4 ( α α H ) 2 = I 2 − 4 α α H ∣ α ∣ 2 + 4 ∣ α ∣ 4 ∣ α ∣ 2 α α H = I \begin{aligned} &A^2=\left(I-\frac{2\alpha\alpha^H}{\vert \alpha\vert^2}\right)^2=I^2-\frac{4\alpha\alpha^H}{\vert \alpha\vert^2}+\frac{4}{\vert \alpha\vert^4}\left(\alpha\alpha^H\right)^2\\ &其中 (\alpha\alpha^H)^2=(\alpha\alpha^H)(\alpha\alpha^H)=\alpha(\alpha^H\alpha)\alpha^H=\vert \alpha\vert^2\alpha\alpha^H\\ &\Rightarrow A^2=I^2-\frac{4\alpha\alpha^H}{\vert \alpha\vert^2}+\frac{4}{\vert \alpha\vert^4}\left(\alpha\alpha^H\right)^2=I^2-\frac{4\alpha\alpha^H}{\vert \alpha\vert^2}+\frac{4}{\vert \alpha\vert^4}\vert \alpha\vert^2\alpha\alpha^H=I \end{aligned} A2=(Iα22ααH)2=I2α24ααH+α44(ααH)2其中(ααH)2=(ααH)(ααH)=α(αHα)αH=α2ααHA2=I2α24ααH+α44(ααH)2=I2α24ααH+α44α2ααH=I

d. A − 1 = A A^{-1}=A A1=A

e. A A A 为优阵

由于 A H = A A^H=A AH=A ,且 A − 1 = A A^{-1}=A A1=A ,故 A H A = A − 1 A = I A^HA=A^{-1}A=I AHA=A1A=I A A A 为优阵

特根 λ ( A ) = { − 1 , 1 , ⋯   , 1 ⏟ n − 1 } \lambda(A)=\{-1,\underbrace{1,\cdots,1}_{n-1}\} λ(A)={1,n1 1,,1} ,特向 α ⊥ Y 1 ⊥ ⋯ ⊥ Y n − 1 \alpha\bot Y_1\bot\cdots\bot Y_{n-1} αY1Yn1 ,优阵 Q = ( α ∣ α ∣ , Y 1 ∣ Y 1 ∣ , ⋯   , Y n − 1 ∣ Y n − 1 ∣ ) Q=\left(\frac{\alpha}{\vert \alpha\vert},\frac{Y_1}{\vert Y_1\vert},\cdots,\frac{Y_{n-1}}{\vert Y_{n-1}\vert}\right) Q=(αα,Y1Y1,,Yn1Yn1) Q − 1 = Q H Q^{-1}=Q^H Q1=QH

⇒ Q − 1 A Q = Q H A Q = D = ( − 1 1 ⋱ 1 ) \Rightarrow Q^{-1}AQ=Q^HAQ=D=\left(\begin{matrix}-1&&&\\&1&&\\&&\ddots&\\&&&1\end{matrix}\right) Q1AQ=QHAQ=D= 111 为对角阵

D = ( − 1 1 ⋱ 1 ) D=\left(\begin{matrix}-1&&&\\&1&&\\&&\ddots&\\&&&1\end{matrix}\right) D= 111 为一个特殊镜面阵,法向量指向 x x x 轴方向

8.4.3 向量构造镜面阵

R n R^n Rn 中2个 实向量 α = ( a 1 ⋮ a n ) , β = ( b 1 ⋮ b n ) ∈ R n \alpha=\left(\begin{matrix}a_1\\\vdots\\a_n\end{matrix}\right),\beta=\left(\begin{matrix}b_1\\\vdots\\b_n\end{matrix}\right)\in R^n α= a1an ,β= b1bn Rn ,且 { ∣ α ∣ = ∣ β ∣ α ≠ β \left\{ \begin{aligned}&\vert\alpha\vert=\vert\beta\vert\\&\alpha\neq \beta\end{aligned}\right. {α=βα=β ,则有镜面阵 P = I − 2 ( α − β ) ( α − β ) H ∣ ( α − β ) ∣ 2 P=I-\frac{2(\alpha-\beta)(\alpha-\beta)^H}{\vert (\alpha-\beta)\vert^2} P=I(αβ)22(αβ)(αβ)H ,使得 P α = β , P β = α P\alpha=\beta,P\beta=\alpha Pα=β,=α

【矩阵论】8. 常用矩阵总结——镜面阵,正定阵_第4张图片

证明:
令 P = I − 2 ( α − β ) ( α − β ) H ∣ ( α − β ) ∣ 2 ⇒ P X = P ( α − β ) = ( α − β ) − 2 ( α − β ) ( α − β ) H ( α − β ) ∣ ( α − β ) ∣ 2 = − ( α − β ) = − X ( α + β , X ) = ( α + β , α − β ) = ( α , α ) − ( α , β ) + ( β , α ) − ( β , β ) = ∣ α ∣ 2 − ∣ β ∣ 2 = 0 ⇒ 法向量 ( α − β ) ⊥ ( α + β ) , 其中 ( α + β ) ∈ 镜面 由于 { P ( α − β ) = − ( α − β ) P ( α + β ) = ( α + β ) ,两式相加得 2 P α = 2 β ⇒ P α = β , P − 1 β = P β = α \begin{aligned} &令P=I-\frac{2(\alpha-\beta)(\alpha-\beta)^H}{\vert (\alpha-\beta)\vert^2}\\ &\Rightarrow PX=P(\alpha-\beta)=(\alpha-\beta)-2\frac{(\alpha-\beta)(\alpha-\beta)^H(\alpha-\beta)}{\vert (\alpha-\beta)\vert^2}=-(\alpha-\beta)=-X\\ &(\alpha+\beta,X)=(\alpha+\beta,\alpha-\beta)=(\alpha,\alpha)-(\alpha,\beta)+(\beta,\alpha)-(\beta,\beta)=\vert \alpha\vert^2-\vert \beta\vert^2=0\\ &\Rightarrow 法向量 (\alpha-\beta)\bot (\alpha+\beta),其中(\alpha+\beta)\in 镜面\\ &由于\left\{ \begin{aligned} &P(\alpha-\beta)=-(\alpha-\beta)\\ &P(\alpha+\beta)=(\alpha+\beta) \end{aligned} \right.,两式相加得2P\alpha=2\beta\Rightarrow P\alpha=\beta,P^{-1}\beta=P\beta=\alpha \end{aligned} P=I(αβ)22(αβ)(αβ)HPX=P(αβ)=(αβ)2(αβ)2(αβ)(αβ)H(αβ)=(αβ)=X(α+β,X)=(α+β,αβ)=(α,α)(α,β)+(β,α)(β,β)=α2β2=0法向量(αβ)(α+β),其中(α+β)镜面由于{P(αβ)=(αβ)P(α+β)=(α+β),两式相加得2Pα=2βPα=β,P1β==α
eg

【矩阵论】8. 常用矩阵总结——镜面阵,正定阵_第5张图片

8.4.4 镜面阵与QR分解

P x P_{x} Px 表示 x x x 阶镜面阵 , A x A_{x} Ax 表示 x x x 阶方阵
P n A n = P n ( α 1 , α 2 , ⋯   , α n ) = P n α 1 = ( μ 1 0 ⋮ 0 ) n ( μ 1 ∗ O A n − 1 ) ( 1 0 0 P n − 1 ) P n A n = ( 1 0 0 P n − 1 ) ( μ 1 ∗ 0 A n − 1 ) = ( μ 1 ∗ 0 P n − 1 A n − 1 ) = ( μ 1 ∗ 0 P n − 1 ( β 1 , ⋯   , β n − 1 ) n − 1 × n − 1 ) = P 2 β 1 = ( μ 2 0 ⋮ 0 ) n − 1 ( μ 1 ∗ ∗ 0 μ 2 ∗ 0 0 A n − 2 ) \begin{aligned} P_nA_n&=P_n(\alpha_1,\alpha_2,\cdots,\alpha_n)\xlongequal{P_n\alpha_1=\left(\begin{matrix}\mu_1\\0\\\vdots\\0\end{matrix}\right)_n}\left( \begin{matrix} \mu_1&*\\ O&A_{n-1} \end{matrix} \right)\\\\ \left( \begin{matrix} 1&0\\0&P_{n-1} \end{matrix} \right)P_nA_n&=\left( \begin{matrix} 1&0\\0&P_{n-1} \end{matrix} \right)\left( \begin{matrix} \mu_1&*\\ 0&A_{n-1} \end{matrix} \right)= \left( \begin{matrix} \mu_1&*\\ 0&P_{n-1}A_{n-1} \end{matrix} \right)\\ &=\left( \begin{matrix} \mu_1&*\\ 0&P_{n-1}(\beta_1,\cdots,\beta_{n-1})_{n-1\times n-1 } \end{matrix} \right)\\ &\xlongequal{P_2\beta_1=\left(\begin{matrix}\mu_2\\0\\\vdots\\0\end{matrix}\right)_{n-1}}\left( \begin{matrix} \mu_1&*&*\\ 0&\mu_2&*\\ 0&0&A_{n-2} \end{matrix} \right) \end{aligned} PnAn(100Pn1)PnAn=Pn(α1,α2,,αn)Pnα1= μ100 n (μ1OAn1)=(100Pn1)(μ10An1)=(μ10Pn1An1)=(μ10Pn1(β1,,βn1)n1×n1)P2β1= μ200 n1 μ100μ20An2

( 1 0 0 ⋯ 0 0 1 0 ⋯ 0 0 0 1 ⋯ 0 ⋮ ⋮ ⋮ ⋱ ⋮ 0 0 0 ⋯ P 2 ) ⋯ ( 1 0 0 P n − 1 ) P n A = ( 1 0 0 ⋯ 0 0 1 0 ⋯ 0 0 0 1 ⋯ 0 ⋮ ⋮ ⋮ ⋱ ⋮ 0 0 0 ⋯ P 2 ) ( μ 1 ∗ ∗ ⋯ ∗ 0 μ 2 ∗ ⋯ ∗ 0 0 μ 3 ⋯ ∗ ⋮ ⋮ ⋮ ⋱ ∗ 0 0 0 ⋯ A 2 ) = ( μ 1 ∗ ∗ ⋯ ∗ 0 μ 2 ∗ ⋯ ∗ 0 0 μ 3 ⋯ ∗ ⋮ ⋮ ⋮ ⋱ ∗ 0 0 0 ⋯ P 2 A 2 ) = ( μ 1 ∗ ∗ ⋯ ∗ 0 μ 2 ∗ ⋯ ∗ 0 0 μ 3 ⋯ ∗ ⋮ ⋮ ⋮ ⋱ ∗ 0 0 0 ⋯ P 2 ( γ 1 , γ 2 ) 2 × 2 ) = P 2 γ 1 = ( μ n − 1 0 ) ( μ 1 ∗ ∗ ⋯ ∗ ∗ 0 μ 2 ∗ ⋯ ∗ ∗ 0 0 μ 3 ⋯ ∗ ∗ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ 0 0 0 ⋯ μ n − 1 ⋮ 0 0 0 ⋯ 0 ∗ ) = R \begin{aligned} \left( \begin{matrix} 1&0&0&\cdots&0\\ 0&1&0&\cdots&0\\ 0&0&1&\cdots&0\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ 0&0&0&\cdots&P_{2} \end{matrix} \right)\cdots\left( \begin{matrix} 1&0\\ 0&P_{n-1} \end{matrix} \right)P_nA&=\left( \begin{matrix} 1&0&0&\cdots&0\\ 0&1&0&\cdots&0\\ 0&0&1&\cdots&0\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ 0&0&0&\cdots&P_{2} \end{matrix} \right) \left( \begin{matrix} \mu_1&*&*&\cdots&*\\ 0&\mu_2&*&\cdots&*\\ 0&0&\mu_3&\cdots&*\\ \vdots&\vdots&\vdots&\ddots&*\\ 0&0&0&\cdots&A_{2} \end{matrix} \right)\\ &=\left( \begin{matrix} \mu_1&*&*&\cdots&*\\ 0&\mu_2&*&\cdots&*\\ 0&0&\mu_3&\cdots&*\\ \vdots&\vdots&\vdots&\ddots&*\\ 0&0&0&\cdots&P_{2}A_{2} \end{matrix} \right)\\ &=\left( \begin{matrix} \mu_1&*&*&\cdots&*\\ 0&\mu_2&*&\cdots&*\\ 0&0&\mu_3&\cdots&*\\ \vdots&\vdots&\vdots&\ddots&*\\ 0&0&0&\cdots&P_{2}(\gamma_1,\gamma_2)_{2\times 2} \end{matrix} \right)\\ &\xlongequal{P_2\gamma_1=\left(\begin{matrix}\mu_{n-1}\\0\end{matrix}\right)}\left( \begin{matrix} \mu_1&*&*&\cdots&*&*\\ 0&\mu_2&*&\cdots&*&*\\ 0&0&\mu_3&\cdots&*&*\\ \vdots&\vdots&\vdots&\ddots&\vdots&\vdots\\ 0&0&0&\cdots&\mu_{n-1}&\vdots\\ 0&0&0&\cdots&0&* \end{matrix} \right)=R\\ \end{aligned} 100001000010000P2 (100Pn1)PnA= 100001000010000P2 μ1000μ200μ30A2 = μ1000μ200μ30P2A2 = μ1000μ200μ30P2(γ1,γ2)2×2 P2γ1=(μn10) μ10000μ2000μ300μn10 =R

故有镜面阵 Q = P n ( 1 0 0 P n − 1 ) ⋯ ( 1 0 0 ⋯ 0 0 1 0 ⋯ 0 0 0 1 ⋯ 0 ⋮ ⋮ ⋮ ⋱ ⋮ 0 0 0 ⋯ P 2 ) Q=P_n\left( \begin{matrix} 1&0\\ 0&P_{n-1} \end{matrix} \right)\cdots\left( \begin{matrix} 1&0&0&\cdots&0\\ 0&1&0&\cdots&0\\ 0&0&1&\cdots&0\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ 0&0&0&\cdots&P_{2} \end{matrix} \right) Q=Pn(100Pn1) 100001000010000P2 ,使 Q A = R QA=R QA=R ,由于镜面阵为优H阵 Q H = Q − 1 = Q Q^H=Q^{-1}=Q QH=Q1=Q ,故有 Q R QR QR 分解 A = Q R A=QR A=QR

2阶例题

【矩阵论】8. 常用矩阵总结——镜面阵,正定阵_第6张图片

令 α = ( 1 i ) , ∣ α ∣ = 2 ,令 β = ( 2 0 ) , 令镜面法向量 X = α − β = ( 1 − 2 i ) X X H = ( 1 − 2 i ) ( 1 − 2 − i ) = ( ( 1 − 2 ) 2 − i ( 1 − 2 ) i ( 1 − 2 ) 1 ) = ( 3 − 2 − i ( 1 − 2 ) i ( 1 − 2 ) 1 ) ∣ X ∣ 2 = X H X = ( 1 − 2 − i ) ( 1 − 2 i ) = 2 ( 2 − 2 ) 镜面阵 Q = I 2 − 2 X X H ∣ X ∣ 2 = ( 1 0 0 1 ) − 2 2 ( 2 − 2 ) ( 3 − 2 2 − i ( 1 − 2 ) i ( 1 − 2 ) 1 ) = 1 2 ( 1 − i i − 1 ) 使得 Q ( 1 i ) = ( 2 0 ) ⇒ Q A = Q ( α 1 , α 2 ) = ( Q α 1 , Q α 2 ) = ( 2 i 2 0 − 3 2 ) = R 解出 A 的 Q R 分解 A = Q R , Q = 1 2 ( 1 − i i − 1 ) \begin{aligned} &令\alpha=\left( \begin{matrix} 1\\i \end{matrix} \right),\vert\alpha\vert=\sqrt{2},令 \beta=\left( \begin{matrix} \sqrt{2}\\0 \end{matrix} \right),令镜面法向量X=\alpha-\beta=\left( \begin{matrix} 1-\sqrt{2}\\i \end{matrix} \right)\\ &XX^H=\left( \begin{matrix} 1-\sqrt{2}\\i \end{matrix} \right)\left(1-\sqrt{2}\quad -i\right)=\left(\begin{matrix} (1-\sqrt{2})^2&-i(1-\sqrt{2})\\ i(1-\sqrt2)&1 \end{matrix}\right)=\left( \begin{matrix} 3-\sqrt{2}&-i(1-\sqrt{2})\\ i(1-\sqrt{2})&1 \end{matrix} \right)\\ &\vert X\vert^2=X^HX=\left( \begin{matrix} 1-\sqrt{2}\quad -i \end{matrix} \right)\left( \begin{matrix} 1-\sqrt{2}\\i \end{matrix} \right)=2(2-\sqrt{2})\\ &镜面阵Q=I_2-2\frac{XX^H}{\vert X\vert^2}=\left( \begin{matrix} 1&0\\0&1 \end{matrix} \right)-\frac{2}{2(2-\sqrt{2})}\left( \begin{matrix} 3-2\sqrt{2}&-i(1-\sqrt{2})\\ i(1-\sqrt{2})&1 \end{matrix} \right)=\frac{1}{\sqrt{2}}\left( \begin{matrix} 1&-i\\i&-1 \end{matrix} \right)\\ &使得 Q\left( \begin{matrix} 1\\i \end{matrix} \right)=\left( \begin{matrix} \sqrt{2}\\0 \end{matrix} \right)\Rightarrow QA=Q(\alpha_1,\alpha_2)=\left(Q\alpha_1,Q\alpha_2\right)=\left( \begin{matrix} \sqrt{2}&\frac{i}{\sqrt{2}}\\ 0&-\frac{3}{\sqrt{2}} \end{matrix} \right)=R\\ &解出A的QR分解 A=QR,Q=\frac{1}{\sqrt{2}}\left( \begin{matrix} 1&-i\\i&-1 \end{matrix} \right) \end{aligned} α=(1i),α=2 ,令β=(2 0),令镜面法向量X=αβ=(12 i)XXH=(12 i)(12 i)=((12 )2i(12 )i(12 )1)=(32 i(12 )i(12 )1)X2=XHX=(12 i)(12 i)=2(22 )镜面阵Q=I22X2XXH=(1001)2(22 )2(322 i(12 )i(12 )1)=2 1(1ii1)使得Q(1i)=(2 0)QA=Q(α1,α2)=(Qα1,Qα2)=(2 02 i2 3)=R解出AQR分解A=QR,Q=2 1(1ii1)

3阶例题

【矩阵论】8. 常用矩阵总结——镜面阵,正定阵_第7张图片

令 P 3 = I , P 3 ( 2 0 0 ) = ( 2 0 0 ) , 使得 P 3 A = ( 2 ∗ 0 A 2 ) 令 α 2 = ( 3 4 ) , β 2 = ( ∣ α 2 ∣ 0 ) = ( 5 0 ) , 二维镜面法向量 X 2 = α 2 − β 2 = ( − 2 4 ) , ∣ X 2 ∣ 2 = 20 , X X H = ( 5 − 8 − 8 16 ) P 2 = I 2 − 2 ∣ X 2 ∣ 2 X X H = ( 3 5 4 5 4 5 − 3 5 ) , 使得 P 2 A 2 = ( 5 − 2 5 0 − 11 5 ) ⇒ ( 1 0 0 P 2 ) P 3 A = ( 1 0 0 0 3 5 4 5 0 4 5 − 3 5 ) A = R = ( 2 − 1 3 0 3 5 − 2 5 0 0 − 11 5 ) 故有 Q = ( 1 0 0 P 2 ) P 3 = ( 1 0 0 0 3 5 4 5 0 4 5 − 3 5 ) , R = ( 2 − 1 3 0 3 5 − 2 5 0 0 − 11 5 ) , 使得 A = Q R \begin{aligned} &令P_3=I,P_3\left( \begin{matrix} 2\\0\\0 \end{matrix} \right)=\left( \begin{matrix} 2\\0\\0 \end{matrix} \right),使得P_3A=\left( \begin{matrix} 2&*\\ 0&A_2 \end{matrix} \right)\\ &令\alpha_2=\left( \begin{matrix} 3\\4 \end{matrix} \right),\beta_2=\left( \begin{matrix} \vert \alpha_2\vert\\0 \end{matrix} \right)=\left( \begin{matrix} 5\\0 \end{matrix} \right),二维镜面法向量X_2=\alpha_2-\beta_2=\left( \begin{matrix} -2\\4 \end{matrix} \right),\vert X_2\vert^2=20,XX^H=\left( \begin{matrix} 5&-8\\-8&16 \end{matrix} \right)\\ &\quad P_2=I_2-\frac{2}{\vert X_2\vert^2}XX^H=\left( \begin{matrix} \frac{3}{5}&\frac{4}{5}\\\frac{4}{5}&-\frac{3}{5} \end{matrix} \right),使得P_2A_2=\left( \begin{matrix} 5&-\frac{2}{5}\\0&-\frac{11}{5} \end{matrix} \right)\\ &\Rightarrow\left( \begin{matrix} 1&0\\0&P_2 \end{matrix} \right)P_3A=\left( \begin{matrix} 1&0&0\\ 0&\frac{3}{5}&\frac{4}{5}\\ 0&\frac{4}{5}&-\frac{3}{5} \end{matrix} \right)A=R=\left( \begin{matrix} 2&-1&3\\ 0&\frac{3}{5}&-\frac{2}{5}\\ 0&0&-\frac{11}{5} \end{matrix} \right)\\ &故有Q=\left( \begin{matrix} 1&0\\ 0&P_2 \end{matrix} \right)P_3=\left( \begin{matrix} 1&0&0\\ 0&\frac{3}{5}&\frac{4}{5}\\ 0&\frac{4}{5}&-\frac{3}{5} \end{matrix} \right),R=\left( \begin{matrix} 2&-1&3\\ 0&\frac{3}{5}&-\frac{2}{5}\\ 0&0&-\frac{11}{5} \end{matrix} \right),使得A=QR \end{aligned} P3=I,P3 200 = 200 ,使得P3A=(20A2)α2=(34),β2=(α20)=(50),二维镜面法向量X2=α2β2=(24),X22=20,XXH=(58816)P2=I2X222XXH=(53545453),使得P2A2=(5052511)(100P2)P3A= 1000535405453 A=R= 2001530352511 故有Q=(100P2)P3= 1000535405453 R= 2001530352511 ,使得A=QR

8.5 正定阵

8.5.1 二次型

a. 二次型定义

A A A H e r m i t e Hermite Hermite ( A H = A ∈ C n × n ) (A^H=A\in C^{n\times n}) (AH=ACn×n) X = ( x 1 x 2 ⋮ x n ) X=\left( \begin{matrix} x_1\\ x_2\\ \vdots\\ x_n \end{matrix} \right) X= x1x2xn ,称 X H A X = ( x 1 ‾ , x 2 ‾ , ⋯   , x n ‾ ) A ( x 1 x 2 ⋮ x n ) X^HAX=\left(\overline{x_1},\overline{x_2},\cdots,\overline{x_n}\right)A\left( \begin{matrix} x_1\\ x_2\\ \vdots\\ x_n \end{matrix} \right) XHAX=(x1,x2,,xn)A x1x2xn ,为矩阵 A A A 产生的二次型,记为 f ( x ) = X H A X f(x)=X^HAX f(x)=XHAX

b. 正定二次型与正定阵定义

A H = A A^H=A AH=A ,对一切 X ≠ 0 X\neq 0 X=0 ,有 X H A X > 0 X^HAX>0 XHAX>0 ,则 f ( x ) = X H A X f(x)=X^HAX f(x)=XHAX 为正定二次型,A为正定阵,记为 A > 0 A>0 A>0
A H = A A^H=A AH=A ,对一切 X ≠ 0 X\neq 0 X=0 ,有 X H A X ≥ 0 X^HAX\ge 0 XHAX0 ,则 f ( x ) = X H A X f(x)=X^HAX f(x)=XHAX 为半正定二次型,A为半正定阵,记为 A ≥ 0 A\ge 0 A0

8.5.2 正定阵的定理

A > 0    ⟺    A>0\iff A>0 A A A 为Hermite阵,且 λ 1 , λ 2 , ⋯   , λ n > 0 \lambda_1,\lambda_2,\cdots,\lambda_n > 0 λ1,λ2,,λn>0
A ≥ 0    ⟺    A\ge 0 \iff A0 A A A 为Hermite阵,且 λ 1 , λ 2 , ⋯   , λ n ≥ 0 \lambda_1,\lambda_2,\cdots,\lambda_n \ge 0 λ1,λ2,,λn0


证明

⇒ \Rightarrow

A A A 为正定阵,则 A A A 生成的二次型 f ( x ) = X H A X > 0 f(x)=X^HAX>0 f(x)=XHAX>0 ∴ λ i = X H A X ∣ X ∣ 2 > 0 \therefore \lambda_i=\frac{X^HAX}{\vert X\vert^2}>0 λi=X2XHAX>0

⇐ \Leftarrow
由 H e r m i t e 分解定理, A 为 H e r m i t e 阵,则存在 U 阵 Q , 使得 Q H A Q = Λ = ( λ 1 ⋱ λ n ) ∴ A = Δ Λ , 而 λ i > 0 , Λ 为正定阵,故 A 为正定阵 \begin{aligned} &由Hermite分解定理,A为Hermite阵,则存在U阵Q,\\ &使得Q^HAQ=\Lambda=\left( \begin{matrix} \lambda_1&\quad&\quad\\ &\ddots&\quad\\ &\quad&\lambda_n\\ \end{matrix} \right)\\ &\therefore A\overset{\Delta}{=}\Lambda,而\lambda_i>0,\Lambda 为正定阵,故A为正定阵 \end{aligned} Hermite分解定理,AHermite阵,则存在UQ使得QHAQ=Λ= λ1λn A=ΔΛ,λi>0Λ为正定阵,故A为正定阵
单位阵是正定阵 λ i = 1 \lambda_i= 1 λi=1 显然大于0

8.5.3 正定阵间必合同

  1. A > 0 (正定阵)    ⟺    A = Δ Λ A>0(正定阵) \iff A\overset{\Delta}{=}\Lambda A>0(正定阵)A=ΔΛ
  2. Λ = Δ I \Lambda\overset{\Delta}{=}I Λ=ΔI 对角阵一定合同于单位阵
  3. 若A,B为同阶正定阵,则 A = Δ B A\overset{\Delta}{=} B A=ΔB

证明1:
若 A 正定,则有 A H = A 由 H e r m i t e 分解定理,必 ∃ 优阵 Q 使得 Q H A Q = Λ , 且 λ i > 0 \begin{aligned} &若A正定,则有A^H=A\\ &由Hermite分解定理,必\exist 优阵Q使得Q^HAQ=\Lambda,且\lambda_i>0\\ \end{aligned} A正定,则有AH=AHermite分解定理,必优阵Q使得QHAQ=Λ,λi>0
证明2:
若 Λ = ( λ 1 ⋱ λ n ) , 其中 λ i > 0 ⇒ f ( x ) = X H Λ X = λ 1 ∣ x 1 ∣ 2 + λ 2 ∣ x 2 ∣ 2 + ⋯ + λ n ∣ x n ∣ 2 > 0 ⇒ 可分解为 Λ = ( λ 1 ⋱ λ n ) I ( λ 1 ⋱ λ n ) = P I P 可知 P 可逆,且 P H = P , 故 P H I P = Λ 即对角正定阵合同于单位阵,记为 Λ = Δ I \begin{aligned} 若\Lambda&=\left( \begin{matrix} \lambda_1&\quad&\quad\\ &\ddots&\\ &&\lambda_n \end{matrix} \right),其中\lambda_i>0\\ &\Rightarrow f(x)=X^H\Lambda X=\lambda_1\vert x_1\vert^2+\lambda_2\vert x_2\vert^2+\cdots+\lambda_n\vert x_n\vert^2>0\\ &\Rightarrow 可分解为\Lambda=\left( \begin{matrix} \sqrt{\lambda_1}&\quad&\quad\\ \quad&\ddots&\quad\\ \quad&\quad&\sqrt{\lambda_n}\\ \end{matrix} \right)I\left( \begin{matrix} \sqrt{\lambda_1}&&\\ &\ddots&\\ &&\sqrt{\lambda_n}\\ \end{matrix} \right)\\ &\quad \quad\quad\quad\quad \quad \quad=PIP\\ &可知P可逆,且P^H=P,故P^HIP=\Lambda\\ &即对角正定阵合同于单位阵,记为\Lambda\overset{\Delta}{=}I \end{aligned} Λ= λ1λn ,其中λi>0f(x)=XHΛX=λ1x12+λ2x22++λnxn2>0可分解为Λ= λ1 λn I λ1 λn =PIP可知P可逆,且PH=P,PHIP=Λ即对角正定阵合同于单位阵,记为Λ=ΔI
证明3:
由 A > 0 , B > 0 , 则 A = Δ I , B = Δ I ⇒ A = Δ B \begin{aligned} &由A>0,B>0,则A\overset{\Delta}{=}I,B\overset{\Delta}{=}I\Rightarrow A\overset{\Delta}{=}B \end{aligned} A>0,B>0,A=ΔI,B=ΔIA=ΔB

8.5.4 乘积形式的正定阵

  1. 对一切矩阵 A = A n × p A=A_{n\times p} A=An×p n ≥ p n\ge p np A H A A^HA AHA A A H AA^H AAH 都是Hermite阵
  2. A H A A^HA AHA A A H AA^H AAH 只相差 n − p n-p np 个0根
  3. A H A ≥ 0 A^HA\ge0 AHA0 A H A ≥ 0 A^HA\ge 0 AHA0
  4. r ( A H A ) = r ( A A H ) = r ( A ) r(A^HA)=r(AA^H)=r(A) r(AHA)=r(AAH)=r(A)

a. A H A A^HA AHA 为Hermite阵

( A H A ) H = A H A ,且 ( A A H ) H = A A H ,则 A H A 与 A A H 为 H e r m i t e 阵 \begin{aligned} (A^HA)^H=A^HA,且(AA^H)^H=AA^H,则A^HA与AA^H为Hermite阵 \end{aligned} (AHA)H=AHA,且(AAH)H=AAH,则AHAAAHHermite

b. A H A 与 A A H A^HA与AA^H AHAAAH 相差n-p个0根

A = A n × p , B = p × n , 且 n ≥ p 由换位公式 ∣ λ I − A B ∣ = λ n − p ∣ λ I − B A ∣ , 则 A B 与 B A 必有相同的非零根,故 A H A 与 A A H 只相差 n − p 个零根 \begin{aligned} &A=A_{n\times p},B={p\times n},且n\ge p\\ &由换位公式 \vert \lambda I-AB\vert=\lambda^{n-p}\vert \lambda I-BA \vert,\\ &则 AB与BA必有相同的非零根,故A^HA与AA^H只相差n-p个零根 \end{aligned} A=An×p,B=p×n,np由换位公式λIAB=λnpλIBA,ABBA必有相同的非零根,故AHAAAH只相差np个零根

c. A H A 与 A A H A^HA与AA^H AHAAAH 是半正定阵(不是方阵的正定阵)

对任意非零向量 X ,有二次型 f ( x ) = X H A H A X = ( A X ) H ( A X ) = ∣ A X ∣ 2 ≥ 0 , 可知 f ( x ) 为半正定二次型, A H A 为半正定阵 \begin{aligned} &对任意非零向量X,有二次型f(x)=X^HA^HAX=(AX)^H(AX)=\vert AX \vert^2\ge 0,\\ &可知f(x)为半正定二次型,A^HA为半正定阵 \end{aligned} 对任意非零向量X,有二次型f(x)=XHAHAX=(AX)H(AX)=AX20,可知f(x)为半正定二次型,AHA为半正定阵

d. r ( A A H ) = r ( A H A ) = r ( A ) r(AA^H)=r(A^HA)=r(A) r(AAH)=r(AHA)=r(A)

由 A H A 为半正定阵,则 A H A 与 A A H 都只有非负根 可写为 λ ( A H A ) = { λ 1 , λ 2 , . . . λ p } ≥ 0 由换位公式,知 λ A H A 与 λ A A H 只相差 n − p 个零根 ∴ λ ( A A H ) = { λ 1 , λ 2 , . . . , λ p , 0 , 0 , . . . , 0 } ≥ 0 r ( A H A ) = r ( A A H ) = p = r ( A ) = r ( A H ) \begin{aligned} &由A^HA为半正定阵,则A^HA与AA^H都只有非负根\\ &可写为\lambda(A^HA)=\{\lambda_1,\lambda_2,...\lambda_p\}\ge 0\\ &由换位公式,知\lambda{A^HA}与\lambda{AA^H}只相差n-p个零根\\ &\therefore \lambda(AA^H)=\{\lambda_1,\lambda_2,...,\lambda_p,0,0,...,0\}\ge 0\\ &r(A^HA)=r(AA^H)=p=r(A)=r(A^H) \end{aligned} AHA为半正定阵,则AHAAAH都只有非负根可写为λ(AHA)={λ1,λ2,...λp}0由换位公式,知λAHAλAAH只相差np个零根λ(AAH)={λ1,λ2,...,λp,0,0,...,0}0r(AHA)=r(AAH)=p=r(A)=r(AH)

齐次方程组 A X = 0 , A H A X = 0 ,解集相同 ( 同解 ) 若 ( A H A ) X = 0 成立,则 ∣ A X ∣ 2 = ( A X ) H ( A X ) = X H A H A X = ( A X ) 2 = 0 ∴ A X = 0 , r ( A H A ) = r ( A ) \begin{aligned} &齐次方程组AX=0,A^HAX=0,解集相同(同解)\\ &若(A^HA)X=0成立,则\vert AX \vert^2=(AX)^H(AX)=X^HA^HAX=(AX)^2=0\\ &\therefore AX=0,r(A^HA)=r(A) \end{aligned} 齐次方程组AX=0,AHAX=0,解集相同(同解)(AHA)X=0成立,则AX2=(AX)H(AX)=XHAHAX=(AX)2=0AX=0,r(AHA)=r(A)

你可能感兴趣的:(数学,#,矩阵论,矩阵,线性代数)