之前介绍的矩阵的三角分解系列介绍了利用矩阵初等变换解决了矩阵三角化问题以及具体的三角分解。但是以初等变换工具的三角分解方法并不能消除病态线性方程组不稳定问题,而且有时候对于可逆矩阵有可能也不存在三角分解。所以后面为了解决这里问题,发展出来了以正交(酉)变换的矩阵的QR(正交三角)分解,矩阵的正交三角分解是一种对任何可逆矩阵均存在理想分解。进行QR分解需要用到施密特(Schmidt)正交规范化,吉文斯(Givens)变换和豪斯霍尔德(Householder)变换等。这里矩阵的QR分解系列教程主要是针对在学习QR分解时候的涉及到的一些细节,包括很多方法的来源和证明等,以及其中用到的一些矩阵操作的基础知识,主要包括:
这个系列后面文章会用到前面文章的理论和技术,所以建议按照顺序查看。
镜像变换或者说是豪斯霍尔德(Householder)变换是一种正交变换,经过多次豪斯霍尔德(Householder)变换可以把矩阵转换成上三角形式,是一种常用的 Q R \boldsymbol{Q R} QR分解方式。
在平面 R 2 \boldsymbol{R^2} R2中如果存在变换 f f f可以把 α = x e 1 + y e 2 \boldsymbol{\alpha}=x\boldsymbol{e_1} + y\boldsymbol{e_2} α=xe1+ye2转换成 α ′ = x e 1 − y e 2 \boldsymbol{\alpha}^{\prime}=x\boldsymbol{e_1} - y\boldsymbol{e_2} α′=xe1−ye2,其中 ( x , y ) (x,y) (x,y)是在标准正交基 e 1 , e 2 \boldsymbol{e_1},\boldsymbol{e_2} e1,e2下的坐标值。这里变换矩阵为
H = [ 1 0 0 − 1 ] \boldsymbol{H} = \left[\begin{matrix} 1 & 0 \\ 0 & -1 \end{matrix}\right] H=[100−1]
把 H \boldsymbol{H} H称为 R 2 \boldsymbol{R^2} R2中关于 x x x轴的反射阵。那么 R 2 \boldsymbol{R^2} R2中的向量 ξ \boldsymbol{\xi} ξ关于 x x x轴反射后变为 η \boldsymbol{\eta} η,即
η = H ξ = [ 1 0 0 − 1 ] ξ . \boldsymbol{\eta} = \boldsymbol{H\xi} = \left[\begin{matrix} 1 & 0 \\ 0 & -1 \end{matrix}\right]\boldsymbol{\xi}. η=Hξ=[100−1]ξ.
同时反射阵 H \boldsymbol{H} H可以用与 x x x轴正交的单位向量 ω = ( 0 , 1 ) T \boldsymbol{\omega}=(0,1)^{\mathrm{T}} ω=(0,1)T来表示,即
H = [ 1 0 0 − 1 ] = [ 1 0 0 1 ] − 2 [ 0 1 ] ( 0 , 1 ) = I − 2 ω ω T \boldsymbol{H} = \left[\begin{matrix} 1 & 0 \\ 0 & -1 \end{matrix}\right] = \left[\begin{matrix} 1 & 0 \\ 0 & 1 \end{matrix}\right] - 2\left[\begin{matrix} 0 \\ 1 \end{matrix}\right](0, 1) = \boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}} H=[100−1]=[1001]−2[01](0,1)=I−2ωωT
前面介绍了平面 R 2 \boldsymbol{R^2} R2中向量关于 x x x轴的反射阵可以用和 x x x轴正交的向量 ω \boldsymbol{\omega} ω来表示,其实这可以推广到一般的反射变换,在平面平面 R 2 \boldsymbol{R^2} R2中向量关于 l l l轴的反射阵 H \boldsymbol{H} H可以用 l l l轴正交的向量 ω \boldsymbol{\omega} ω来表示。下面就简单推导一下
如上图所示, ξ \boldsymbol{\xi} ξ和 η \boldsymbol{\eta} η是平面 R 2 \boldsymbol{R^2} R2上的同样长度的两个向量,其中 ω \boldsymbol{\omega} ω是 ξ − η \boldsymbol{\xi - \eta} ξ−η同方向(虚线表示的向量)的单位向量,可得
ξ − η = 2 ω ( ω T ξ ) \boldsymbol{\xi - \eta}=2\boldsymbol{\omega(\omega^{\mathrm{T}}\xi)} ξ−η=2ω(ωTξ)
其中 ω T ξ \boldsymbol{\omega^{\mathrm{T}}\xi} ωTξ表示向量 ξ \boldsymbol{\xi} ξ在 ω \boldsymbol{\omega} ω上的投影长度(即内积)。
所以
η = ξ − 2 ω ( ω T ξ ) = ( I − 2 ω ω T ) ξ . (1) \boldsymbol{\eta}=\boldsymbol{\xi} - 2\boldsymbol{\omega(\omega^{\mathrm{T}}\xi)} = (\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})\boldsymbol{\xi}. \tag{1} η=ξ−2ω(ωTξ)=(I−2ωωT)ξ.(1)
又 l l l轴(无方向)和向量 ω \boldsymbol{\omega} ω正交,其实从几何关系上知道向量 ξ \boldsymbol{\xi} ξ和 η \boldsymbol{\eta} η关于 l l l轴对称,可以简单证明一下:
上图中旋转坐标系,使 ω \boldsymbol{\omega} ω和 e 2 = ( 0 , 1 ) T \boldsymbol{e}_2=(0,1)^{\mathrm{T}} e2=(0,1)T即 y y y轴重合,即 l l l轴和 x x x轴重合。即
ω = [ ω 1 ω 2 ] ⇒ [ 0 1 ] = e 2 \boldsymbol{\omega} = \left[\begin{matrix} \omega_1 \\ \omega_2 \end{matrix}\right] \Rightarrow \left[\begin{matrix} 0 \\ 1 \end{matrix}\right] = \boldsymbol{e}_2 ω=[ω1ω2]⇒[01]=e2
令初等旋转矩阵为
Q = [ c o s θ s i n θ − s i n θ c o s θ ] \boldsymbol{Q} = \left[\begin{matrix} cos \theta & sin \theta \\ -sin \theta & cos \theta \end{matrix}\right] Q=[cosθ−sinθsinθcosθ]
且 Q \boldsymbol{Q} Q是正交矩阵满足 Q − 1 = Q T \boldsymbol{Q}^{-1} = \boldsymbol{Q}^{\mathrm{T}} Q−1=QT,令 H = I − 2 ω ω T \boldsymbol{H=I}-2\boldsymbol{\omega \omega}^{\mathrm{T}} H=I−2ωωT,所以对公式 ( 1 ) (1) (1)转换得
η = H ξ ⇒ Q η = Q H Q − 1 Q ξ \boldsymbol{\eta} =\boldsymbol{H\xi} \Rightarrow \boldsymbol{Q\eta} =\boldsymbol{QHQ^{-1}Q\xi} η=Hξ⇒Qη=QHQ−1Qξ
得
Q H Q − 1 = Q ( I − 2 ω ω T ) Q T = I − 2 Q ω ω T Q T = I − 2 ( Q ω ) ( Q ω ) T = I − 2 [ 0 1 ] ( 0 , 1 ) = [ 1 0 0 − 1 ] \begin{aligned} \boldsymbol{QHQ^{-1}} &= \boldsymbol{Q}(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})\boldsymbol{Q}^{\mathrm{T}} \\ & = \boldsymbol{I}-2\boldsymbol{Q\omega \omega}^{\mathrm{T}}\boldsymbol{Q}^{\mathrm{T}} \\ & = \boldsymbol{I}-2(\boldsymbol{Q\omega) (Q}\boldsymbol{\omega})^{\mathrm{T}} \\ & = \boldsymbol{I} - 2\left[\begin{matrix} 0 \\ 1 \end{matrix}\right](0, 1) \\ & = \left[\begin{matrix} 1 & 0 \\ 0 & -1 \end{matrix}\right] \end{aligned} QHQ−1=Q(I−2ωωT)QT=I−2QωωTQT=I−2(Qω)(Qω)T=I−2[01](0,1)=[100−1]
旋转后的反射阵变成了前面讲解的关于 x x x轴的反射阵,所以旋转后的向量 Q η \boldsymbol{Q\eta} Qη和 Q ξ \boldsymbol{Q\xi} Qξ是关于 x x x轴对称的。所以原始向量 ξ \boldsymbol{\xi} ξ和 η \boldsymbol{\eta} η关于与 ω \boldsymbol{\omega} ω垂直的 l l l轴对称的。因此公式 ( 1 ) (1) (1)确定的变换是关于 l l l轴的一种反射变换,反射阵为
H = Q − 1 [ 1 0 0 − 1 ] Q \boldsymbol{H} = \boldsymbol{Q^{-1}} \left[\begin{matrix} 1 & 0 \\ 0 & -1 \end{matrix}\right] \boldsymbol{Q} H=Q−1[100−1]Q
上面公式右边三个矩阵都是正交矩阵(正交矩阵的逆也是正交矩阵,所以 Q − 1 \boldsymbol{Q^{-1}} Q−1也是正交矩阵),所以乘积 H = I − 2 ω ω T \boldsymbol{H}=\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}} H=I−2ωωT也是正交矩阵,同时
d e t H = d e t ( I − 2 ω ω T ) = − 1 det \boldsymbol{H}= det(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})=-1 detH=det(I−2ωωT)=−1
所以最终有
定理1
在欧式空间 R n \boldsymbol{R}^n Rn中,有线性变换将向量 ξ \boldsymbol{\xi} ξ映射成与单位向量 ω \boldsymbol{\omega} ω正交的 n − 1 n-1 n−1维子空间对称的向量 η \boldsymbol{\eta} η,且有
η = ( I − 2 ω ω T ) ξ = H ξ \boldsymbol{\eta} = (\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})\boldsymbol{\xi} = \boldsymbol{H\xi} η=(I−2ωωT)ξ=Hξ
称这种线性变换为镜像变换或豪斯霍尔德(Householder)变换,其中矩阵
H = I − 2 ω ω T . (2) \boldsymbol{H=I}-2\boldsymbol{\omega \omega}^{\mathrm{T}}. \tag{2} H=I−2ωωT.(2)
称为初等反射矩阵或豪斯霍尔德(Householder)矩阵。
有 H = I − 2 ω ω T \boldsymbol{H=I}-2\boldsymbol{\omega \omega}^{\mathrm{T}} H=I−2ωωT是欧式空间 R n \boldsymbol{R}^n Rn中的初等反射矩阵,则有该矩阵有以下性质
性质1证明
有 H = I − 2 ω ω T = I T − ( 2 ω ω T ) T = ( I − 2 ω ω T ) T = H T \boldsymbol{H} = \boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}} = \boldsymbol{I}^{\mathrm{T}}-(2\boldsymbol{\omega \omega}^{\mathrm{T}})^{\mathrm{T}} =(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})^{\mathrm{T}} = \boldsymbol{H}^{\mathrm{T}} H=I−2ωωT=IT−(2ωωT)T=(I−2ωωT)T=HT,矩阵 H \boldsymbol{H} H是对称矩阵。
又有
H T H = ( I − 2 ω ω T ) T ( I − 2 ω ω T ) = ( I − 2 ω ω T ) 2 = I − 4 ω ω T + 4 ω ( ω T ω ) ω T = I − 4 ω ω T + 4 ω ω T = I \begin{aligned} \boldsymbol{H}^{\mathrm{T}}\boldsymbol{H} &= (\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})^{\mathrm{T}}(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})=(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})^2 \\ &= \boldsymbol{I}-4\boldsymbol{\omega \omega}^{\mathrm{T}}+4\boldsymbol{\omega (\omega^{\mathrm{T}}\omega)\omega^{\mathrm{T}}} \\ &=\boldsymbol{I}-4\boldsymbol{\omega \omega}^{\mathrm{T}}+4\boldsymbol{\omega \omega}^{\mathrm{T}}=\boldsymbol{I} \end{aligned} HTH=(I−2ωωT)T(I−2ωωT)=(I−2ωωT)2=I−4ωωT+4ω(ωTω)ωT=I−4ωωT+4ωωT=I
得证。
性质2证明
和上面类似,通过有限次的旋转可使 ω \boldsymbol{\omega} ω的第一个分了为正,其余分量全为零,而且 ω \boldsymbol{\omega} ω是单位向量,即转换为 e 1 = ( 1 , 0 , ⋯ , 0 ) T \boldsymbol{e}_1=(1,0,\cdots,0)^{\mathrm{T}} e1=(1,0,⋯,0)T,具体可参考[矩阵的QR分解系列二] 吉文斯(Givens)变换介绍。这里令这些有限次的旋转为 Q \boldsymbol{Q} Q,则 Q ω = e 1 \boldsymbol{Q\omega=e}_1 Qω=e1,同时 Q \boldsymbol{Q} Q是正交矩阵。
又
η = H ξ ⇒ Q η = Q H Q − 1 Q ξ \boldsymbol{\eta} =\boldsymbol{H\xi} \Rightarrow \boldsymbol{Q\eta} =\boldsymbol{QHQ^{-1}Q\xi} η=Hξ⇒Qη=QHQ−1Qξ
得
Q H Q − 1 = Q ( I − 2 ω ω T ) Q T = I − 2 Q ω ω T Q T = I − 2 ( Q ω ) ( Q ω ) T = I − 2 [ 1 0 ⋮ 0 ] ( 1 , 0 , ⋯ , 0 ) = [ − 1 1 ⋱ 1 ] \begin{aligned} \boldsymbol{QHQ^{-1}} &= \boldsymbol{Q}(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})\boldsymbol{Q}^{\mathrm{T}} \\ & = \boldsymbol{I}-2\boldsymbol{Q\omega \omega}^{\mathrm{T}}\boldsymbol{Q}^{\mathrm{T}} = \boldsymbol{I}-2(\boldsymbol{Q\omega) (Q}\boldsymbol{\omega})^{\mathrm{T}} \\ & = \boldsymbol{I}-2 \left[\begin{matrix} 1 \\ 0 \\ \vdots \\ 0 \end{matrix}\right] (1, 0, \cdots, 0) \\ & = \left[\begin{matrix} -1 \\ & 1 \\ & & \ddots \\ & & & 1 \end{matrix}\right] \end{aligned} QHQ−1=Q(I−2ωωT)QT=I−2QωωTQT=I−2(Qω)(Qω)T=I−2⎣⎢⎢⎢⎡10⋮0⎦⎥⎥⎥⎤(1,0,⋯,0)=⎣⎢⎢⎡−11⋱1⎦⎥⎥⎤
所以
Q η = [ − 1 1 ⋱ 1 ] Q ξ \boldsymbol{Q\eta} = \left[\begin{matrix} -1 \\ & 1 \\ & & \ddots \\ & & & 1 \end{matrix}\right] \boldsymbol{Q\xi} Qη=⎣⎢⎢⎡−11⋱1⎦⎥⎥⎤Qξ
对于旋转后的向量 Q η \boldsymbol{Q\eta} Qη和 Q ξ \boldsymbol{Q\xi} Qξ而言,仅第一个分量在上面的变换下改变了符号,也就是说 Q η \boldsymbol{Q\eta} Qη可以看作是 Q ξ \boldsymbol{Q\xi} Qξ关于与 e 1 \boldsymbol{e}_1 e1正交的 n − 1 n-1 n−1维子空间的镜像。
又
H = Q − 1 [ − 1 1 ⋱ 1 ] Q \boldsymbol{H} = \boldsymbol{Q^{-1}} \left[\begin{matrix} -1 \\ & 1 \\ & & \ddots \\ & & & 1 \end{matrix}\right] \boldsymbol{Q} H=Q−1⎣⎢⎢⎡−11⋱1⎦⎥⎥⎤Q
右边每个矩阵都是正交矩阵,所以 H \boldsymbol{H} H也是正交矩阵,且
d e t H = d e t ( I − 2 ω ω T ) = − 1 det \boldsymbol{H}= det(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})=-1 detH=det(I−2ωωT)=−1
得证。
定理
镜像变换可以使任何非零向量 ξ \boldsymbol{\xi} ξ变成与给定单位向量 ζ \boldsymbol{\zeta} ζ同方向的向量 η \boldsymbol{\eta} η。
这也是后面为消元做准备,主要目前是怎么利用提供的 ζ \boldsymbol{\zeta} ζ求 ω \boldsymbol{\omega} ω。
证明
根据之前的图像可知
η = ∣ ξ ∣ ζ , a n d ω T ξ = ( ω , ξ ) = ω ⋅ ξ = ∣ ω ∣ ∣ ξ ∣ c o s ( ω , ξ ) = 1 2 ∣ ξ − η ∣ \begin{aligned} \boldsymbol{\eta} &= |\boldsymbol{\xi}|\boldsymbol{\zeta}, and \\ \boldsymbol{\omega^{\mathrm{T}}\xi} &= (\boldsymbol{\omega},\boldsymbol{\xi}) = \boldsymbol{\omega} \cdot \boldsymbol{\xi} \\ & = |\boldsymbol{\omega}| |\boldsymbol{\xi}|cos(\boldsymbol{\omega}, \boldsymbol{\xi}) \\ &= \frac{1}{2}|\boldsymbol{\xi}-\boldsymbol{\eta}| \end{aligned} ηωTξ=∣ξ∣ζ,and=(ω,ξ)=ω⋅ξ=∣ω∣∣ξ∣cos(ω,ξ)=21∣ξ−η∣
又由 ξ − η = 2 ω ( ω T ξ ) \boldsymbol{\xi - \eta}=2\boldsymbol{\omega(\omega^{\mathrm{T}}\xi)} ξ−η=2ω(ωTξ),从而得
ω = ξ − η 2 ( ω T ξ ) = ξ − η ∣ ξ − η ∣ = ξ − ∣ ξ ∣ ζ ∣ ξ − ∣ ξ ∣ ζ ∣ . (3) \boldsymbol{\omega} = \frac{\boldsymbol{\xi - \eta}}{2\boldsymbol{(\omega^{\mathrm{T}}\xi)}} = \frac{\boldsymbol{\xi - \eta}}{|\boldsymbol{\xi}-\boldsymbol{\eta}|} = \frac{\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}}{|\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}|}. \tag{3} ω=2(ωTξ)ξ−η=∣ξ−η∣ξ−η=∣ξ−∣ξ∣ζ∣ξ−∣ξ∣ζ.(3)
记住这个公式,后面求 Q R \boldsymbol{QR} QR分解会用到。
然后又有 H = I − 2 ω ω T \boldsymbol{H=I}-2\boldsymbol{\omega \omega}^{\mathrm{T}} H=I−2ωωT得
η = H ξ = ( I − 2 ( ξ − ∣ ξ ∣ ζ ) ( ξ − ∣ ξ ∣ ζ ) T ∣ ξ − ∣ ξ ∣ ζ ∣ 2 ) ξ = ξ − 2 ( ξ − ∣ ξ ∣ ζ , ξ ) ξ − ∣ ξ ∣ ζ ∣ ξ − ∣ ξ ∣ ζ ∣ 2 = ξ − ( ξ − ∣ ξ ∣ ζ ) = ∣ ξ ∣ ζ \begin{aligned} \boldsymbol{\eta} &= \boldsymbol{H\xi} \\ &=(\boldsymbol{I} - 2\frac{(\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}})(\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}})^{\mathrm{T}}}{|\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}|^2}) \boldsymbol{\xi} \\ &= \boldsymbol{\xi} - 2(\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}},\boldsymbol{\xi})\frac{\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}}{|\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}|^2} \\ &= \boldsymbol{\xi} - (\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}) = |\boldsymbol{\xi}|\boldsymbol{\zeta} \end{aligned} η=Hξ=(I−2∣ξ−∣ξ∣ζ∣2(ξ−∣ξ∣ζ)(ξ−∣ξ∣ζ)T)ξ=ξ−2(ξ−∣ξ∣ζ,ξ)∣ξ−∣ξ∣ζ∣2ξ−∣ξ∣ζ=ξ−(ξ−∣ξ∣ζ)=∣ξ∣ζ
其中利用下面的等式
2 ( ξ − ∣ ξ ∣ ζ , ξ ) = 2 ( ξ − η , ξ ) = 2 ∣ ξ ∣ c o s ( ξ − η , ξ ) ∣ ξ − η ∣ = 2 ∣ ξ ∣ c o s ( ω , ξ ) ∣ ξ − η ∣ = ∣ ξ − η ∣ 2 = ∣ ξ − ∣ ξ ∣ ζ ∣ 2 \begin{aligned} 2(\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}},\boldsymbol{\xi}) &= 2(\boldsymbol{\xi - \eta},\boldsymbol{\xi}) \\ &= 2|\boldsymbol{\xi}|cos(\boldsymbol{\xi - \eta}, \boldsymbol{\xi})|\boldsymbol{\xi - \eta}| = 2|\boldsymbol{\xi}|cos(\boldsymbol{\omega}, \boldsymbol{\xi})|\boldsymbol{\xi - \eta}| \\ &= |\boldsymbol{\xi - \eta}|^2 = |\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}|^2 \end{aligned} 2(ξ−∣ξ∣ζ,ξ)=2(ξ−η,ξ)=2∣ξ∣cos(ξ−η,ξ)∣ξ−η∣=2∣ξ∣cos(ω,ξ)∣ξ−η∣=∣ξ−η∣2=∣ξ−∣ξ∣ζ∣2
得证。
定理
初等旋转矩阵(变换)是两个初等反射矩阵(变换)的乘积。
证明
对于初等旋转矩阵
R i j = [ 1 ⋱ 1 c 0 ⋯ 0 s 0 1 ⋯ 0 0 ⋮ ⋮ ⋮ ⋮ 0 0 ⋯ 1 0 − s 0 ⋯ 0 c 1 ⋱ 1 ] \boldsymbol{R}_{i j} = \left[\begin{matrix} 1 \\ & \ddots \\ & & 1 \\ & & & c & 0 & \cdots & 0 & s \\ & & & 0 & 1 & \cdots & 0 & 0 \\ & & & \vdots & \vdots & & \vdots & \vdots \\ & & & 0 & 0 & \cdots & 1 & 0 \\ & & & -s & 0 & \cdots & 0 & c \\ & & & & & & & & 1 \\ & & & & & & & & & \ddots \\ & & & & & & & & & & 1 \end{matrix}\right] Rij=⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎡1⋱1c0⋮0−s01⋮00⋯⋯⋯⋯00⋮10s0⋮0c1⋱1⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎤
(1) 取单位向量
ω = ( 0 , ⋯ , 0 , s i n θ 4 , 0 , ⋯ , 0 , c o s θ 4 , 0 , ⋯ , 0 ) T \boldsymbol{\omega} = (0,\cdots,0,sin \frac{\theta}{4},0,\cdots,0,cos \frac{\theta}{4},0,\cdots,0)^{\mathrm{T}} ω=(0,⋯,0,sin4θ,0,⋯,0,cos4θ,0,⋯,0)T
其中 ω i = s i n θ 4 , ω j = c o s θ 4 \boldsymbol{\omega}_i = sin \frac{\theta}{4},\boldsymbol{\omega}_j = cos \frac{\theta}{4} ωi=sin4θ,ωj=cos4θ。
根据公式 ( 2 ) (2) (2)构造初等反射阵
H 1 = I − 2 ω ω T = [ 1 ⋱ 1 c o s θ 2 0 ⋯ 0 − s i n θ 2 0 1 ⋯ 0 0 ⋮ ⋮ ⋮ ⋮ 0 0 ⋯ 1 0 − s i n θ 2 0 ⋯ 0 − c o s θ 2 1 ⋱ 1 ] \begin{aligned} \boldsymbol{H}_1& = \boldsymbol{I} - 2\boldsymbol{\omega \omega}^{\mathrm{T}} \\ &=\left[\begin{matrix} 1 \\ & \ddots \\ & & 1 \\ & & & cos \frac{\theta}{2} & 0 & \cdots & 0 & -sin \frac{\theta}{2} \\ & & & 0 & 1 & \cdots & 0 & 0 \\ & & & \vdots & \vdots & & \vdots & \vdots \\ & & & 0 & 0 & \cdots & 1 & 0 \\ & & & -sin \frac{\theta}{2} & 0 & \cdots & 0 & -cos \frac{\theta}{2} \\ & & & & & & & & 1 \\ & & & & & & & & & \ddots \\ & & & & & & & & & & 1 \end{matrix}\right] \end{aligned} H1=I−2ωωT=⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎡1⋱1cos2θ0⋮0−sin2θ01⋮00⋯⋯⋯⋯00⋮10−sin2θ0⋮0−cos2θ1⋱1⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎤
(2) 再取单位向量
ω ′ = ( 0 , ⋯ , 0 , s i n 3 θ 4 , 0 , ⋯ , 0 , c o s 3 θ 4 , 0 , ⋯ , 0 ) T \boldsymbol{\omega}^{\prime} = (0,\cdots,0,sin \frac{3\theta}{4},0,\cdots,0,cos \frac{3\theta}{4},0,\cdots,0)^{\mathrm{T}} ω′=(0,⋯,0,sin43θ,0,⋯,0,cos43θ,0,⋯,0)T
其中 ω i ′ = s i n θ 4 , ω j ′ = c o s θ 4 \boldsymbol{\omega}_i^{\prime} = sin \frac{\theta}{4},\boldsymbol{\omega}_j^{\prime} = cos \frac{\theta}{4} ωi′=sin4θ,ωj′=cos4θ。
根据公式 ( 2 ) (2) (2)构造初等反射阵
H 2 = I − 2 ω ′ ω ′ T = [ 1 ⋱ 1 c o s 3 θ 2 0 ⋯ 0 − s i n 3 θ 2 0 1 ⋯ 0 0 ⋮ ⋮ ⋮ ⋮ 0 0 ⋯ 1 0 − s i n 3 θ 2 0 ⋯ 0 − c o s 3 θ 2 1 ⋱ 1 ] \begin{aligned} \boldsymbol{H}_2& = \boldsymbol{I} - 2\boldsymbol{\omega^{\prime} \omega^{\prime}}^{\mathrm{T}} \\ &=\left[\begin{matrix} 1 \\ & \ddots \\ & & 1 \\ & & & cos \frac{3\theta}{2} & 0 & \cdots & 0 & -sin \frac{3\theta}{2} \\ & & & 0 & 1 & \cdots & 0 & 0 \\ & & & \vdots & \vdots & & \vdots & \vdots \\ & & & 0 & 0 & \cdots & 1 & 0 \\ & & & -sin \frac{3\theta}{2} & 0 & \cdots & 0 & -cos \frac{3\theta}{2} \\ & & & & & & & & 1 \\ & & & & & & & & & \ddots \\ & & & & & & & & & & 1 \end{matrix}\right] \end{aligned} H2=I−2ω′ω′T=⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎡1⋱1cos23θ0⋮0−sin23θ01⋮00⋯⋯⋯⋯00⋮10−sin23θ0⋮0−cos23θ1⋱1⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎤
可以验证有 R i j = H 2 H 1 \boldsymbol{R}_{i j}=\boldsymbol{H}_2\boldsymbol{H}_1 Rij=H2H1。
所以说初等反射矩阵比初等旋转矩阵更加基本。
用镜像变化把向量 ξ = ( 0 , 3 , 0 , 4 ) T \boldsymbol{\xi}=(0,3,0,4)^{\mathrm{T}} ξ=(0,3,0,4)T变为与向量 e 1 = ( 1 , 0 , 0 , 0 ) T \boldsymbol{e}_1=(1,0,0,0)^{\mathrm{T}} e1=(1,0,0,0)T同方向的向量。
解:
用上面的公式 ( 3 ) (3) (3)可得
ω = ξ − ∣ ξ ∣ ζ ∣ ξ − ∣ ξ ∣ ζ ∣ = ξ − ∣ ξ ∣ e 1 ∣ ξ − ∣ ξ ∣ e 1 ∣ = ( − 5 , 3 , 0 , 4 ) T ∣ ( − 5 , 3 , 0 , 4 ) T ∣ = ( − 1 2 , 3 5 2 , 0 , 4 5 2 ) T \begin{aligned} \boldsymbol{\omega} &= \frac{\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}}{|\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}|} = \frac{\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{e}_1}}{|\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{e}_1}|} \\ &=\frac{(-5,3,0,4)^{\mathrm{T}}}{|(-5,3,0,4)^{\mathrm{T}}|} \\ &=(-\frac{1}{\sqrt{2}},\frac{3}{5\sqrt{2}},0,\frac{4}{5\sqrt{2}})^{\mathrm{T}} \end{aligned} ω=∣ξ−∣ξ∣ζ∣ξ−∣ξ∣ζ=∣ξ−∣ξ∣e1∣ξ−∣ξ∣e1=∣(−5,3,0,4)T∣(−5,3,0,4)T=(−21,523,0,524)T
则镜像变换的豪斯霍尔德(Householder)矩阵为
H = I − 2 ω ω T = [ 0 3 5 0 4 5 3 5 16 25 0 − 12 25 0 0 1 0 4 5 − 12 25 0 9 25 ] \boldsymbol{H=I}-2\boldsymbol{\omega \omega}^{\mathrm{T}} = \left[\begin{matrix} 0 & \frac{3}{5} & 0 & \frac{4}{5} \\ \frac{3}{5} & \frac{16}{25} & 0 & -\frac{12}{25} \\ 0 & 0 & 1 & 0 \\ \frac{4}{5} & -\frac{12}{25} & 0 & \frac{9}{25} \end{matrix}\right] H=I−2ωωT=⎣⎢⎢⎡0530545325160−2512001054−25120259⎦⎥⎥⎤
所以
η = H ξ = ( 5 , 0 , 0 , 0 ) T = 5 e 1 . \boldsymbol{\eta} = \boldsymbol{H\xi} = (5,0,0,0)^{\mathrm{T}} = 5\boldsymbol{e}_1. η=Hξ=(5,0,0,0)T=5e1.
【1】 矩阵论(第二版)