6.1 范数最小解,右逆,零空间映射矩阵

6.1 范数最小解,右逆,零空间映射矩阵

矩阵 A m n , r a n k A = m < n A_{mn},rank A=m < n Amn,rankA=m<n 是行满秩矩阵时,高斯消元法可以求得方程 A x = b A\mathbf{x}=\mathbf{b} Ax=b 的解,其解的结构是特解加零解。零解是方程 A x = 0 A\mathbf{x}=\mathbf{0} Ax=0 的解,特解是满足 A x = b A\mathbf{x}=\mathbf{b} Ax=b 的任一向量。很可惜的是,采用高斯消元法,当选择不同的矩阵 A A A 列空间的基时,可以求得不同的特解,理论上存在无穷多特解满足方程 A x = b A\mathbf{x}=\mathbf{b} Ax=b ,一般情况下,我们希望获得最特殊的特解--范数最小解,即所有特解中,内积最小特解 min ⁡ ∥ x p ∥ \min\| \mathbf{x}_p \| minxp

任一特解 x p \mathbf{x}_p xp 可以进行正交分解,投影到两个方向,一个是零解空间 x p 0 \mathbf{x}^0_p xp0,另一个是零解空间的正交补空间 x p ⊥ \mathbf{x}^{\bot}_p xp ,则有
∥ x p ∥ 2 = ∥ x p 0 ∥ 2 + ∥ x p ⊥ ∥ 2 ≥ ∥ x p ⊥ ∥ 2 \| \mathbf{x}_p \|^2 = \| \mathbf{x}^0_p \|^2 + \| \mathbf{x}^{\bot}_p \|^2 \ge \| \mathbf{x}^{\bot}_p \|^2 xp2=xp02+xp2xp2

成立,这表明当特解在零空间分量为 0 \mathbf{0} 0 时,其范数最小!即范数最小特解垂直于零解空间!零解空间为:方程 A x = 0 A\mathbf{x}=\mathbf{0} Ax=0 的解构成的空间,解 x \mathbf{x} x 垂直于矩阵 A A A 的行空间,也就是说矩阵 A A A 的行空间垂直于零解空间,所以范数最小特解位于矩阵 A A A 的行空间,故设范数最小特解为 x p m i n = A T u \mathbf{x}^{min}_p = A^T\mathbf{u} xpmin=ATu ,代入方程得 A A T u = b AA^T\mathbf{u} = \mathbf{b} AATu=b ,矩阵 A A T AA^T AAT 的秩等于矩阵 A A A 的秩,因为 r a n k A A T = r a n k A = m rank AA^T = rank A = m rankAAT=rankA=m A A T AA^T AAT m m m 阶方阵,故 A A T AA^T AAT 可逆,得到唯一范数最小特解

u = ( A A T ) − 1 b x p m i n = A T u = A T ( A A T ) − 1 b \mathbf{u} = (AA^T)^{-1}\mathbf{b} \\ \mathbf{x}^{min}_p = A^T\mathbf{u} = A^T(AA^T)^{-1}\mathbf{b} u=(AAT)1bxpmin=ATu=AT(AAT)1b

A R − 1 = A T ( A A T ) − 1 A^{-1}_R = A^T(AA^T)^{-1} AR1=AT(AAT)1 ,可以发现 A A R − 1 = E m AA^{-1}_R=E_m AAR1=Em ,称 A R − 1 A^{-1}_R AR1 A A A 的右逆,其尺寸为 n × m n \times m n×m 。所以 x p m i n = A R − 1 b \mathbf{x}^{min}_p = A^{-1}_R\mathbf{b} xpmin=AR1b

定义 右逆 对于行满秩矩阵 A m n A_{mn} Amn ,如果存在矩阵 B n m B_{nm} Bnm ,使 A B = E m AB=E_m AB=Em 成立,则称 B B B A A A 的右逆, A R − 1 = A T ( A A T ) − 1 A^{-1}_R=A^T(AA^T)^{-1} AR1=AT(AAT)1 是其中一个右逆。

特别强调下,右逆不唯一,证明如下:假设 B n m B_{nm} Bnm 是任意矩阵,如果 A ( A R − 1 + B ) = E A(A^{-1}_R+B)=E A(AR1+B)=E 成立,则 ( A R − 1 + B ) (A^{-1}_R+B) (AR1+B) 是右逆,因为 A A R − 1 = E AA^{-1}_R=E AAR1=E ,则只需 A B = O AB=\mathbf{O} AB=O ,根据第三章内容,矩阵 A A A 列向量组是相关组,故矩阵 B B B 列向量组只要位于矩阵 A A A 零空间,则 A B = O AB=\mathbf{O} AB=O ,故有无穷多右逆。如果不特别强调,我们称右逆,都是特指矩阵 A R − 1 = A T ( A A T ) − 1 A^{-1}_R=A^T(AA^T)^{-1} AR1=AT(AAT)1

注意:虽然右逆不唯一,但是最小范数解是唯一的。

矩阵 Z = E − A R − 1 A Z = E-A^{-1}_RA Z=EAR1A 称为零空间映射矩阵,因为 A Z = A ( E − A R − 1 A ) = A − A A R − 1 A = A − E A = O AZ=A(E-A^{-1}_RA)=A-AA^{-1}_RA=A-EA=\mathbf{O} AZ=A(EAR1A)=AAAR1A=AEA=O ,所以矩阵 Z Z Z 的列向量都位于矩阵 A A A 的零空间,则矩阵 Z Z Z 的列向量的任意线性组合 Z a Z\mathbf{a} Za 也位于矩阵 A A A 的零空间。计算也表明,对于任意向量 a \mathbf{a} a ,有 A Z a = O a = 0 AZ\mathbf{a} = \mathbf{O}\mathbf{a}=\mathbf{0} AZa=Oa=0 成立,故向量 Z a = ( E − A R − 1 A ) a Z\mathbf{a}=(E-A^{-1}_RA)\mathbf{a} Za=(EAR1A)a 是零解。

x ′ \mathbf{x}' x 是任意一个解时,若令 a = x ′ − A R − 1 b \mathbf{a}=\mathbf{x}'-A^{-1}_R\mathbf{b} a=xAR1b ,则有
( E − A R − 1 A ) a = ( E − A R − 1 A ) ( x ′ − A R − 1 b ) = x ′ − A R − 1 b − A R − 1 A x ′ + A R − 1 A A R − 1 b = x ′ − A R − 1 b − A R − 1 b + A R − 1 b = x ′ − A R − 1 b (E-A^{-1}_RA)\mathbf{a}=(E-A^{-1}_RA)(\mathbf{x}'-A^{-1}_R\mathbf{b})\\ =\mathbf{x}'-A^{-1}_R\mathbf{b}-A^{-1}_RA\mathbf{x}'+A^{-1}_RAA^{-1}_R\mathbf{b}\\ =\mathbf{x}'-A^{-1}_R\mathbf{b}-A^{-1}_R\mathbf{b}+A^{-1}_R\mathbf{b}\\ =\mathbf{x}'-A^{-1}_R\mathbf{b} (EAR1A)a=(EAR1A)(xAR1b)=xAR1bAR1Ax+AR1AAR1b=xAR1bAR1b+AR1b=xAR1b
从而得
x ′ = A R − 1 b + ( E − A R − 1 A ) a \mathbf{x}' = A^{-1}_R\mathbf{b} + (E-A^{-1}_RA)\mathbf{a} x=AR1b+(EAR1A)a

所以对行满秩矩阵 A m n , r a n k A = m < n A_{mn},rank A=m < n Amn,rankA=m<n ,方程 A x = b A\mathbf{x}=\mathbf{b} Ax=b 的通解,可表示为

x = A R − 1 b + ( E − A R − 1 A ) a A R − 1 = A T ( A A T ) − 1 为 右 逆 , a 为 任 意 n 维 向 量 A R − 1 b 是 范 数 最 小 特 解 , ( E − A R − 1 A ) a 是 零 解 \mathbf{x} = A^{-1}_R\mathbf{b} + (E-A^{-1}_RA)\mathbf{a} \\ A^{-1}_R=A^T(AA^T)^{-1} 为右逆,\mathbf{a} 为任意 n 维向量 \\ A^{-1}_R\mathbf{b} 是范数最小特解,(E-A^{-1}_RA)\mathbf{a}是零解 x=AR1b+(EAR1A)aAR1=AT(AAT)1anAR1b(EAR1A)a

由于零解空间的维度是 n − m n-m nm ,所以 ( E − A R − 1 A ) (E-A^{-1}_RA) (EAR1A) 的列空间维度是 n − m n-m nm ,即 r a n k ( E − A R − 1 A ) = n − m rank (E-A^{-1}_RA) = n - m rank(EAR1A)=nm

你可能感兴趣的:(#,线性代数,线性代数,矩阵)