矩阵的四个基本空间, 不了解下吗?

矩阵的四个基本空间

    • 四个基本空间
    • 正交关系
    • 简要证明
    • 经典例题
    • 总结

秩-零化度定理 告诉我们: m × n m\times n m×n 阶矩阵 A A A 的零空间(Nullspace) N ( A ) N(A) N(A) 和列空间(Column sapce) C ( A ) C(A) C(A) 的关系:

n = dim ⁡ N ( A ) + dim ⁡ C ( A ) n = \dim N(A) + \dim C(A) n=dimN(A)+dimC(A)

本次依据秩-零化度定理, 介绍四个基本空间, 并证明它们的正交性关系, 最后, 给出一道经典例题.

四个基本空间

将矩阵 A A A 行列互换, 称为 A A A 的转置, 记为 A T A^{\mathsf T} AT. 则对应的: C ( A T ) C(A^{\mathsf T}) C(AT) 表示 A A A 的行空间(Row space), 对应地将 N ( A T ) N(A^{\mathsf T}) N(AT) 称为 A A A 的左零空间(Left nullspace).

首先, 因为行秩 = 列秩, 所以

n = dim ⁡ N ( A ) + dim ⁡ C ( A T ) n = \dim N(A) + \dim C(A^{\mathsf T}) n=dimN(A)+dimC(AT)

然后, 转置并参考秩-零化度定理

m = dim ⁡ N ( A T ) + dim ⁡ C ( A ) m = \dim N(A^{\mathsf T}) + \dim C(A) m=dimN(AT)+dimC(A)


综上, 对于 m × n m \times n m×n 阶矩阵 A A A 有:

空间 符号 矩阵含义 空间维数 向量维数
行空间(Row Space) C ( A T ) C(A^{\mathsf T}) C(AT) A T y A^{\mathsf T}y ATy r r r n n n
列空间(Column Space) C ( A ) C(A) C(A) A x Ax Ax r r r m m m
零空间(Nullspace) 或核空间(Kernel Space) N ( A ) N(A) N(A) A x = 0 Ax=0 Ax=0 n − r n-r nr n n n
左零空间(Left Nullspace) N ( A T ) N(A^{\mathsf T}) N(AT) A T y = 0 A^{\mathsf T}y=0 ATy=0 m − r m-r mr m m m

正交关系

实际上, 行空间和零空间在 R n \mathbb{R}^n Rn 中是直和关系, 相应的, 列空间和左零空间在 R m \mathbb{R}^m Rm 中是直和关系, 如下图所示

矩阵的四个基本空间, 不了解下吗?_第1张图片

下面, 证明这两个直和(正交)关系

简要证明

  1. R n = C ( A T ) ⊕ N ( A ) \mathbb{R}^n = C(A^{\mathsf T}) \oplus N(A) Rn=C(AT)N(A)
  • ∀   x 1 ∈ C ( A T ) , ∀   x 2 ∈ N ( A ) \forall\, x_1 \in C(A^{\mathsf T}), \forall \, x_2 \in N(A) x1C(AT),x2N(A), 成立 x = x 1 + x 2 ∈ R n x=x_1+x_2 \in \mathbb{R}^n x=x1+x2Rn
  • 假设 x ∈ C ( A T ) ∩ N ( A ) x \in C(A^{\mathsf T}) \cap N(A) xC(AT)N(A), 即

{ A x = 0 ∀   x ∈ N ( A ) A T y = x ∃   y ∈ C ( A T ) \begin{cases} Ax = 0 & \forall \, x \in N(A) \\[3pt] A^{\mathsf T}y = x & \exists\, y \in C(A^{\mathsf T}) \end{cases} {Ax=0ATy=xxN(A)yC(AT)

联立即得

A A T y = 0 AA^{\mathsf T}y = 0 AATy=0

左右同乘 y T y^{\mathsf T} yT

y T A A T y = ( A T y ) T A T y = 0 y^{\mathsf T}AA^{\mathsf T}y = (A^{\mathsf T}y)^{\mathsf T}A^{\mathsf T}y=0 yTAATy=(ATy)TATy=0

得到

x = A T y = 0 x = A^{\mathsf T}y = 0 x=ATy=0

C ( A T ) ∩ N ( A ) = { 0 } C(A^{\mathsf T}) \cap N(A) = \{0\} C(AT)N(A)={0}

结论得证.


  1. R m = C ( A ) ⊕ N ( A T ) \mathbb{R}^m = C(A) \oplus N(A^{\mathsf T}) Rm=C(A)N(AT)

B = A T B=A^{\mathsf T} B=AT, 利用证明 1

R m = C ( B T ) ⊕ N ( B ) \mathbb{R}^m = C(B^{\mathsf T}) \oplus N(B) Rm=C(BT)N(B)

B T = ( A T ) T = A B^{\mathsf T} = (A^{\mathsf T})^{\mathsf T} = A BT=(AT)T=A 带入上式, 即证.

经典例题

假设存在 m × n m\times n m×n 阶矩阵 A A A, 给定一个向量 b ∈   R m b\in\,\mathbb{R}^m bRm, 且已知 A x = b Ax = b Ax=b 有解. 试证

  1. 存在唯一 y ∈   C ( A T ) y \in\, C(A^{\mathsf T}) yC(A), 使得 A y = b Ay = b Ay=b 成立.
  2. 所有解中, 行空间 C ( A T ) C(A^{\mathsf T}) C(AT) 中的解 y y y 的长度最小.
  3. 假设 A A A 行满秩( r a n k ( A ) = m {\rm rank}(A) = m rank(A)=m), 求 y ∈   C ( A T ) y \in \, C(A^{\mathsf T}) yC(AT) (用 A , b A, b A,b 表示)

证:

    • 存在性
      假设 x ∈ R n x \in \mathbb{R}^n xRn 满足 A x = b Ax=b Ax=b, 因为 C ( A T ) C(A^{\mathsf T}) C(AT) N ( A ) N(A) N(A) 是直和关系, 所以 x x x唯一地分解为
      x = y + z x = y + z x=y+z
      其中, y ∈   C ( A T ) , z ∈ N ( A ) y\in\, C(A^{\mathsf T}), z \in N(A) yC(AT),zN(A), 那么
      A x = A ( y + z ) = A y + A z = A y = b \begin{aligned} Ax &= A(y+z) \\&= Ay + Az \\&= Ay = b \end{aligned} Ax=A(y+z)=Ay+Az=Ay=b
      成立.
    • 唯一性
      假设 y ′ ∈   C ( A T ) y^{\prime} \in\, C(A^{\mathsf T}) yC(AT), 也满足 A y ′ = b Ay^{\prime} = b Ay=b. 则 A y − A y ′ = A ( y − y ′ ) = 0 Ay - Ay^{\prime} = A(y-y^{\prime}) =0 AyAy=A(yy)=0
      y − y ′ ∈   N ( A ) y-y^{\prime} \in\, N(A) yyN(A), 又因为 y − y ′ ∈   C ( A T ) y-y^{\prime} \in \, C(A^{\mathsf T}) yyC(AT), 所以 y − y ′ = 0 y-y^{\prime} = 0 yy=0
      y = y ′ y = y^{\prime} y=y.
  1. 联系问 1, 解 x = y + z x = y + z x=y+z, 其中 y ∈   C ( A T ) , z ∈ N ( A ) y\in\, C(A^{\mathsf T}), z \in N(A) yC(AT),zN(A). 因为二者正交, 所以

∥ x ∥ 2 = ( y + z ) T ( y + z ) = ∥ y ∥ 2 + ∥ z ∥ 2 ≥ ∥ y ∥ 2 \begin{aligned} \lVert x \rVert^2 &= (y+z)^{\mathsf T}(y+z) \\ &= \lVert y \rVert^2 + \lVert z \rVert^2 \geq \lVert y \rVert^2 \end{aligned} x2=(y+z)T(y+z)=y2+z2y2

z = 0 z = 0 z=0 时, 等号成立.


  1. 因为 y ∈   C ( A T ) y \in \, C(A^{\mathsf T}) yC(AT), 则 y y y 可表示为 y = A T x y=A^{\mathsf T}x y=ATx.则 A y = A A T x = b Ay = AA^{\mathsf T} x = b Ay=AATx=b
    A A T AA^{\mathsf T} AAT 满秩, 则 x = ( A A T ) − 1 b x = (AA^{\mathsf T})^{-1}b x=(AAT)1b
    可得到 y = A T ( A A T ) − 1 b y=A^{\mathsf T}(AA^{\mathsf T})^{-1}b y=AT(AAT)1b
    下面证明 r a n k A = r a n k A A T {\rm rank} A ={\rm rank } AA^{\mathsf T} rankA=rankAAT, 只需证明
    { A x = 0 A T A x = 0 \begin{cases}Ax =0 \\[3pt] A^{\mathsf T}Ax=0 \end{cases} {Ax=0ATAx=0
    同解. 显然, A x = 0 ⟹ A T A x = 0 Ax = 0 \Longrightarrow A^{\mathsf T}Ax=0 Ax=0ATAx=0.


    若满足 A T A x = 0 A^{\mathsf T}Ax=0 ATAx=0, 左右同乘 x T x^{\mathsf T} xT

    x T A T A x = ( A x ) T A x = 0 x^{\mathsf T}A^{\mathsf T}Ax=(Ax)^{\mathsf T}Ax=0 xTATAx=(Ax)TAx=0

    即得 A x = 0 Ax = 0 Ax=0. 所以 r a n k A = r a n k A T A = r a n k A A T {\rm rank} A = {\rm rank } A^{\mathsf T}A={\rm rank } AA^{\mathsf T} rankA=rankATA=rankAAT.

总结

从空间的角度理解线代才是掌握线代的不二法门.

矩阵的四个基本空间是很重要的概念, 可以帮助我们从空间的角度理解线性方程组解的结构, 甚至是最小二乘法.

由于篇幅原因, 下次介绍最小二乘法( A T A x = A T b A^{\mathsf T}Ax = A^{\mathsf T}b ATAx=ATb).

原文链接: 矩阵的四个基本空间, 不了解下吗?

你可能感兴趣的:(线代拾遗)