矩阵论(零):线性代数基础知识整理(1)——逆矩阵、(广义)初等变换、满秩分解

矩阵论专栏:专栏(文章按照顺序排序)

线性代数是矩阵论的先修课程,本篇博客整理线性代数的基础理论知识,为矩阵论的学习做准备。限于篇幅,梳理的重点将在定理和结论上(只给出部分必要的定义),对最基础的概念(如矩阵及其基本运算等等)不清楚的童鞋可以参考矩阵的基本运算。
本文的讨论在一般的数域 F F F中进行, F F F可以是有理数域、实数域、复数域等。这里不给出数域的严格定义,只要知道数域是复数域的一个对加减乘除运算封闭的子集,且有理数域是最小的数域即可。需要特别指出的是,我们所关心的数域都是复数域的子集,并不是什么抽象的代数数域。由于数域都是复数域的子集,在复数中定义的基本运算以及相应的运算律往往也适用于实数、有理数,例如取共轭,实数和有理数的共轭是其自身。数域的相关理论可参考数域和维基。


本篇博客先介绍线性代数中一些基本的概念,然后重点围绕“秩”这一重要概念整理相关结论:

  • 复数的运算法则、复矩阵的共轭与共轭转置
  • 行列式的性质
  • 方阵的迹及其性质
  • 逆矩阵
    • 伴随矩阵
    • 逆矩阵
    • 关于逆矩阵的一个常用公式(Woodbury-Sherman-Morrison公式)
  • 初等变换与矩阵的秩
    • 初等变换、初等矩阵
    • 矩阵的秩及性质
    • 分块矩阵的初等变换(广义初等变换)
      • 矩阵打洞技巧
      • 方阵乘积的行列式公式
      • 分块矩阵的逆
      • 分块矩阵的秩
  • 满秩分解
    • 满秩分解的定义
    • 满秩分解的存在性
    • 满秩分解的快速计算方法

复数的运算法则、复矩阵的共轭与共轭转置

  • 复数的基本运算法则
    复数的基本运算法则与实数的完全一致,且根据复数的定义 z = a + b i z=a+bi z=a+bi容易验证,现列举如下:(设 a , b , c ∈ C a, b, c\in C a,b,cC
    • 加法交换律: a + b = b + a a+b=b+a a+b=b+a
    • 加法结合律: a + ( b + c ) = ( a + b ) + c a+(b+c)=(a+b)+c a+(b+c)=(a+b)+c
    • 乘法交换律: a × b = b × a a\times b=b\times a a×b=b×a
    • 乘法结合律: a × ( b × c ) = ( a × b ) × c a\times (b\times c)=(a\times b)\times c a×(b×c)=(a×b)×c
    • 乘法对加法的左分配律: ( a + b ) × c = a × c + b × c (a+b)\times c=a\times c+b\times c (a+b)×c=a×c+b×c
    • 乘法对加法的右分配律: a × ( b + c ) = a × b + a × c a\times (b+c)=a\times b+a\times c a×(b+c)=a×b+a×c
  • 复数的共轭、复数的模的运算律(设 x , y ∈ C x,y\in C x,yC
    • x ± y ‾ = x ‾ ± y ‾ \overline{x\pm{}y}=\overline{x}\pm{}\overline{y} x±y=x±y
    • x y ‾ = x ˉ y ˉ \overline{xy}=\bar{x}\bar{y} xy=xˉyˉ
    • ( x y ) ‾ = x ‾ y ‾ \overline{(\frac{x}{y})}=\frac{\overline{x}}{\overline{y}} (yx)=yx
    • x x ‾ = x ‾ x = ∣ x ∣ 2 x\overline{x}=\overline{x}x=|x|^2 xx=xx=x2
    • ∣ x y ∣ = ∣ x ∣ ∣ y ∣ |xy|=|x||y| xy=xy
  • 矩阵的共轭
    矩阵的共轭就是将原矩阵的每个元素取共轭,即若 A = ( a i j ) m × n A=(a_{ij})_{m\times{n}} A=(aij)m×n,则 A ‾ = ( a i j ‾ ) m × n \overline{A}=(\overline{a_{ij}})_{m\times{n}} A=(aij)m×n。实矩阵的共轭是其本身。根据复数共轭的运算率,可得矩阵的共轭具有如下性质:
    • A ‾ ‾ = A \overline{\overline{A}}=A A=A
    • A + B ‾ = A ‾ + B ‾ \overline{A+B}=\overline{A}+\overline{B} A+B=A+B
    • k A ‾ = k ˉ A ‾ , k ∈ C \overline{kA}=\bar{k}\overline{A},k\in{C} kA=kˉA,kC
    • A B ‾ = A ˉ B ˉ \overline{AB}=\bar{A}\bar{B} AB=AˉBˉ
  • 矩阵的共轭转置
    矩阵的共轭转置即先取共轭再转置或先转置再取共轭,即 A H = ( A T ) ‾ = ( A ‾ ) T A^H=\overline{(A^T)}=\Bigl(\overline{A}\Bigr)^T AH=(AT)=(A)T。实矩阵的转置是复矩阵的共轭转置的特例。矩阵的共轭转置具有如下性质:
    • ( A H ) H = A (A^{H})^H=A (AH)H=A
    • ( A H ) T = ( A T ) H (A^H)^T=(A^T)^H (AH)T=(AT)H
    • A H ‾ = ( A ‾ ) H \overline{A^H}=(\overline A)^H AH=(A)H
    • ( A + B ) H = A H + B H (A+B)^H=A^H+B^H (A+B)H=AH+BH
    • ( k A ) H = k ‾ A H , k ∈ C (kA)^H=\overline{k}A^H,k\in{C} (kA)H=kAH,kC
    • ( A B ) H = B H A H (AB)^H=B^HA^H (AB)H=BHAH
  • Hermite矩阵(共轭对称矩阵)
    若方阵A满足 A H = A A^H=A AH=A,则称A是Hermite矩阵。实对称矩阵是一种Hermite矩阵。

行列式的性质

设F为一数域,给定正整数 n n n,在 F F F上可以构造出唯一的映射 F n × n → F F^{n\times n}\rightarrow F Fn×nF满足行列式第一公理和行列式第二公理。行列式的具体表达式可以使用置换或逆序数写出,本文略去,具体可参考博客以及知乎。
A , B ∈ F n × n A,B\in F^{n\times n} A,BFn×n k ∈ F k\in F kF为常数,根据置换或逆序数的性质可得行列式的如下性质:

  • d e t ( A T ) = d e t ( A ) det(A^T)=det(A) det(AT)=det(A)
  • d e t ( A H ) = d e t ( A ) ‾ det(A^H)=\overline{det(A)} det(AH)=det(A)
  • d e t ( k A ) = k n d e t ( A ) det(kA)=k^ndet(A) det(kA)=kndet(A)
  • 行列式的某一行(列)乘非零常数 k ∈ F k\in F kF,则行列式的值变为原来的 k k k
  • 互换行列式的两行(或两列),则行列式的值取负
  • 行列式的某一行(列)加上另一行(列)的常数倍,行列式的值不变
  • d e t ( A B ) = d e t ( A ) d e t ( B ) det(AB)=det(A)det(B) det(AB)=det(A)det(B)
    证:见分块矩阵的初等变换。
  • 若A是共轭对称矩阵,则 d e t ( A ) ∈ R det(A)\in R det(A)R
    证:因为 d e t ( A ) = d e t ( A H ) = d e t ( A ) ‾ det(A)=det(A^H)=\overline{det(A)} det(A)=det(AH)=det(A),所以 d e t ( A ) det(A) det(A)的虚部为零, d e t ( A ) ∈ R det(A)\in R det(A)R

A ∈ F m × m , B ∈ F n × n A\in F^{m\times m},B\in F^{n\times n} AFm×m,BFn×n,则:

  • 若A是对角矩阵或上(下)三角矩阵,则A的行列式是A的主对角元之积
  • 拉普拉斯展开式一: ∣ A ∗ O B ∣ = ∣ A O ∗ B ∣ = ∣ A ∣ ∣ B ∣ \begin{vmatrix} A&*\\O&B\end{vmatrix}=\begin{vmatrix}A&O\\*&B\end{vmatrix}=|A||B| AOB=AOB=AB
  • 拉普拉斯展开式二: ∣ O A B ∗ ∣ = ∣ ∗ A B O ∣ = ( − 1 ) m n ∣ A ∣ ∣ B ∣ \begin{vmatrix}O&A\\B&*\end{vmatrix}=\begin{vmatrix}*&A\\B&O\end{vmatrix}=(-1)^{mn}|A||B| OBA=BAO=(1)mnAB

方阵的迹及其性质

  • 定义
    方阵A的迹 t r ( A ) tr(A) tr(A)定义为 A = ( a i j ) n × n A=(a_{ij})_{n\times n} A=(aij)n×n的主对角元之和,即 t r ( A ) = ∑ i = 1 n a i i tr(A)=\sum_{i=1}^n a_{ii} tr(A)=i=1naii
  • 性质
    • 设A、B均为n阶方阵,则 t r ( A ± B ) = t r ( A ) ± t r ( B ) tr(A\pm{B)}=tr(A)\pm{}tr(B) tr(A±B)=tr(A)±tr(B)
    • t r ( c A ) = c t r ( A ) , c ∈ F tr(cA)=ctr(A),c\in{F} tr(cA)=ctr(A),cF
    • t r ( A T ) = t r ( A ) , t r ( A ˉ ) = t r ( A H ) = t r ( A ) ‾ tr(A^T)=tr(A),tr(\bar{A})=tr(A^H)=\overline{tr(A)} tr(AT)=tr(A),tr(Aˉ)=tr(AH)=tr(A)
      推论: t r ( A T B ) = t r ( B T A ) = ∑ i , j A i j B i j tr(A^TB)=tr(B^TA)=\sum_{i,j}A_{ij}B_{ij} tr(ATB)=tr(BTA)=i,jAijBij,其中A、B均为 m × n m\times{n} m×n矩阵
    • 设A为 m × n m\times{n} m×n矩阵,B为 n × m n\times{m} n×m矩阵,则 t r ( A B ) = t r ( B A ) = ∑ i , j A i j B j i tr(AB)=tr(BA)=\sum_{i,j}A_{ij}B_{ji} tr(AB)=tr(BA)=i,jAijBji
    • 设A、B、C均为 m × n m\times{n} m×n矩阵,则 t r ( ( A ⊙ B ) T C ) = t r ( A T ( B ⊙ C ) ) = ∑ i , j A i j B i j C i j tr((A\odot{B})^TC)=tr(A^T(B\odot{C}))=\sum_{i,j}A_{ij}B_{ij}C_{ij} tr((AB)TC)=tr(AT(BC))=i,jAijBijCij式中 ⊙ \odot{} 是逐元素乘法(Hadarmard积)
    • 设A、B、C均为 m × n m\times{n} m×n矩阵, B B B的所有元素均非零,则 t r ( ( A ⊘ B ) T C ) = t r ( A T ( C ⊘ B ) ) = ∑ i j A i j C i j B i j tr((A\oslash B)^TC)=tr(A^T(C\oslash B))=\sum_{ij}\frac{A_{ij}C_{ij}}{B_{ij}} tr((AB)TC)=tr(AT(CB))=ijBijAijCij式中 ⊘ \oslash 是逐元素除法

逆矩阵

  • 定义
    A ∈ F n × n A\in F^{n\times n} AFn×n,若存在 B ∈ F n × n B\in F^{n\times n} BFn×n使得 A B = B A = I AB=BA=I AB=BA=I其中 I I I是单位矩阵,则称A是可逆的,B是A的逆矩阵,记为 B = A − 1 B=A^{-1} B=A1
  • 定理:任意方阵的逆矩阵若存在则唯一
  • 伴随矩阵
    • n阶 ( n ⩾ 2 ) (n\geqslant{2}) (n2)方阵A的伴随矩阵 A ∗ A^* A定义为:以 A j i A_{ji} Aji为(i,j)元素的n阶方阵,其中 A i j A_{ij} Aij A A A的(i,j)元素 a i j a_{ij} aij的代数余子式
    • 对任意n阶 ( n ⩾ 2 ) (n\geqslant{2}) (n2)方阵A,根据拉普拉斯展开式,有 A A ∗ = A ∗ A = d e t ( A ) I AA^*=A^*A=det(A)I AA=AA=det(A)I成立
  • 伴随矩阵的性质(设 A , B ∈ F n × n , n ⩾ 2 A,B\in F^{n\times n},n\geqslant 2 A,BFn×n,n2
    • ( k A ) ∗ = k n − 1 A ∗ , k ∈ F (kA)^*=k^{n-1}A^*,k\in{F} (kA)=kn1A,kF
    • ∣ A ∗ ∣ = ∣ A ∣ n − 1 |A^*|=|A|^{n-1} A=An1
    • ( A ∗ ) ∗ = ∣ A ∣ n − 2 A (A^*)^*=|A|^{n-2}A (A)=An2A
    • ( A ∗ ) T = ( A T ) ∗ (A^*)^T=(A^T)^* (A)T=(AT)
    • ( A ∗ ) H = ( A H ) ∗ (A^*)^H=(A^H)^* (A)H=(AH)
    • ( A B ) ∗ = B ∗ A ∗ (AB)^*=B^*A^* (AB)=BA
  • 方阵可逆的充要条件
    • (行列式判定)n阶方阵 A = ( a i j ) n × n A=(a_{ij})_{n\times{n}} A=(aij)n×n可逆的充要条件是 d e t ( A ) ≠ 0 det(A)\neq0 det(A)=0,A的逆矩阵为 A − 1 = { A ∗ d e t ( A ) n ⩾ 2 ( a 11 − 1 ) 1 × 1 n = 1 A^{-1}=\begin{cases}\frac{A^*}{det(A)}&n\geqslant{2}\\(a_{11}^{-1})_{1\times{1}}&n=1\end{cases} A1={det(A)A(a111)1×1n2n=1
    • n阶方阵 A = ( a i j ) n × n A=(a_{ij})_{n\times{n}} A=(aij)n×n可逆的充要条件是存在 B B B使得 A B = I AB=I AB=I
      证:
      必要性:若 A A A可逆,显然取 B = A − 1 B=A^{-1} B=A1就有 A B = I AB=I AB=I
      充分性:若存在 B B B使得 A B = I AB=I AB=I,则由 d e t ( A B ) = d e t ( A ) d e t ( B ) = d e t ( I ) = 1 det(AB)=det(A)det(B)=det(I)=1 det(AB)=det(A)det(B)=det(I)=1 d e t ( A ) ≠ 0 det(A)\neq 0 det(A)=0(否则的话就有 d e t ( A B ) = 0 det(AB)=0 det(AB)=0 d e t ( A B ) = 1 det(AB)=1 det(AB)=1矛盾),故由行列式判定知 A A A可逆。(此时若用 A − 1 A^{-1} A1左乘 A B = I AB=I AB=I,就得到 B = A − 1 B=A^{-1} B=A1,即这里的 B B B只能是 A − 1 A^{-1} A1
      【注1】该结论可以看做是逆矩阵的定义的弱化。本来逆矩阵要求 A B = I AB=I AB=I B A = I BA=I BA=I,但该结论说明只要 A B = I AB=I AB=I就够了(同理可知如果满足 B A = I BA=I BA=I也可推出 A A A可逆且 B = A − 1 B=A^{-1} B=A1)。
      【注2】该结论的一个等价结论是“已知同阶方阵 A , B A,B A,B,若 A B = I AB=I AB=I,则 B A = I BA=I BA=I”。
  • 逆矩阵的性质
    A , B ∈ F n × n A,B\in F^{n\times n} A,BFn×n
    • ( A − 1 ) − 1 = A (A^{-1})^{-1}=A (A1)1=A
    • ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1}=(A^{-1})^T (AT)1=(A1)T
    • ( A H ) − 1 = ( A − 1 ) H (A^H)^{-1}=(A^{-1})^H (AH)1=(A1)H
    • ( k A ) − 1 = 1 k A − 1 , 0 ≠ k ∈ F (kA)^{-1}=\frac{1}{k}A^{-1},0\neq k\in F (kA)1=k1A1,0=kF
    • ( A n ) − 1 = ( A − 1 ) n (A^n)^{-1}=(A^{-1})^n (An)1=(A1)n
    • ( A ∗ ) − 1 = ( A − 1 ) ∗ = A ∣ A ∣ (A^*)^{-1}=(A^{-1})^*=\frac{A}{|A|} (A)1=(A1)=AA n ⩾ 2 n\geqslant 2 n2
    • ( A B ) − 1 = B − 1 A − 1 (AB)^{-1}=B^{-1}A^{-1} (AB)1=B1A1
  • 特殊矩阵的逆矩阵
    • 若对角矩阵 Σ = [ λ 1 ⋱ λ n ] \Sigma=\begin{bmatrix}\lambda_1&\quad\\\quad&\ddots&\quad\\\quad&\quad&\lambda_n\end{bmatrix} Σ=λ1λn可逆,则其逆矩阵为 Σ − 1 = [ λ 1 − 1 ⋱ λ n − 1 ] \Sigma^{-1}=\begin{bmatrix}\lambda_1^{-1}&\quad\\\quad&\ddots&\quad\\\quad&\quad&\lambda_n^{-1}\end{bmatrix} Σ1=λ11λn1
    • 若上三角方阵可逆,则其逆矩阵为上三角方阵
    • 若下三角方阵可逆,则其逆矩阵为下三角方阵

关于逆矩阵的一个常用公式

  • 定理:设 A ∈ C m × m , U ∈ C m × p , B ∈ C p × q , V ∈ C q × m A\in C^{m\times m},U\in C^{m\times p},B\in C^{p\times q},V\in C^{q\times m} ACm×m,UCm×p,BCp×q,VCq×m。若 A A A可逆,则 A + U B V A+UBV A+UBV可逆的充要条件为 I p + B V A − 1 U I_p+BVA^{-1}U Ip+BVA1U可逆,且 ( A + U B V ) − 1 = A − 1 − A − 1 U ( I p + B V A − 1 U ) − 1 B V A − 1 (A+UBV)^{-1}=A^{-1}-A^{-1}U(I_p+BVA^{-1}U)^{-1}BVA^{-1} (A+UBV)1=A1A1U(Ip+BVA1U)1BVA1
    证明:(该定理的证明需要用到特征值的相关结论,若这块不熟悉可先跳过,特征值相关可参考矩阵论(零):线性代数基础知识整理(5)——特征值与相似)
    A A A可逆以及 A + U B V = A ( I m + A − 1 U B V ) A+UBV=A(I_m+A^{-1}UBV) A+UBV=A(Im+A1UBV)知, A + U B V A+UBV A+UBV可逆的充要条件为 I m + A − 1 U B V I_m+A^{-1}UBV Im+A1UBV可逆。令 M = A − 1 U , N = B V M=A^{-1}U,N=BV M=A1U,N=BV,由 M N MN MN N M NM NM有相同的非零特征值可知, I m + M N I_m+MN Im+MN可逆    ⟺    \iff − 1 -1 1不是 M N MN MN的特征值    ⟺    \iff − 1 -1 1不是 N M NM NM的特征值    ⟺    \iff I p + N M I_p+NM Ip+NM可逆。这就证明了 A + U B V A+UBV A+UBV可逆的充要条件为 I p + B V A − 1 U I_p+BVA^{-1}U Ip+BVA1U可逆。利用逆矩阵的定义容易验证公式 ( A + U B V ) − 1 = A − 1 − A − 1 U ( I + B V A − 1 U ) − 1 B V A − 1 (A+UBV)^{-1}=A^{-1}-A^{-1}U(I+BVA^{-1}U)^{-1}BVA^{-1} (A+UBV)1=A1A1U(I+BVA1U)1BVA1的正确性。证毕。

该定理的如下推论较常见:

  • 推论1(Woodbury恒等式):设 A ∈ C m × m , U ∈ C m × n , B ∈ C n × n , V ∈ C n × m A\in C^{m\times m},U\in C^{m\times n},B\in C^{n\times n},V\in C^{n\times m} ACm×m,UCm×n,BCn×n,VCn×m。若 A , B A,B A,B可逆,则 A + U B V A+UBV A+UBV可逆的充要条件为 B − 1 + V A − 1 U B^{-1}+VA^{-1}U B1+VA1U可逆,且 ( A + U B V ) − 1 = A − 1 − A − 1 U ( B − 1 + V A − 1 U ) − 1 V A − 1 (A+UBV)^{-1}=A^{-1}-A^{-1}U(B^{-1}+VA^{-1}U)^{-1}VA^{-1} (A+UBV)1=A1A1U(B1+VA1U)1VA1
    证:显然该定理是上面的定理当 B B B取可逆方阵时的特殊情形。由于 B B B可逆且 I n + B V A − 1 U = B ( B − 1 + V A − 1 U ) I_n+BVA^{-1}U=B(B^{-1}+VA^{-1}U) In+BVA1U=B(B1+VA1U),故 A + U B V A+UBV A+UBV可逆的充要条件为 B − 1 + V A − 1 U B^{-1}+VA^{-1}U B1+VA1U可逆。 ( A + U B V ) − 1 = A − 1 − A − 1 U ( I p + B V A − 1 U ) − 1 ( B − 1 ) − 1 V A − 1 = A − 1 − A − 1 U ( B − 1 + V A − 1 U ) − 1 V A − 1 (A+UBV)^{-1}=A^{-1}-A^{-1}U(I_p+BVA^{-1}U)^{-1}(B^{-1})^{-1}VA^{-1}=A^{-1}-A^{-1}U(B^{-1}+VA^{-1}U)^{-1}VA^{-1} (A+UBV)1=A1A1U(Ip+BVA1U)1(B1)1VA1=A1A1U(B1+VA1U)1VA1
  • 推论2(Sherman-Morrison定理):设 A ∈ C n × n A\in C^{n\times n} ACn×n可逆, u , v ∈ C n , b ∈ C u,v\in C^n,b\in C u,vCn,bC,则 A + b u v T A+buv^T A+buvT可逆的充要条件为 1 + b v T A − 1 u ≠ 0 1+bv^TA^{-1}u\neq 0 1+bvTA1u=0,且 ( A + b u v T ) − 1 = A − 1 − b A − 1 u v T A − 1 1 + b v T A − 1 u (A+buv^T)^{-1}=A^{-1}-\frac{bA^{-1}uv^TA^{-1}}{1+bv^TA^{-1}u} (A+buvT)1=A11+bvTA1ubA1uvTA1
    证:显然该定理是上面的定理当 B B B 1 × 1 1\times 1 1×1矩阵(即标量)时的特殊情形。证明略。
  • 推论3:设 A ∈ C n × n A\in C^{n\times n} ACn×n可逆, u , v ∈ C n u,v\in C^n u,vCn,则 A + u v T A+uv^T A+uvT可逆的充要条件为 1 + v T A − 1 u ≠ 0 1+v^TA^{-1}u\neq 0 1+vTA1u=0,且 ( A + u v T ) − 1 = A − 1 − A − 1 u v T A − 1 1 + v T A − 1 u (A+uv^T)^{-1}=A^{-1}-\frac{A^{-1}uv^TA^{-1}}{1+v^TA^{-1}u} (A+uvT)1=A11+vTA1uA1uvTA1
    证明:该定理是推论2当 b b b取1时的特殊情形。证明略。

【注】上述诸结论是在复数域下给出的,然而,可以看出既然在复数域下证明了这些结论,那么其他数域下结论也成立。上述推论2和推论3由于结论更弱,有更简便的证法,感兴趣的读者可自行研究。下面提供推论2的一个简单证法作为参考。

  • 推论2的简单证法
    证:
    充分性:若 1 + b v T A − 1 u ≠ 0 1+bv^TA^{-1}u\neq 0 1+bvTA1u=0,验证 ( A + b u v T ) ( A − 1 − b A − 1 u v T A − 1 1 + b v T A − 1 u ) = I (A+buv^T)(A^{-1}-\frac{bA^{-1}uv^TA^{-1}}{1+bv^TA^{-1}u})=I (A+buvT)(A11+bvTA1ubA1uvTA1)=I即可。
    必要性:注意由 A + b u v T = ( I + b u v T A − 1 ) A A+buv^T=(I+buv^TA^{-1})A A+buvT=(I+buvTA1)A可推出 I + b u v T A − 1 I+buv^TA^{-1} I+buvTA1可逆。假设 1 + b v T A − 1 u = 0 1+bv^TA^{-1}u=0 1+bvTA1u=0,则 ( I + b u v T A − 1 ) u = u + b u v T A − 1 u = u − u = 0 (I+buv^TA^{-1})u=u+buv^TA^{-1}u=u-u=0 (I+buvTA1)u=u+buvTA1u=uu=0。注意 1 + b v T A − 1 u = 0 1+bv^TA^{-1}u=0 1+bvTA1u=0确保 u ≠ 0 u\neq 0 u=0。这说明齐次线性方程组 ( I + b u v T A − 1 ) x = 0 (I+buv^TA^{-1})x=0 (I+buvTA1)x=0有非零解,这与 I + b u v T A − 1 I+buv^TA^{-1} I+buvTA1可逆是矛盾的。因此假设不成立,得证。

初等变换与矩阵的秩

行最简形和列最简形

  • 矩阵A称为行最简形,若A的所有非零行都在零行的上面,A的每个非零行的首非零元是1,其列号随行号严格单调递增,且其所在列的其他元素均为零。
  • 矩阵A称为列最简形,若A的所有非零列都在零列的左面,A的每个非零列的首非零元是1,其行号随列号严格单调递增,且其所在行的其他元素均为零。

初等变换

初等行(列)变换有三种:

  • 行(列)互换变换:互换矩阵的第i行(列)和第j行(列), i ≠ j i\neq j i=j
  • 行(列)倍乘变换:用非零常数 k ∈ F k\in F kF乘矩阵的某一行(列)的每个元素
  • 行(列)倍加变换:将矩阵的第i行(列)的k倍 ( k ∈ F ) (k\in{F}) (kF)加到第j行(列), i ≠ j i\neq j i=j

初等行变换和初等列变换统称为初等变换。

初等矩阵

  • 定义:对单位矩阵只作1次初等行(列)变换得到的矩阵称为初等矩阵,初等矩阵也有三种,对应分别为互换初等矩阵、倍乘初等矩阵、倍加初等矩阵
    【注】初等矩阵都是可逆的
  • 定理:设 A ∈ F m × n A\in F^{m\times{n}} AFm×n,对A施行1次初等行变换,其结果等同于给A的左边乘上一个相应的m阶初等矩阵(对单位矩阵施行1次相同的初等行变换得到的矩阵);对A施行1次初等列变换,其结果等同于给A的右边乘上一个相应的n阶初等矩阵(对单位矩阵施行1次相同的初等列变换得到的矩阵)
  • 定理:(可逆矩阵与初等矩阵的关系)方阵A是可逆矩阵的充要条件是A可以写成若干初等矩阵的积
  • 定理:任意矩阵A可通过有限次初等行变换化为唯一的一个行最简形,称为A的行最简形;也可通过有限次初等列变换化为唯一的一个列最简形,称为A的列最简形;即存在可逆矩阵P、Q使得PA是A的行最简形,AQ是A的列最简形

行等价与列等价

  • 定义:若矩阵A可经过若干次初等行(列)变换得到矩阵B,则称A与B行(列)等价
  • 定义:若矩阵A可经过若干次初等变换得到矩阵B,则称A与B等价
  • 定理:A与B行等价的充要条件为存在可逆矩阵P使得 P A = B PA=B PA=B;A与B列等价的充要条件为存在可逆矩阵Q使得 A = B Q A=BQ A=BQ;A与B等价的充要条件为存在可逆矩阵P和Q使得 P A Q = B PAQ=B PAQ=B
    证:由可逆矩阵的充要条件是其可被写成若干初等矩阵的积即证。

矩阵的秩及其性质

  • 定义:矩阵A的最高阶非零子式的阶数称为A的秩,记为r(A)或rank(A);当A没有非零子式(即 A = O A=O A=O)时,定义 r ( A ) = 0 r(A)=0 r(A)=0
  • 定理: r ( A H ) = r ( A T ) = r ( A ) r(A^H)=r(A^T)=r(A) r(AH)=r(AT)=r(A)
  • 定义:设 A ∈ F m × n A\in F^{m\times n} AFm×n,若 r ( A ) = n r(A)=n r(A)=n,则称A是列满秩矩阵;若 r ( A ) = m r(A)=m r(A)=m,则称A是行满秩矩阵;若 r ( A ) = m = n r(A)=m=n r(A)=m=n,则称A是满秩方阵,显然满秩方阵就是可逆矩阵
  • 定理:初等行(列)变换不改变矩阵的秩
  • 定理: r ( P A ) = r ( A Q ) = r ( A ) r(PA)=r(AQ)=r(A) r(PA)=r(AQ)=r(A),其中P、Q是可逆矩阵
    证:可逆矩阵可写成若干初等矩阵的积,故 P A PA PA相当于对 A A A做若干次初等行变换, A Q AQ AQ相当于对 A A A做若干次初等列变换,又因为初等变换不改变矩阵的秩,故结论成立。
  • 定义:设 A ∈ F m × n , r ( A ) = r A\in F^{m\times{n}},r(A)=r AFm×n,r(A)=r,A的秩标准形(又称等价标准形、相抵标准形)定义为 [ I r O O O ] \begin{bmatrix}I_r&O\\O&O\end{bmatrix} [IrOOO]
  • 定理:(等价标准形定理/相抵标准形定理/秩标准形定理)任意秩为r的矩阵A可经有限次初等变换化为A的秩标准形;即存在可逆矩阵P、Q使得 P A Q = [ I r O O O ] PAQ=\begin{bmatrix}I_r&O\\O&O\end{bmatrix} PAQ=[IrOOO]
  • 定理:列满秩矩阵可经有限次初等行变换化为它的秩标准形,行满秩矩阵可经有限次初等列变换化为它的秩标准形
  • 定理:同型矩阵 A A A B B B等价的充要条件为 r ( A ) = r ( B ) = r r(A)=r(B)=r r(A)=r(B)=r
    【注】所谓同型矩阵就是指两个矩阵的大小(或规格)一样,即若 A A A m × n m\times n m×n的,则 B B B也是 m × n m\times n m×n的。
    证:
    充分性显然。
    必要性:由秩标准形定理,存在可逆矩阵 P 1 , Q 1 , P 2 , Q 2 P_1,Q_1,P_2,Q_2 P1,Q1,P2,Q2使得 P 1 A Q 1 = P 2 B Q 2 = [ I r O O O ] P_1AQ_1=P_2BQ_2=\begin{bmatrix}I_r&O\\O&O\end{bmatrix} P1AQ1=P2BQ2=[IrOOO],故 ( P 2 − 1 P 1 ) A ( Q 1 Q 2 − 1 ) = B (P_2^{-1}P_1)A(Q_1Q_2^{-1})=B (P21P1)A(Q1Q21)=B,即A与B等价。
  • 可逆方阵A求逆的方法:对 [ I A ] \begin{bmatrix}I&A\end{bmatrix} [IA]进行初等行变换把A化成单位矩阵,则单位矩阵 I I I就被自然地化成了 A − 1 A^{-1} A1
    分析:设 [ I A ] \begin{bmatrix}I&A\end{bmatrix} [IA]经上述变换得到的结果为 [ B I ] \begin{bmatrix}B&I\end{bmatrix} [BI]。存在可逆矩阵P使得 P [ I A ] = [ B I ] P\begin{bmatrix}I&A\end{bmatrix}=\begin{bmatrix}B&I\end{bmatrix} P[IA]=[BI],即 P = B P=B P=B P A = I PA=I PA=I,故 B = P = A − 1 B=P=A^{-1} B=P=A1,即原本的单位矩阵 I I I自然地化成了 A − 1 A^{-1} A1
  • 定理: r ( B A ) = r ( A C ) = r ( A ) r(BA)=r(AC)=r(A) r(BA)=r(AC)=r(A),其中B是列满秩矩阵,C是行满秩矩阵
    证:
    由B列满秩,C行满秩知,存在可逆矩阵P,Q使得 P B = [ I O ] , C Q = [ I O ] PB=\begin{bmatrix}I\\O\end{bmatrix},CQ=\begin{bmatrix}I&O\end{bmatrix} PB=[IO],CQ=[IO],故 r ( B A ) = r ( P − 1 [ I O ] A ) = r ( [ A O ] ) = r ( A ) r(BA)=r(P^{-1}\begin{bmatrix}I\\O\end{bmatrix}A)=r(\begin{bmatrix}A\\O\end{bmatrix})=r(A) r(BA)=r(P1[IO]A)=r([AO])=r(A) r ( A C ) = r ( A [ I O ] Q − 1 ) = r ( [ A O ] ) = r ( A ) r(AC)=r(A\begin{bmatrix}I&O\end{bmatrix}Q^{-1})=r(\begin{bmatrix}A&O\end{bmatrix})=r(A) r(AC)=r(A[IO]Q1)=r([AO])=r(A)

分块矩阵的初等变换

分块矩阵是研究矩阵必不可少的工具,要想深入学习线性代数和矩阵论,一方面要学好线性空间与线性算子,另一方面要学好分块矩阵。一些较为深入的结论,有时从线性空间角度看更直观,有时从分块矩阵的角度看更直观。分块矩阵的基本运算请参考线性代数(四)-矩阵分块法。
分块矩阵的初等变换,又称广义初等变换,可以用来解决一些较为深入的秩的定理,还在相似、合同理论中有重要的应用。
所谓分块矩阵的初等变换,实际上是对分块矩阵进行多次初等变换,使结果整体上来看相当于变换的是矩阵的子块。下面看一个例子:

  • 定理:设 A ∈ F m × n A\in F^{m\times n} AFm×n按行分块为 A = [ B C ] A=\begin{bmatrix}B\\C\end{bmatrix} A=[BC],其中 B ∈ F m 1 × n , C ∈ F m 2 × n , m 1 + m 2 = m B\in F^{m_1\times n},C\in F^{m_2\times n},m_1+m_2=m BFm1×n,CFm2×n,m1+m2=m,矩阵 D ∈ F m 2 × m 1 D\in F^{m_2\times m_1} DFm2×m1。则可对 A A A进行若干次初等行变换(具体地,行倍加变换),使其变为 [ B C + D B ] \begin{bmatrix}B\\C+DB\end{bmatrix} [BC+DB]
    证:
    注意到 C + D B C+DB C+DB的第i行为 c i + d i B = c i + ∑ j = 1 m 1 d i j b j c_i+d_iB=c_i+\sum_{j=1}^{m_1}d_{ij}b_j ci+diB=ci+j=1m1dijbj,其中 c i , d i c_i,d_i ci,di分别是 C , D C,D C,D的第i行, b j b_j bj B B B的第j行。于是只要依次将 B B B的第1行的 d i 1 d_{i1} di1倍、第2行的 d i 2 d_{i2} di2倍、……、第 m 1 m_1 m1行的 d i m 1 d_{im_1} dim1倍加到 C C C的第i行,就将 C C C的第i行变成了 C + D B C+DB C+DB的第i行。对 i = 1 , 2 , . . . , m 2 i=1,2,...,m_2 i=1,2,...,m2依次实施上述的一系列行倍加变换,就将 A A A变成了 [ B C + D B ] \begin{bmatrix}B\\C+DB\end{bmatrix} [BC+DB]

上面这个例子中,通过多次的初等行倍加变换,将 A A A的子块 C C C变成了 C + D B C+DB C+DB,即加上了 A A A的另一个子块 B B B D D D倍(注意 D D D是乘在左边的),而这个“倍数” D D D是没有限制的,这个 D D D无论怎么取,都能够找到上述一系列初等行倍加变换以完成子块 C C C的整体变换。这种“神奇”的技巧在理论分析时很有用,尤其是当你可以用这个技巧把矩阵的某个子块变成零矩阵时,能大大降低计算的难度。通过初等变换把一个矩阵的某个子块变成零矩阵的技术被称作分块消元法,俗称矩阵打洞术。(听说数学家华罗庚和他的学生就十分擅长这类技巧)

我们已经知道对矩阵实施一次初等行变换与在其左边乘相应的初等矩阵的效果是等同的,如果进行一系列初等行变换,那么就相当于在左边乘一个可逆矩阵,那么上述例子中对应的可逆矩阵是什么呢?

实际上,设对某矩阵 A A A进行共 k k k次初等行变换,得到矩阵 G G G,变换对应的初等矩阵分别为 P 1 , P 2 , . . . , P k P_1,P_2,...,P_k P1,P2,...,Pk,则 P k P k − 1 . . . P 1 A = G P_kP_{k-1}...P_1A=G PkPk1...P1A=G,即对应在 A A A的左边乘了个可逆矩阵 P = P k P k − 1 . . . P 1 P=P_kP_{k-1}...P_1 P=PkPk1...P1。而 P k P k − 1 . . . P 1 = P k P k − 1 . . . P 1 I P_kP_{k-1}...P_1=P_kP_{k-1}...P_1I PkPk1...P1=PkPk1...P1I,所以可逆矩阵 P P P实际上就是对单位矩阵也实施同样的 k k k次初等行变换的结果。
据此,上述例子中对应的可逆矩阵就应是 [ E m 1 O D E m 2 ] \begin{bmatrix}E_{m_1}&O\\D&E_{m_2}\end{bmatrix} [Em1DOEm2](可以这样想:对 [ B C ] \begin{bmatrix}B\\C\end{bmatrix} [BC]实施一系列初等行变换后得到的是 [ B C + D B ] \begin{bmatrix}B\\C+DB\end{bmatrix} [BC+DB],效果就是给 C C C加上了 B B B D D D倍,那么对单位矩阵 [ E m 1 O O E m 2 ] \begin{bmatrix}E_{m_1}&O\\O&E_{m_2}\end{bmatrix} [Em1OOEm2]实施相同的初等行变换后,效果应该是相同的,即给 [ O E m 2 ] \begin{bmatrix}O&E_{m_2}\end{bmatrix} [OEm2]加上 [ E m 1 O ] \begin{bmatrix}E_{m_1}&O\end{bmatrix} [Em1O] D D D倍,于是得到 [ E m 1 O D E m 2 ] \begin{bmatrix}E_{m_1}&O\\D&E_{m_2}\end{bmatrix} [Em1DOEm2])。验证一下,根据行列式的拉普拉斯展开式, [ E m 1 O D E m 2 ] \begin{bmatrix}E_{m_1}&O\\D&E_{m_2}\end{bmatrix} [Em1DOEm2]确实是一个可逆矩阵,根据分块矩阵乘法, [ E m 1 O D E m 2 ] [ B C ] = [ B C + D B ] \begin{bmatrix}E_{m_1}&O\\D&E_{m_2}\end{bmatrix}\begin{bmatrix}B\\C\end{bmatrix}=\begin{bmatrix}B\\C+DB\end{bmatrix} [Em1DOEm2][BC]=[BC+DB]确实成立。

前面说过三种初等行(列)变换对应三种初等矩阵,类比一下,对分块矩阵实施三种分块行初等变换就对应于在原矩阵的左边乘三种分块初等矩阵,类似地,对分块矩阵实施三种分块列初等变换就对应于在原矩阵的右边乘三种分块初等矩阵

三种分块初等矩阵是指(为简单起见,以下只给出了四分块的情形):
分块倍加阵 [ E m 1 O C E m 2 ] \begin{bmatrix}E_{m_1}&O\\C&E_{m_2}\end{bmatrix} [Em1COEm2] [ E m 1 C O E m 2 ] \begin{bmatrix}E_{m_1}&C\\O&E_{m_2}\end{bmatrix} [Em1OCEm2]
分块倍乘阵 [ C O O E ] \begin{bmatrix}C&O\\O&E\end{bmatrix} [COOE] [ E O O C ] \begin{bmatrix}E&O\\O&C\end{bmatrix} [EOOC],其中 C C C可逆;
分块互换阵 [ O E m 2 E m 1 O ] \begin{bmatrix}O&E_{m_2}&\\E_{m_1}&O\end{bmatrix} [OEm1Em2O]
【注】分块初等矩阵并不是初等矩阵,初等矩阵是单位矩阵进行一次初等变换得到的,而分块初等矩阵需要单位矩阵经过多次初等变换才能得到

分块行初等变换:

  • 分块行倍加变换: [ E m 1 O C E m 2 ] [ A m 1 × n B m 2 × n ] = [ A B + C A ] \begin{bmatrix}E_{m_1}&O\\C&E_{m_2}\end{bmatrix}\begin{bmatrix}A_{m_1\times n}\\B_{m_2\times n}\end{bmatrix}=\begin{bmatrix}A\\B+CA\end{bmatrix} [Em1COEm2][Am1×nBm2×n]=[AB+CA]
    (相当于给 B B B加上了 A A A C C C倍,注意“倍数” C C C乘在了 A A A的左边)
  • 分块行倍乘变换: [ C O O E ] [ A B ] = [ C A B ] \begin{bmatrix}C&O\\O&E\end{bmatrix}\begin{bmatrix}A\\B\end{bmatrix}=\begin{bmatrix}CA\\B\end{bmatrix} [COOE][AB]=[CAB],其中 C C C可逆的
    (相当于给 A A A乘上了 C C C倍,注意“倍数” C C C乘在了 A A A的左边)
  • 分块行互换变换: [ O E m 2 E m 1 O ] [ A m 1 × n B m 2 × n ] = [ B A ] \begin{bmatrix}O&E_{m_2}&\\E_{m_1}&O\end{bmatrix}\begin{bmatrix}A_{m_1\times n}\\B_{m_2\times n}\end{bmatrix}=\begin{bmatrix}B\\A\end{bmatrix} [OEm1Em2O][Am1×nBm2×n]=[BA]
    (相当于把子块 A A A B B B交换了一下)

分块列初等变换:

  • 分块列倍加变换: [ A n × m 1 B n × m 2 ] [ E m 1 O C E m 2 ] = [ A + B C B ] \begin{bmatrix}A_{n\times m_1}&B_{n\times m_2}\end{bmatrix}\begin{bmatrix}E_{m_1}&O\\C&E_{m_2}\end{bmatrix}=\begin{bmatrix}A+BC&B\end{bmatrix} [An×m1Bn×m2][Em1COEm2]=[A+BCB]
    (相当于给 A A A加上了 B B B C C C倍,注意“倍数” C C C乘在了 B B B的右边)
  • 分块列倍乘变换: [ A n × m 1 B n × m 2 ] [ C O O E m 2 ] = [ A C B ] \begin{bmatrix}A_{n\times m_1}&B_{n\times m_2}\end{bmatrix}\begin{bmatrix}C&O\\O&E_{m_2}\end{bmatrix}=\begin{bmatrix}AC&B\end{bmatrix} [An×m1Bn×m2][COOEm2]=[ACB],其中 C C C可逆的
    (相当于给 A A A乘上了 C C C倍,注意“倍数” C C C乘在了 A A A的右边)
  • 分块列互换变换: [ A n × m 1 B n × m 2 ] [ O E m 2 E m 1 O ] = [ B A ] \begin{bmatrix}A_{n\times m_1}&B_{n\times m_2}\end{bmatrix}\begin{bmatrix}O&E_{m_2}&\\E_{m_1}&O\end{bmatrix}=\begin{bmatrix}B&A\end{bmatrix} [An×m1Bn×m2][OEm1Em2O]=[BA]
    (相当于把子块 A A A B B B交换了一下)

正如上面的定理指出的,一次分块倍加变换可通过多次一般的倍加变换完成。一次分块互换变换也可通过多次一般的互换变换完成。但是一次分块倍乘变换不一定可由多次一般的倍乘变换完成,而是在同一个子块内灵活地运用三种初等变换,关于这一点读者可自行研究。因为分块初等变换实际上不过是执行了多次一般的初等变换而已,所以分块初等变换均不改变矩阵的秩。此外,分块倍加变换不改变矩阵的行列式的值。

矩阵打洞技巧

这里列举几个常常碰到的矩阵打洞的情形,具体的用法请参考后文以及后面的博客。(以分块行初等变换为例)

  • [ B A B ] \begin{bmatrix}B\\AB\end{bmatrix} [BAB]:给子块 A B AB AB加上子块 B B B − A -A A倍,就能把 A B AB AB消掉。 [ E O − A E ] [ B A B ] = [ B O ] \begin{bmatrix}E&O\\-A&E\end{bmatrix}\begin{bmatrix}B\\AB\end{bmatrix}=\begin{bmatrix}B\\O\end{bmatrix} [EAOE][BAB]=[BO]
  • [ A B ] \begin{bmatrix}A\\B\end{bmatrix} [AB]:如果 A A A可逆,则无论 B B B是什么都能消掉 B B B [ E O − B A − 1 E ] [ A B ] = [ A O ] \begin{bmatrix}E&O\\-BA^{-1}&E\end{bmatrix}\begin{bmatrix}A\\B\end{bmatrix}=\begin{bmatrix}A\\O\end{bmatrix} [EBA1OE][AB]=[AO]

暂时这两个,想到不一样的再补充~~

方阵乘积的行列式公式
  • 定理:设 A , B ∈ F n × n A,B\in F^{n\times n} A,BFn×n,则 d e t ( A B ) = d e t ( A ) d e t ( B ) det(AB)=det(A)det(B) det(AB)=det(A)det(B)
    证:
    对分块矩阵做如下初等变换: [ A B O O I n ] → 行倍加 [ A B A O I n ] → 列倍加 [ O A − B I n ] \begin{bmatrix}AB&O\\O&I_n\end{bmatrix}\overset{\text{行倍加}}{\rightarrow}\begin{bmatrix}AB&A\\O&I_n\end{bmatrix}\overset{\text{列倍加}}{\rightarrow}\begin{bmatrix}O&A\\-B&I_n\end{bmatrix} [ABOOIn]行倍加[ABOAIn]列倍加[OBAIn]因为倍加变换不改变行列式的值,所以应用拉普拉斯公式就有 d e t ( A B ) = d e t [ A B O O I n ] = d e t [ O A − B I n ] = ( − 1 ) n 2 d e t ( A ) d e t ( − B ) = d e t ( A ) d e t ( B ) det(AB)=det\begin{bmatrix}AB&O\\O&I_n\end{bmatrix}=det\begin{bmatrix}O&A\\-B&I_n\end{bmatrix}\\=(-1)^{n^2}det(A)det(-B)=det(A)det(B) det(AB)=det[ABOOIn]=det[OBAIn]=(1)n2det(A)det(B)=det(A)det(B)
分块矩阵的逆

分块初等矩阵的逆:

  • [ E m 1 O C E m 2 ] − 1 = [ E m 1 O − C E m 2 ] \begin{bmatrix}E_{m_1}&O\\C&E_{m_2}\end{bmatrix}^{-1}=\begin{bmatrix}E_{m_1}&O\\-C&E_{m_2}\end{bmatrix} [Em1COEm2]1=[Em1COEm2]
  • [ C O O E m 2 ] − 1 = [ C − 1 O O E m 2 ] \begin{bmatrix}C&O\\O&E_{m_2}\end{bmatrix}^{-1}=\begin{bmatrix}C^{-1}&O\\O&E_{m_2}\end{bmatrix} [COOEm2]1=[C1OOEm2],其中 C C C可逆
  • [ O E m 2 E m 1 O ] − 1 = [ O E m 1 E m 2 O ] \begin{bmatrix}O&E_{m_2}&\\E_{m_1}&O\end{bmatrix}^{-1}=\begin{bmatrix}O&E_{m_1}&\\E_{m_2}&O\end{bmatrix} [OEm1Em2O]1=[OEm2Em1O]

分块矩阵的逆的一般公式由以下结论导出:

  • 定理:设 A ∈ F m × m A\in F^{m\times m} AFm×m可逆, D ∈ F n × n D\in F^{n\times n} DFn×n,则 [ A B C D ] \begin{bmatrix}A&B\\C&D\end{bmatrix} [ACBD]可逆的充要条件为 M = D − C A − 1 B M=D-CA^{-1}B M=DCA1B可逆,且 [ A B C D ] − 1 = [ A − 1 + A − 1 D M − 1 C A − 1 − A − 1 D M − 1 − M − 1 C A − 1 M − 1 ] \begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}=\begin{bmatrix}A^{-1}+A^{-1}DM^{-1}CA^{-1}&-A^{-1}DM^{-1}\\-M^{-1}CA^{-1}&M^{-1}\end{bmatrix} [ACBD]1=[A1+A1DM1CA1M1CA1A1DM1M1]
    证:
    [ A B C D ] → 行倍加 [ A B O D − C A − 1 B ] → 列倍加 [ A O O D − C A − 1 B ] \begin{bmatrix}A&B\\C&D\end{bmatrix}\overset{\text{行倍加}}{\rightarrow}\begin{bmatrix}A&B\\O&D-CA^{-1}B\end{bmatrix}\overset{\text{列倍加}}{\rightarrow}\begin{bmatrix}A&O\\O&D-CA^{-1}B\end{bmatrix} [ACBD]行倍加[AOBDCA1B]列倍加[AOODCA1B]由倍加变换不改变行列式的值,得 d e t [ A B C D ] = d e t [ A O O D − C A − 1 B ] = d e t ( A ) d e t ( M ) det\begin{bmatrix}A&B\\C&D\end{bmatrix}=det\begin{bmatrix}A&O\\O&D-CA^{-1}B\end{bmatrix}=det(A)det(M) det[ACBD]=det[AOODCA1B]=det(A)det(M) d e t [ A B C D ] ≠ 0 det\begin{bmatrix}A&B\\C&D\end{bmatrix}\neq 0 det[ACBD]=0的充要条件为 d e t ( M ) ≠ 0 det(M)\neq 0 det(M)=0,得证。
    将上述初等变换用分块初等矩阵写出就是 [ E m O − C A − 1 E n ] [ A B C D ] [ E m − A − 1 B O E n ] = [ A O O M ] \begin{bmatrix}E_{m}&O\\-CA^{-1}&E_{n}\end{bmatrix}\begin{bmatrix}A&B\\C&D\end{bmatrix}\begin{bmatrix}E_{m}&-A^{-1}B\\O&E_{n}\end{bmatrix}=\begin{bmatrix}A&O\\O&M\end{bmatrix} [EmCA1OEn][ACBD][EmOA1BEn]=[AOOM]于是 [ A B C D ] − 1 = ( [ E m O − C A − 1 E n ] − 1 [ A O O M ] [ E m − A − 1 B O E n ] − 1 ) − 1 = [ E m − A − 1 B O E n ] [ A − 1 O O M − 1 ] [ E m O − C A − 1 E n ] = [ A − 1 + A − 1 B M − 1 C A − 1 − A − 1 B M − 1 − M − 1 C A − 1 M − 1 ] \begin{aligned}\begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}&=\left(\begin{bmatrix}E_{m}&O\\-CA^{-1}&E_{n}\end{bmatrix}^{-1}\begin{bmatrix}A&O\\O&M\end{bmatrix}\begin{bmatrix}E_{m}&-A^{-1}B\\O&E_{n}\end{bmatrix}^{-1}\right)^{-1}\\&=\begin{bmatrix}E_{m}&-A^{-1}B\\O&E_{n}\end{bmatrix}\begin{bmatrix}A^{-1}&O\\O&M^{-1}\end{bmatrix}\begin{bmatrix}E_{m}&O\\-CA^{-1}&E_{n}\end{bmatrix}\\&=\begin{bmatrix}A^{-1}+A^{-1}BM^{-1}CA^{-1}&-A^{-1}BM^{-1}\\-M^{-1}CA^{-1}&M^{-1}\end{bmatrix}\end{aligned} [ACBD]1=([EmCA1OEn]1[AOOM][EmOA1BEn]1)1=[EmOA1BEn][A1OOM1][EmCA1OEn]=[A1+A1BM1CA1M1CA1A1BM1M1]可以使用逆矩阵的定义验证一下上式是否正确。

同理可得

  • 定理:设 D ∈ F n × n D\in F^{n\times n} DFn×n可逆, A ∈ F m × m A\in F^{m\times m} AFm×m,则 [ A B C D ] \begin{bmatrix}A&B\\C&D\end{bmatrix} [ACBD]可逆的充要条件为 M = A − B D − 1 C M=A-BD^{-1}C M=ABD1C可逆,且 [ A B C D ] − 1 = [ M − 1 − M − 1 B D − 1 − D − 1 C M − 1 D − 1 + D − 1 C M − 1 B D − 1 ] \begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}=\begin{bmatrix}M^{-1}&-M^{-1}BD^{-1}\\-D^{-1}CM^{-1}&D^{-1}+D^{-1}CM^{-1}BD^{-1}\end{bmatrix} [ACBD]1=[M1D1CM1M1BD1D1+D1CM1BD1]
  • 定理:设 B ∈ F m × m B\in F^{m\times m} BFm×m可逆, C ∈ F n × n C\in F^{n\times n} CFn×n,则 [ A B C D ] \begin{bmatrix}A&B\\C&D\end{bmatrix} [ACBD]可逆的充要条件为 M = C − D B − 1 A M=C-DB^{-1}A M=CDB1A可逆,且 [ A B C D ] − 1 = [ − M − 1 D B − 1 M − 1 B − 1 + B − 1 A M − 1 D B − 1 − B − 1 A M − 1 ] \begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}=\begin{bmatrix}-M^{-1}DB^{-1}&M^{-1}\\B^{-1}+B^{-1}AM^{-1}DB^{-1}&-B^{-1}AM^{-1}\end{bmatrix} [ACBD]1=[M1DB1B1+B1AM1DB1M1B1AM1]
  • 定理:设 C ∈ F n × n C\in F^{n\times n} CFn×n可逆, B ∈ F m × m B\in F^{m\times m} BFm×m,则 [ A B C D ] \begin{bmatrix}A&B\\C&D\end{bmatrix} [ACBD]可逆的充要条件为 M = B − A C − 1 D M=B-AC^{-1}D M=BAC1D可逆,且 [ A B C D ] − 1 = [ − C − 1 D M − 1 C − 1 + C − 1 D M − 1 A C − 1 M − 1 − M − 1 A C − 1 ] \begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}=\begin{bmatrix}-C^{-1}DM^{-1}&C^{-1}+C^{-1}DM^{-1}AC^{-1}\\M^{-1}&-M^{-1}AC^{-1}\end{bmatrix} [ACBD]1=[C1DM1M1C1+C1DM1AC1M1AC1]
分块矩阵的秩

分块矩阵是研究矩阵的秩的重要工具,从分块矩阵的视角证明秩的结论往往非常简便。这里先给出一些基本结论:

  • 定理: r [ A O O B ] = r [ O A B O ] = r ( A ) + r ( B ) r\begin{bmatrix}A&O\\O&B\end{bmatrix}=r\begin{bmatrix}O&A\\B&O\end{bmatrix}=r(A)+r(B) r[AOOB]=r[OBAO]=r(A)+r(B),其中A,B是任意大小的矩阵
    证:(以 r [ A O O B ] = r ( A ) + r ( B ) r\begin{bmatrix}A&O\\O&B\end{bmatrix}=r(A)+r(B) r[AOOB]=r(A)+r(B)为例)
    由矩阵的秩的定义,A,B中最高阶非零子式的阶数分别为 r ( A ) , r ( B ) r(A),r(B) r(A),r(B),分别设这两个子式为 ∣ A 1 ∣ , ∣ B 1 ∣ |A_1|,|B_1| A1,B1,则 ∣ A 1 O O B 1 ∣ \begin{vmatrix}A_1&O\\O&B_1\end{vmatrix} A1OOB1 [ A O O B ] \begin{bmatrix}A&O\\O&B\end{bmatrix} [AOOB]的一个非零子式,故它的秩至少为r(A)+r(B)。显然任意阶数大于r(A)+r(B)的子式也具有 ∣ A 2 O O B 2 ∣ \begin{vmatrix}A_2&O\\O&B_2\end{vmatrix} A2OOB2的形式(其中 A 2 A_2 A2 B 2 B_2 B2的阶数有可能为零),且要么 A 2 A_2 A2的阶数大于 r ( A ) r(A) r(A),要么 B 2 B_2 B2的阶数大于 r ( B ) r(B) r(B),即 d e t ( A 2 ) = 0 det(A_2)=0 det(A2)=0 d e t ( B 2 ) = 0 det(B_2)=0 det(B2)=0,故由拉普拉斯展开式得 ∣ A 2 O O B 2 ∣ = d e t ( A 2 ) d e t ( B 2 ) = 0 \begin{vmatrix}A_2&O\\O&B_2\end{vmatrix}=det(A_2)det(B_2)=0 A2OOB2=det(A2)det(B2)=0,这就证明了 r [ A O O B ] = r ( A ) + r ( B ) r\begin{bmatrix}A&O\\O&B\end{bmatrix}=r(A)+r(B) r[AOOB]=r(A)+r(B)
  • 定理: r [ A O O B ] ⩽ r [ A O ∗ B ] r\begin{bmatrix}A&O\\O&B\end{bmatrix}\leqslant r\begin{bmatrix}A&O\\*&B\end{bmatrix} r[AOOB]r[AOB] r [ A O O B ] ⩽ r [ A ∗ O B ] r\begin{bmatrix}A&O\\O&B\end{bmatrix}\leqslant r\begin{bmatrix}A&*\\O&B\end{bmatrix} r[AOOB]r[AOB]
    证:(以 r [ A O O B ] ⩽ r [ A O ∗ B ] r\begin{bmatrix}A&O\\O&B\end{bmatrix}\leqslant r\begin{bmatrix}A&O\\*&B\end{bmatrix} r[AOOB]r[AOB]为例)
    由拉普拉斯展开式知, [ A O O B ] \begin{bmatrix}A&O\\O&B\end{bmatrix}

你可能感兴趣的:(机器学习的数学基础)