2.4 分块矩阵(第2章矩阵代数)

主要内容

本节引入了分块矩阵的概念,讲解了分块矩阵的乘法运算(将子矩阵当作数处理),并由此引出了看待矩阵乘法的另一种观点(左边矩阵的列乘以右边矩阵的行),最后讲解了分块矩阵的逆矩阵是如何运算的。

分块矩阵的概念

之前,我们尝试过把矩阵看作一个数的矩形表,也可以把矩阵看作一组列向量,现在可以尝试以另一种新的角度来看待矩阵,也就是用水平线和垂直线将它分割成几块,如下图的矩阵 A A A。 以这种观点来看矩阵,可以使得矩阵许多本质的结构显露出来。
A = [ 3 0 − 1 5 9 − 2 − 5 2 4 0 − 3 1 − 8 − 6 3 1 7 − 4 ] A = \begin{bmatrix} \begin{array}{ccc | cc | c} 3 & 0 & -1 & 5 & 9 & -2 \\ -5 & 2 & 4 & 0 & -3 & 1 \\ \hline -8 & -6 & 3 & 1 & 7 & -4 \end{array} \end{bmatrix} A=358026143501937214
上述矩阵 A A A也可写成 2 × 3 2 \times 3 2×3分块矩阵
A = [ A 11 A 12 A 13 A 21 A 22 A 23 ] A = \begin{bmatrix}A_{11} & A_{12} & A{13} \\ A_{21} & A_{22} & A_{23} \end{bmatrix} A=[A11A21A12A22A13A23]
的形状,它的元素是分块(或子矩阵):
A 11 = [ 3 0 − 1 − 5 2 4 ] A_{11} = \begin{bmatrix}3 & 0 & -1 \\ -5 & 2 & 4 \end{bmatrix} A11=[350214] A 12 = [ 5 9 0 − 3 ] A_{12} = \begin{bmatrix}5 & 9 \\ 0 & -3 \end{bmatrix} A12=[5093] A 13 = [ − 2 1 ] A_{13} = \begin{bmatrix}-2 \\ 1 \end{bmatrix} A13=[21]
A 21 = [ − 8 6 3 ] A_{21} = \begin{bmatrix}-8 & 6 & 3 \end{bmatrix} A21=[863] A 22 = [ 1 7 ] A_{22} = \begin{bmatrix}1 & 7 \end{bmatrix} A22=[17] A 23 = [ − 4 ] A_{23} = \begin{bmatrix} -4 \end{bmatrix} A23=[4]

例:

若一个微型计算机电路板主要由3块超大规模的集成电路芯片组成,那么该电路板的矩阵可以写成一般形式:
A = [ A 11 A 12 A 13 A 21 A 22 A 23 A 31 A 32 A 33 ] A = \begin{bmatrix} \begin{array}{c| c | c} A_{11} & A_{12} & A_{13} \\ \hline A_{21} & A_{22} & A_{23} \\ \hline A_{31} & A_{32} & A_{33} \end{array} \end{bmatrix} A=A11A21A31A12A22A32A13A23A33
A A A的对角线上的子矩阵(即 A 11 A_{11} A11 A 22 A_{22} A22 A 33 A_{33} A33)是有关三块超大规模集成电路本身的矩阵,而其他子矩阵则与这三块芯片之间的相互联系有关。

分块矩阵的乘法

分块矩阵也可用通常的行列法则进行乘法运算,就如每一块都是数一样,只要对于乘积 A B AB AB A A A的列的分法与 B B B的行的分法一致。

例:


A = [ 2 − 3 1 0 − 4 1 5 − 2 3 1 0 − 4 − 2 7 − 1 ] = [ A 11 A 12 A 21 A 22 ] A = \begin{bmatrix}\begin{array}{ccc | cc} 2 & -3 & 1 & 0 & -4 \\ 1 & 5 & -2 & 3 & 1 \\ \hline 0 & -4 & -2 & 7 & -1 \end{array} \end{bmatrix} = \begin{bmatrix}A_{11} & A_{12} \\ A_{21} & A_{22}\end{bmatrix} A=210354122037411=[A11A21A12A22]
B = [ 6 4 − 2 1 − 3 7   − 1 3 5 2 ] B=\begin{bmatrix}6 & 4 \\ -2 & 1 \\ -3 & 7 \\ \hline \ -1 & 3 \\5 & 2 \end{bmatrix} B=623 1541732
A A A的5列被分成3列一组和2列一组。 B B B的5行按同样方法分块——被分成3行一组和2列一组。我们称 A A A B B B的分块是与分块乘法相一致的。 A B AB AB的乘积可以被写成:
A B = [ A 11 A 12 A 21 A 22 ] [ B 1 B 2 ] = [ A 11 B 1 + A 12 B 2 A 21 B 1 + A 22 B 2 ] = [ − 5 4 − 6 2 2 1 ] AB = \begin{bmatrix}A_{11} & A_{12} \\ A_{21} & A_{22}\end{bmatrix} \begin{bmatrix}B_1 \\ B_2\end{bmatrix} = \begin{bmatrix}A_{11}B_1 + A_{12}B_2 \\ A_{21}B_1 + A_{22}B_2\end{bmatrix} = \begin{bmatrix}-5 & 4 \\ -6 & 2 \\ \hline 2 & 1\end{bmatrix} AB=[A11A21A12A22][B1B2]=[A11B1+A12B2A21B1+A22B2]=562421

之前,我们已经学习过,从不同的角度去看待矩阵的乘积 A B AB AB。例如:

  • 使用 A A A的列来给出 A x A\boldsymbol x Ax的定义;
  • A B AB AB的列的定义
  • 计算 A B AB AB的行列法则
  • A A A的行与矩阵 B B B的乘积作为 A B AB AB的行

从上述矩阵相乘的行列法则,可以给出两个矩阵乘积的最一般观点。试想,将 A A A切成若干个只有一列的子矩阵,将 B B B切割成只有一行的若干子矩阵,那么根据分块矩阵的运算法则,可以得出矩阵乘积的一般性规律。
例:

A = [ − 3 1 2 1 − 4 5 ] A= \begin{bmatrix}-3 & 1 & 2 \\ 1 & -4 & 5\end{bmatrix} A=[311425] B = [ a b c d e f ] B= \begin{bmatrix}a & b \\ c & d \\ e & f\end{bmatrix} B=acebdf,验证:
A B = c o l 1 ( A ) r o w 1 ( B ) + c o l 2 ( A ) r o w 2 ( B ) + c o l 3 ( A ) r o w 3 ( B ) AB=col_1(A)row_1(B)+col_2(A)row_2(B)+col_3(A)row_3(B) AB=col1(A)row1(B)+col2(A)row2(B)+col3(A)row3(B)

解:

由计算矩阵乘积的行列法则,有:
c o l 1 ( A ) r o w 1 ( B ) = [ − 3 1 ] [ a b ] = [ − 3 a − 3 b a b ] col_1(A)row_1(B) = \begin{bmatrix}-3 \\ 1\end{bmatrix}\begin{bmatrix}a & b\end{bmatrix} = \begin{bmatrix}-3a & -3b \\ a & b\end{bmatrix} col1(A)row1(B)=[31][ab]=[3aa3bb]
c o l 2 ( A ) r o w 2 ( B ) = [ 1 − 4 ] [ c d ] = [ c d − 4 c − 4 d ] col_2(A)row_2(B) = \begin{bmatrix}1 \\ -4\end{bmatrix}\begin{bmatrix}c & d\end{bmatrix} = \begin{bmatrix}c & d \\ -4c & -4d\end{bmatrix} col2(A)row2(B)=[14][cd]=[c4cd4d]
c o l 3 ( A ) r o w 3 ( B ) = [ 2 5 ] [ e f ] = [ 2 e 2 f 5 e 5 f ] col_3(A)row_3(B) = \begin{bmatrix}2 \\ 5\end{bmatrix}\begin{bmatrix}e & f\end{bmatrix} = \begin{bmatrix}2e & 2f \\ 5e & 5f\end{bmatrix} col3(A)row3(B)=[25][ef]=[2e5e2f5f]
于是,
∑ k = 1 3 c o l k ( A ) r o w k ( B ) = [ − 3 a + c + 2 e − 3 b + d + 2 f a − 4 c + 5 e b − 4 d + 5 f ] \sum_{k=1}^{3}col_k(A)row_k(B) = \begin{bmatrix}-3a+c+2e & -3b+d+2f \\ a-4c+5e & b-4d+5f\end{bmatrix} k=13colk(A)rowk(B)=[3a+c+2ea4c+5e3b+d+2fb4d+5f]
这个矩阵恰好就是 A B AB AB

定理:

A A A m × n m \times n m×n矩阵, B B B n × p n \times p n×p矩阵,则:
A B = [ c o l 1 ( A ) c o l 2 ( A ) . . . c o l n ( A ) ] [ r o w 1 ( B ) r o w 2 ( B ) . . . r o w n ( B ) ] = c o l 1 ( A ) r o w 1 ( B ) + . . . + c o l n ( A ) r o w n ( B ) \begin{aligned}AB &= \begin{bmatrix}col_1(A) & col_2(A) & ... & col_n(A)\end{bmatrix} \begin{bmatrix}row_1(B) & row_2(B) & ... & row_n(B)\end{bmatrix} \\&= col_1(A)row_1(B) + ... +col_n(A)row_n(B)\end{aligned} AB=[col1(A)col2(A)...coln(A)][row1(B)row2(B)...rown(B)]=col1(A)row1(B)+...+coln(A)rown(B)

证:

对每个行指标 i i i和列指标 j j j,乘积 c o l k ( A ) r o w k ( B ) col_k(A)row_k(B) colk(A)rowk(B) ( i , j ) (i,j) (i,j)元素是 c o l k ( A ) col_k(A) colk(A)中元素 a i k a_{ik} aik r o w k ( B ) row_k(B) rowk(B)中元素 b k j b_{kj} bkj的积,因此, ( i , j ) (i,j) (i,j)元素为:
a i 1 b 1 j + a i 2 b 2 j + . . . + a i n b n j a_{i1} b_{1j} + a_{i2}b_{2j} + ... + a_{in}b_{nj} ai1b1j+ai2b2j+...+ainbnj
根据行列法则,该和恰好是 A B AB AB ( i , j ) (i,j) (i,j)元素。

分块矩阵的逆

例:

形如 A = [ A 11 A 12 0 A 22 ] A= \begin{bmatrix}A_{11} & A_{12} \\ 0 & A_{22}\end{bmatrix} A=[A110A12A22]的矩阵称为分块上三角矩阵。设 A 11 A_{11} A11 p × p p \times p p×p矩阵, A 22 A_{22} A22 q × q q \times q q×q矩阵,且 A A A为可逆矩阵。求 A − 1 A^{-1} A1的表达式。

解:

B B B表示 A − 1 A^{-1} A1且把它分块,使得:
[ A 11 A 12 0 A 22 ] [ B 11 B 12 B 21 B 22 ] = [ I p 0 0 I q ] \begin{bmatrix}A_{11} & A_{12} \\ 0 & A_{22}\end{bmatrix} \begin{bmatrix}B_{11} & B_{12} \\ B_{21} & B_{22}\end{bmatrix} = \begin{bmatrix}\boldsymbol I_p & 0 \\ 0 & \boldsymbol I_q\end{bmatrix} [A110A12A22][B11B21B12B22]=[Ip00Iq]
根据矩阵计算法则,可得如下四个等式:
A 11 B 11 + A 12 B 21 = I p A 11 B 12 + A 12 B 22 = 0 A 22 B 21 = 0 A 22 B 22 = I q \begin{aligned} A_{11}B_{11} + A_{12}B_{21} &= \boldsymbol I_p \\ A_{11}B_{12} + A_{12}B_{22} &= 0\\ A_{22}B_{21} &= 0 \\ A_{22}B_{22} &= \boldsymbol I_q \end{aligned} A11B11+A12B21A11B12+A12B22A22B21A22B22=Ip=0=0=Iq
(1)由于 A 22 A_{22} A22是方阵,且 A 22 B 22 = I q A_{22}B_{22} = \boldsymbol I_q A22B22=Iq,根据可逆矩阵定理,可以断定 A 22 A_{22} A22可逆且 B 22 = A 22 − 1 B_{22}=A_{22}^{-1} B22=A221
(2)由于 A 22 A_{22} A22可逆,那么方程 A 22 B 21 = 0 A_{22}B_{21}=0 A22B21=0两边同时乘以 A 22 − 1 A_{22}^{-1} A221,可得: B 21 = A 22 − 1 0 = 0 B_{21}=A_{22}^{-1}0=0 B21=A2210=0
(3)因此,上述第一个式子 A 11 B 11 + A 12 B 12 = I p A_{11}B_{11}+A_{12}B{12}=\boldsymbol I_p A11B11+A12B12=Ip可化简为: A 11 B 11 + 0 = 0 A_{11}B_{11}+0=0 A11B11+0=0,由于 A 11 A_{11} A11是方阵,这说明 A 11 A_{11} A11是可逆的,且 B 11 = A 11 − 1 B_{11}=A_{11}^{-1} B11=A111
(4)将 B 22 = A 22 − 1 B_{22}=A_{22}^{-1} B22=A221代入到上述第二个式子 A 11 B 12 + A 12 B 22 = 0 A_{11}B_{12}+A_{12}B_{22}=0 A11B12+A12B22=0,可以得到: B 12 = − A 11 − 1 A 12 A 22 − 1 B_{12}=-A_{11}^{-1}A_{12}A_{22}^{-1} B12=A111A12A221
综上,
A − 1 = [ A 11 − 1 − A 11 − 1 A 12 A 22 − 1 0 A 22 − 1 ] A^{-1}=\begin{bmatrix}A_{11}^{-1} & -A_{11}^{-1}A_{12}A_{22}^{-1} \\ 0 & A_{22}^{-1}\end{bmatrix} A1=[A1110A111A12A221A221]

分块对角矩阵是一个分块矩阵,除了主对角线上各分块外,其余全是零分块。这样的一个矩阵是可逆的当且仅当主对角线上各分块都是可逆的。

你可能感兴趣的:(线性代数及其应用系列笔记,线性代数,矩阵,机器学习,深度学习)