线性代数之 矩阵乘法的本质

线性代数之 矩阵乘法的本质

  • 前言
  • 教材里的矩阵乘法
  • 矩阵与向量的乘法
  • 矩阵之间的乘法
  • 扩展1:方阵与向量的乘法与线性相关性
  • 扩展2:方阵间的乘法与秩
  • 后记

前言

本文将介绍矩阵乘法及其本质。

教材里的矩阵乘法

矩阵 A ∈ R m × n , B ∈ R n × l A\in R^{m\times n}, B \in R^{n\times l} ARm×n,BRn×l,则定义矩阵乘法 A B AB AB为:

A B = C ∈ R m × l C i j = ∑ k = 1 n a i k b k j AB=C\in R^{m\times l} \\ C_{ij}=\sum_{k=1}^{n} a_{ik}b_{kj} AB=CRm×lCij=k=1naikbkj
以上定义看着就很复杂,理解起来就是左边矩阵的第 i 行的元素乘以右边矩阵第 j 列的对应元素,也就是所谓的“十字”乘法。

这样的定义,满足做题的需求,但对于理解矩阵乘法的本质,没有任何作用。

矩阵与向量的乘法

考虑矩阵与列向量的乘法:
A x = b 将 A 看 作 列 向 量 的 横 向 排 列 : A = ( a ⃗ 1 , a ⃗ 2 , … , a ⃗ n ) ( a ⃗ 1 , a ⃗ 2 , … , a ⃗ n ) x = x 1 a ⃗ 1 + x 2 a ⃗ 2 + ⋯ + x n a ⃗ n 实 际 上 , x 1 a ⃗ 1 + x 2 a ⃗ 2 + ⋯ + x n a ⃗ n 就 是 矩 阵 A 的 列 向 量 的 线 性 组 合 Ax=b \\ \quad \\ 将A看作列向量的横向排列: \\ \quad \\ A = (\vec a_1, \vec a_2, \dots, \vec a_n) \\ (\vec a_1, \vec a_2, \dots, \vec a_n)x=x_1\vec a_1+x_2\vec a_2+\dots+ x_n\vec a_n \\ \quad \\ 实际上,x_1\vec a_1+x_2\vec a_2+\dots+ x_n\vec a_n就是矩阵A的列向量的线性组合 Ax=bAA=(a 1,a 2,,a n)(a 1,a 2,,a n)x=x1a 1+x2a 2++xna nx1a 1+x2a 2++xna nA线
由以上过程,我们就可以把矩阵与列向量的乘积 A x = b Ax=b Ax=b,定义为矩阵的列的线性组合,线性组合的系数就是列向量的每个元素。并且结果是矩阵列的线性组合,那么列向量维数的肯定不变。

同理,行向量与矩阵 x T A = b T x^TA=b^T xTA=bT的乘积,就是矩阵行的线性组合。

矩阵之间的乘法

现在来考虑矩阵的乘法:
A X = B 将 X 都 看 作 列 向 量 的 横 向 排 列 X = ( x ⃗ 1 , x ⃗ 2 , … , x ⃗ n ) A X = A ( x ⃗ 1 , x ⃗ 2 , … , x ⃗ n ) = ( A x ⃗ 1 , A x ⃗ 2 , … , A x ⃗ n ) 于 是 , 矩 阵 乘 积 就 变 成 了 矩 阵 与 列 向 量 乘 积 的 横 向 排 列 AX=B \\ \quad \\ 将X都看作列向量的横向排列 \\ \quad \\ X = (\vec x_1, \vec x_2, \dots, \vec x_n) \\ AX=A(\vec x_1, \vec x_2, \dots, \vec x_n)=(A\vec x_1, A\vec x_2, \dots, A\vec x_n) \\ \quad \\ 于是,矩阵乘积就变成了矩阵与列向量乘积的横向排列 \\ AX=BXX=(x 1,x 2,,x n)AX=A(x 1,x 2,,x n)=(Ax 1,Ax 2,,Ax n)
因此,我们就可以把矩阵乘法 A X = B AX=B AX=B,定义为矩阵列的不同线性组合的横向排列。既然结果是列的线性组合的横向排列,那么结果的排列个数肯定与 X X X的横向排列个数相同。

扩展1:方阵与向量的乘法与线性相关性

对于矩阵和列向量的乘法:
对 于 线 性 齐 次 方 程 组 , 有 A x = 0 ∈ R n 对于线性齐次方程组,有\\ \quad \\ Ax=0\in R^n 线Ax=0Rn
我们知道零向量是矩阵列的线性组合,那么如果矩阵的列向量是线性相关的,就存在非零向量 x x x使方程有解 ,如果矩阵的列是线性无关的,方程的解就只有零向量。

扩展2:方阵间的乘法与秩

对于方阵之间的乘法:
A B = E ∈ R n × n AB=E\in R^{n\times n} AB=ERn×n
我们知道单位矩阵 E E E A A A的列的线性组合的排列,也就是说 A A A的列组合可以表示 E E E的每个列,那么必然有 n ≥ r ( A ) ≥ r ( E ) = n n\ge r(A)\ge r(E)=n nr(A)r(E)=n,则 r ( A ) = n r(A)=n r(A)=n

延伸到向量空间,就能够得到更加本质的结论。

后记

本篇实际上是把矩阵乘法归纳为向量的线性组合。下篇将记录向量空间。

你可能感兴趣的:(概率论与机器学习,线性代数,矩阵)