笔记标题:MIT_LA_Lecture4-8
笔记版本:v1.0
对于文档的说明:
对于内容的说明:
.
用来表示元素省略,并不表示元素为0。在上一节中,我们知道通过高斯消元法可以容易地求解线性方程组,用矩阵表示即
我们先不考虑行的交换,观察
我们可以发现,E除了初等行变换信息(即E中的-3,-2两项),还多了一个额外信息-6,这个是我们不想要的信息,那么有没有只包含行变换信息的分解或等式呢?有,这就是我们即将介绍的LU分解。
在线性代数与数值分析中,LU分解是矩阵分解的一种,将一个矩阵分解为一个 下三角矩阵和一个 上三角矩阵的乘积,有时需要再乘上一个 置换矩阵。LU分解可以被视为高斯消元法的矩阵形式。在数值计算上,LU分解经常被用来解线性方程组、且在求反矩阵和计算行列式中都是一个关键的步骤。
--维基百科
仍先不考虑行变换,LU分解简单地说就是
可以看到, L除了是下三角阵外,还包含且仅包含了矩阵行变换的所有信息。同时我们有以下结论:
这样,当我们通过高斯消元法变换矩阵后,就能立即写出
总之,对于
除了上面给出的LU分解,有些矩阵还能进行PLU分解和LDU分解。
方阵 A 的 PLU 分解是是将它分解成一个置换矩阵 P、一个下三角矩阵 L 与上三角矩阵 U 的乘积,即:
事实上,所有的方阵都可以写成 PLU 分解的形式,由于左乘排列矩阵
有时为了计算上的方便,会同时间换行与列的顺序,此时会将 A 分解成:
其中 P、L、U 同上,Q 是一个置换矩阵(这里是右乘以交换列)。
方阵 A 的 LDU 分解是是将它分解成一个单位下三角矩阵 L、对角矩阵 D 与单位上三角矩阵 U 的乘积,即
其中单位上、下三角矩阵是指对角线上全是 1 的上、下三角矩阵。
事实上,LDU 分解可以推广到 A 是一般的矩阵,而非方阵。此时,L 和 D 是方阵,并且与 A 有相同的行,U 则有和 A 相同的长宽。注意到现在 U 是上三角的定义改为主对角线的下方都是 0,而主对角线是收集所有
我们将(3)中的A=LU分解再进一步化为LDU分解:
关于高斯消元算法的复杂度:
转置矩阵(transpose)有很多值得我们记住的基本的性质,对于矩阵A, B和标量c,转置矩阵有下列性质:
还有比如我们刚刚学到的:
当然,还有一些之后会学到的:
其转置等于自身的方块矩阵叫做对称矩阵。
其转置也是它的逆矩阵的方块矩阵叫做正交矩阵;就是说G是正交的,如果
其转置等于它的负矩阵的方块矩阵叫做斜对称矩阵;就是A是斜对称的,如果
在以上的消元的讨论中,我们为了方便都事先假定不需要进行行的交换,如果需要考虑这些行交换或列交换,A=LU分解就不能完全表示出矩阵消元的所有信息了,这个时候我们需要在LU左边乘上一个置换矩阵,用以记录行交换的信息,从而我们得到了A=PLU分解;当然,有时候我们也会进行列交换,那么同样地在LU右端乘上一个置换矩阵,就得到了A=PLUQ分解。
在数学中的矩阵论里,置换矩阵(permutation matrix)是一种系数只由0和1组成的方块矩阵。置换矩阵的每一行和每一列都恰好有一个1,其余的系数都是0。在线性代数中,每个n阶的置换矩阵都代表了一个对n个元素(n维空间的基)的置换。当一个矩阵乘上一个置换矩阵时,所得到的是原来矩阵的横行(置换矩阵在左)或纵列(置换矩阵在右)经过置换后得到的矩阵。
来自维基百科。
我们考虑n=3时的置换矩阵,一共有以下6个:
相应地,左乘分别代表不变,交换2、3行,交换1、2行等;右乘分别代表不变,交换2、3列,交换1、2列等。
什么是空间?如果让一只蚂蚁沿着一条细绳爬行,那么对蚂蚁来说,空间就是一条直线
而数学上,空间是指一种具有特殊性质及一些额外结构的集合,也就是说,我们规定一些性质或结构,若集合能满足这些要求,那它就是一个我们规定的某种空间。在数学上,空间可以有很多种,比如函数空间、仿射空间、概率空间等等,向量空间也是规定的一种满足特定性质和要求的元素的集合。
那么,从这个定义来说,向量空间里的元素只要满足这些要求就行了,是不是向量空间里的元素不是向量也可以呢?还真是这样。向量空间的元素还可以是函数、矩阵、多项式、映射等等,只要这些元素满足向量空间的所规定的线性运算规律就好了。
但正如名字所示,我们最常见和研究的向量空间还是一些有序数组,也就是向量的集合,这一节我们还是以它为主介绍。
那么,向量空间应该满足什么性质呢?
设V为n维向量的集合,如果集合V非空,且集合V对于向量的加法及数乘两种运算封闭,那么就称集合V为向量空间。所谓封闭,是指在集合V中可以进行向量的加法及数乘两种运算。具体地说:
当然,我们这里前提还是以有序数组,即向量为对象考虑的,对于一般化的向量空间,我们会在后面介绍。
在思考这个问题之前,我们先回过头看一看(6)这个定义,其中
同样地,我们还能举出一个例子
还有哪些呢?比如我们考虑
我们再考虑
现在我们再加上最开始考虑的零向量和
首先是零向量,然后是
我们知道了
一个集合A首先应该是一个向量空间,其次它是另一个向量空间V的子集,这样它就是这个向量空间V的子空间。
那么,是在
设V为向量空间,如果r和向量
那么,向量组
如果向量空间V没有基,那么V的维数是0。0维向量空间只含一个零向量
以上,我们介绍了向量空间的概念, 接下来介绍两种常用的向量空间来帮助理解和求解线性方程组
设一m 行 n列实元素矩阵为
矩阵A的列空间C(A)中的所有向量均为矩阵A中列向量的某种线性组合,都为
C(A)的维度等于矩阵A的列秩,最大为
列空间C(A)的一组自然基底是矩阵A的列向量的最大线性无关组。
我们考虑以下线性方程组
我们很容易验证列空间
A的列空间
那么,由(8)可知,求解线性方程组从列向量角度讲,本质就是
对于所有使齐次线性方程组
零空间是一个向量空间。当A为m行n列实元素矩阵,所以
所以
很容易知道,
比如我们考虑例(8)所对应的其次线性方程组:
很明显,一个解为
我们可以设非零解为
我们知道A三个列向量的前两个列向量线性无关,也就是前两列是C(A)的一个基,第三列可以表示成前两列的线性组合:
这种表示方法一定是唯一的。因为若有
那么
有了以上特例分析作为基础,我们就能容易地推广到一般情况。
对于一般的m行n列矩阵A,考虑A的列向量
这里的基虽然在原列向量内,不一定就是最左边的r列,但是可以通过交换列向量得到这种形式,相应的零空间内各列向量的位置也需要做相应的调换,比如交换2、4列的位置,那么零空间向量相应交换2、4行的位置,变成,但这并不会影响零空间维数这个结果,我们这么做只是为了方便地分析问题。
我们任意从后面n-r个列向量中取某个
成立的
尝试写出这n-r个向量:
这下我们就能很容易看出为什么要取一个为1,其他都为0,目的就是为了一定能得到n-r个线性无关且各自唯一表示的列向量。
那么有可能还有其他的线性无关的向量吗?
也就是比如我们再随便给出一个列向量:
想要使
我们用反证法来证明这个命题,现在有一个
简写为:
关键来了,
然后我们在(15)等式两端乘以A,便得到:
再以列向量的线性组合表示出来:
由(18)式,我们得到了
当然,以上这种证明只是我自己做笔记时想出来的,肯定很繁琐,之后学习了矩阵的秩会有相关性质进行简洁的证明。
综合列空间,我们可以得到,对于
列空间和零空间对于理解非齐次线性方程组的解是非常有帮助的,列空间告诉我们什么时候有解什么时候无解,零空间告诉我们,解的结构应该是什么样子。
考虑以下A,并进行行变换得到简化阶梯型矩阵R:
现在,记:
那么R可以表示为:
设
接下来计算RN:
这样我们就找出了
第一步,通过消元找出R。
第二步,找出主元变量和自由变量。
第三步,给自由变量赋值0和1,并通过回代解出主变量。
举个例子:
由(23)可知解的形式为:
所以原齐次线性方程组的通解为:
其中,k为任意实数。
在了解了列空间和零空间之后,就可以对
以下两命题等价:
具体而言,n元线性方程组
接下来从简化行阶梯型R来分类:
非齐次线性方程组