MIT18.06线性代数 笔记1

文章目录

    • 方程组的几何解释
    • 矩阵消元
    • 乘法和逆矩阵
    • A的LU分解
    • 转置-置换-向量空间R
    • 列空间和零空间
    • 求解Ax=0主变量 特解
    • 求解Ax=b可解性和解的结构
    • 线性相关性、基、维数
    • 四个基本子空间
    • 矩阵空间、秩1矩阵和小世界图
    • 图和网络
    • 复习一

方程组的几何解释

线性组合:

MIT18.06线性代数 笔记1_第1张图片

找到合适的x和y的线性组合,从而让col1和col2组合得到结果b向量

MIT18.06线性代数 笔记1_第2张图片

3x3矩阵:

MIT18.06线性代数 笔记1_第3张图片

对于任何b都有Ax = b吗? == 列的线性组合能否覆盖整个三维空间?

三个向量(A的三个列)在同一平面时不行

两种方法的矩阵乘法:

按列求:

MIT18.06线性代数 笔记1_第4张图片

按行求:一行乘一列

A乘以x看作A各列的线性组合


矩阵消元

矩阵消元:

MIT18.06线性代数 笔记1_第5张图片

U是A的最终结果

增广矩阵:

MIT18.06线性代数 笔记1_第6张图片

c是b的最终结果

矩阵x列=列

行x矩阵=行

B的第二行减去3倍的第一行:

A x B = C

A第一行a1,bc为0=取B的第1倍,其他行不取

A第二行a-3b1=取B的第行的-3倍,第行的1倍,二者相加

MIT18.06线性代数 笔记1_第7张图片

A为初等矩阵E21
E 32 ( E 21 A ) = U ( E 32 E 21 ) A = U \begin{aligned} E_{32}(E_{21}A) &= U\\ (E_{32}E_{21})A &= U \end{aligned} E32(E21A)(E32E21)A=U=U
交换列:

MIT18.06线性代数 笔记1_第8张图片

E x A 变换行,A x E变换列

逆变换:

行二减去三倍行一 => 行二加上三倍行一

MIT18.06线性代数 笔记1_第9张图片


乘法和逆矩阵

MIT18.06线性代数 笔记1_第10张图片

A乘以 B的各个列向量 得到C的列向量 = C中各列是A中各列的线性组合

MIT18.06线性代数 笔记1_第11张图片

A乘以 B的各个行向量 得到C的行向量 = C中各行是B中各行的线性组合

如:A中某行的各个值(1 2 3)等于B中各行
[ a b c d e f g h i ] \begin{bmatrix} a & b & c \\ d & e & f \\ g & h & i \end{bmatrix} adgbehcfi
的对应倍数
a b c 2 d 2 e 2 f 3 g 3 h 3 i \begin{matrix} a & b & c \\ 2d & 2e & 2f \\ 3g & 3h & 3i \end{matrix} a2d3gb2e3hc2f3i
相加(a+2d+3g b+2e+3h c+2f+3i)就是C的对应行

列同理

求矩阵相乘有四种方法:

  1. 常规方法:一行乘一列得一个值
  2. 列方法:C的列是A的各列的线性组合,一次求一列
  3. 行方法:C的行是B的各行的线性组合,一次求一行
  4. 列乘行:MIT18.06线性代数 笔记1_第12张图片
  5. 分块:MIT18.06线性代数 笔记1_第13张图片

对于方阵:
A − 1 A = I = A A − 1 A^{-1}A=I=AA^{-1} A1A=I=AA1
矩阵没有逆:

  1. 无法通过线性组合矩阵的各行得到(1 0 0 …)等等单位矩阵的各行(行方向在同一直线上),列同理
  2. 满足MIT18.06线性代数 笔记1_第14张图片这样的矩阵没有逆(x不是0向量)

如果矩阵其中一列对线性组合毫无贡献,矩阵不可能有逆

高斯-若尔当消元:

image-20231111230007216

MIT18.06线性代数 笔记1_第15张图片
E [ A I ] = [ I ? ] E A = I tell us E = A − 1 E\begin{bmatrix}A & I\end{bmatrix} =\begin{bmatrix}I & ?\end{bmatrix}\\ EA=I \\ \text{tell us} \\ E=A^{-1} E[AI]=[I?]EA=Itell usE=A1


A的LU分解

MIT18.06线性代数 笔记1_第16张图片

A的转置的逆等于A的逆的转置
E A = U E [ 2 1 8 7 ] = [ 2 1 0 3 ] \begin{aligned} EA &= U \\ E \begin{bmatrix} 2 & 1\\ 8 & 7 \end{bmatrix} &= \begin{bmatrix} 2 & 1\\ 0 & 3 \end{bmatrix} \end{aligned} EAE[2817]=U=[2013]

A = L U [ 2 1 8 7 ] = L [ 2 1 0 3 ] \begin{aligned} A &= LU\\ \begin{bmatrix} 2 & 1\\ 8 & 7 \end{bmatrix} &=L \begin{bmatrix} 2 & 1\\ 0 & 3 \end{bmatrix} \end{aligned} A[2817]=LU=L[2013]

可见
E = E 1 E 2 E 3 L = E − 1 L = E 3 − 1 E 2 − 1 E 1 − 1 E = E_{1}E_{2}E_{3}\\ L = E^{-1}\\ L = E_{3}^{-1}E_{2}^{-1}E_{1}^{-1} E=E1E2E3L=E1L=E31E21E11
在该例中,L为
[ 1 0 4 1 ] \begin{bmatrix} 1 & 0\\ 4 & 1 \end{bmatrix} [1401]
对角线为1的下三角阵(lower),U为对角线上是主元的上三角阵(upper)

将主元单拎出来:
在这里插入图片描述

这里,4是消元乘数,那么:

如果没有行交换,消元乘数可以直接写入单位矩阵中组成L

nxn矩阵的消元需要
n 2 + ( n − 1 ) 2 + ( n − 2 ) 2 + ⋯ + 2 2 + 1 2 n^2+(n-1)^2+(n-2)^2+\dots+2^2+1^2 n2+(n1)2+(n2)2++22+12
次操作(不是行操作而是值操作)

置换矩阵:其逆等于其转置


转置-置换-向量空间R

上一节讨论不需要行交换的情况,对于行需要交换的:
P A = L U PA=LU PA=LU
P即为置换矩阵,将A的行交换成正确的样子的、行重新排列了的单位矩阵

nxn置换矩阵的个数:n!

置换矩阵可逆,且其逆等于其转置

转置:(AT)i,j=Aj,i

对称矩阵:转置后等于自身

所有RTR结果都是对称矩阵:
( R T R ) T = R T R (R^TR)^T=R^TR (RTR)T=RTR

向量空间必须要对数乘封闭,即一个向量乘以任何数都在这个向量空间内,此时向量空间为一条该向量所在的直线(子空间),过原点(因为要允许乘0)

子空间是向量空间内的向量空间,即某些向量在母空间,而其本身也构成向量空间

R2的子空间:

  1. R2平面
  2. 任意过原点的直线
  3. 0原点

R3的子空间:

  1. R3空间
  2. 任意过原点的平面
  3. 任意过原点的直线
  4. 0原点

对于一个矩阵,它的列的任意一种线性组合而成的向量都在向量子空间,又称列空间


列空间和零空间

空间中有平面P和直线L两向量空间,两者相交于原点,两者的并集不构成向量空间,因为对于并集中的向量相加,结果不在并集中:对加法不封闭。而交集构成向量空间。

向量加法和数乘是子空间中必须封闭的运算

A是4x3矩阵,那么A的列空间就是R4的子空间,由所有列的线性组合构成,换句话说,只有当b为A中各列的线性组合时,b才是Ax=b的解,此时b在A的列空间内

线性无关:A中各列进行线性组合,其中每一列都对组合有所贡献,换句话说,无法去掉某列得到相同的列空间,有贡献的列称为主列

零空间:x构成的向量空间(因为Av=0,Aw=0,A(v+w)=0,vw加和还在范围内,所以构成向量空间),使得Ax=0,此时x可以取数乘cx,在R3中表示为一条过原点的直线

而对于Ax=b,b!=0,解x必须包含0才能构成向量空间,因为所有向量空间必须过原点


求解Ax=0主变量 特解

消元不改变零空间(方程组解)

消元后非主元所在列对应的未知量为自由变量,表示可以自由取值。

秩 = 主元个数

特解:自由变量取值后,连带产生的解的任意倍

特解的线性组合(任意倍、相加)就是零空间

MIT18.06线性代数 笔记1_第17张图片

简化行阶梯型矩阵:主元上下都是0

经典行简化阶梯型(行交换后):
R = [ I F 0 0 ] R = \begin{bmatrix} I & F\\ 0 & 0 \end{bmatrix} R=[I0F0]
要求x就是求:
R x = 0 Rx=0 Rx=0
x由多个特解线性组合而成,这些特解作为列构成的矩阵叫做零空间矩阵N,此时
R N = 0 [ I F 0 0 ] [ − F I ] = 0 \begin{aligned} RN &= 0 \\ \begin{bmatrix} I & F\\ 0 & 0 \end{bmatrix} \begin{bmatrix} -F \\ I \end{bmatrix} &=0 \end{aligned} RN[I0F0][FI]=0=0
这样就能快速找到零基(F的列数决定I的列数)


求解Ax=b可解性和解的结构

Ax=b仅当b属于A的列空间时成立

A的行的线性组合产生了零行,则相同的线性组合将让b也产生0

特解:增广矩阵消元后保证零行等于0,然后指定自由变量为0,求出一个特解xp

通解:x=xp+xn,特解加零特解的线性组合
A x p = b A x n = 0 A ( x p + x n ) = b Ax_p=b\\ Ax_n=0\\ A(x_p+x_n)=b Axp=bAxn=0A(xp+xn)=b
MIT18.06线性代数 笔记1_第18张图片

其间的关系有点类似于二维直线y=a+cx,y=cx过原点,y=a+cx移动a过a。这个解的图像也是后面零解过原点(因为是零空间)而加上特解,则过特解

列满秩r=n:没有自由变量,也就是没有F,所以求零解时不能自由赋值,此时零空间N(A)只有零向量,Ax=b的解空间如果解存在则只有唯一解x=xp

行满秩r=m:消元时没有零行,那么对于任意b,Ax=b都有解。自由变量为n-r个

方阵满秩r=m=n:可逆矩阵,零空间只包含零向量,Ax=b有解

MIT18.06线性代数 笔记1_第19张图片

矩阵的秩决定了方程组解的数目


线性相关性、基、维数

线性相关性:向量组中有0个向量的话一定相关,因为
0 ⋅ v 1 + 0 ⋅ v 2 + n ⋅ 0 = 0 0 \cdot v_1 + 0 \cdot v_2 + n \cdot 0 = 0 0v1+0v2+n0=0
组合(非零组合 0 0 n)得到0向量

A = [ v 1 v 2 … v n ] A= \begin{bmatrix} v_1 & v_2 & \dots & v_n \end{bmatrix} A=[v1v2vn]
若v1,v2,…,vn不相关,则零空间只有0向量,r=n无自由变量。反之若Ac=0,c != 0,则相关,r < n有自由变量

向量"生成"(span)空间:空间包含这些向量的所有线性组合(最小)

向量空间的一组"基":一组1. 线性无关 2. 生成整个空间 的向量——主列

当nxn方阵可逆时,其向量空间为Rn

对于给定空间,空间中任意一组基的向量数目相等,此处的基向量数目就是维数

(列)空间的维数 <=> 基向量组成的矩阵的rank

已知维数,有一些线性无关的向量,则其中维数个向量组成一组基

零空间的维数 = 自由变量个数


四个基本子空间

对于mxn矩阵的四个基本子空间:

  1. 列空间C(A):A的列的所有线性组合,在Rm
  2. 零空间N(A):在Rn
  3. 行空间C(AT):A的行的所有线性组合,在Rn
  4. 左零空间N(AT):在Rm

列向量矩阵的秩 = 行向量的矩阵的秩 = r = 主元数

列空间的维数 = 行空间的维数 = r

零空间的维数 = n - r

左零空间的维数 = m - r

n - r :特解个数

行变换下影响行空间,但影响列空间

行空间的基 = 行最简型R的前r行

左零空间:

为什么叫左零空间:
A T y = 0 y T A = 0 A^Ty=0 \\ y^TA=0 ATy=0yTA=0

左零空间的基:

化行简化型

r r e f [ A I ] → [ R E ] rref \begin{bmatrix} A & I \end{bmatrix}\rightarrow \begin{bmatrix} R & E \end{bmatrix} rref[AI][RE]

E A = R EA=R EA=R

此时R中的零行对应的E中的行即为左零空间的基

eg:
[ − 1 2 0 1 − 1 0 ( 1 0 1 ) ] A = [ 1 0 1 1 0 1 1 0 ( 0 0 0 0 ) ] \begin{bmatrix} -1 & 2 & 0 \\ 1 & -1 & 0 \\ (1 & 0 & 1) \end{bmatrix} A= \begin{bmatrix} 1 & 0 & 1 & 1 \\ 0 & 1 & 1 & 0 \\ (0 & 0 & 0 & 0) \end{bmatrix} 11(1210001) A= 10(0010110100)

矩阵服从向量空间的运算率,可以把矩阵看作"向量",虽然矩阵可相乘,但把矩阵看作向量空间时,只考虑相加、数乘

MIT18.06线性代数 笔记1_第20张图片

此处,对角线矩阵空间的一个基为
[ 1 0 0 0 0 0 0 0 0 ] , [ 1 0 0 0 2 0 0 0 0 ] , [ 0 0 0 0 0 0 0 0 1 ] \begin{bmatrix} 1 & 0 & 0\\ 0 & 0 & 0\\ 0 & 0 & 0\\ \end{bmatrix}, \begin{bmatrix} 1 & 0 & 0\\ 0 & 2 & 0\\ 0 & 0 & 0\\ \end{bmatrix}, \begin{bmatrix} 0 & 0 & 0\\ 0 & 0 & 0\\ 0 & 0 & 1\\ \end{bmatrix} 100000000 , 100020000 , 000000001


矩阵空间、秩1矩阵和小世界图

以3x3矩阵为例,M为所有3x3矩阵构成空间

需要9个矩阵:
[ 1 0 0 0 0 0 0 0 0 ] , [ 0 1 0 0 0 0 0 0 0 ] , … , [ 0 0 0 0 0 0 0 0 1 ] \begin{bmatrix} 1 & 0 & 0\\ 0 & 0 & 0\\ 0 & 0 & 0\\ \end{bmatrix}, \begin{bmatrix} 0 & 1 & 0\\ 0 & 0 & 0\\ 0 & 0 & 0\\ \end{bmatrix},\dots, \begin{bmatrix} 0 & 0 & 0\\ 0 & 0 & 0\\ 0 & 0 & 1\\ \end{bmatrix} 100000000 , 000100000 ,, 000000001
构成一组基

M的维度为9,对称矩阵空间(S)维度=6,上三角矩阵空间(U)维度=6
维度 d i m ( 更小的子空间 S ∪ U ) = 3 \text{维度}dim(\text{更小的子空间}S \cup U)=3 维度dim(更小的子空间SU)=3
当S∪U时,产生的不是子空间,需要补充:S+U (S和U的组合)取S的任一矩阵+U的任一矩阵 。这里的空间包含所有3x3矩阵
d i m ( S + U ) = 9 dim(S+U)=9 dim(S+U)=9

d i m ( S ) + d i m ( U ) = d i m ( S ∪ U ) + d i m ( S + U ) dim(S)+dim(U)=dim(S \cup U)+dim(S+U) dim(S)+dim(U)=dim(SU)+dim(S+U)

秩1矩阵:如
在这里插入图片描述

可以把秩为4的矩阵分解为4个秩1矩阵

而两个秩为4的矩阵相加结果的秩通常不为4

行空间维数+零空间维数=行数

列空间维数+左零空间维数=列数

小世界图:“六分度猜想”,每个人至多通过六个人可以认识任何人,这样一个人与人的关系图


图和网络

MIT18.06线性代数 笔记1_第21张图片

与回路对应的行是线性相关的,如第1、2、3行

对于这样的矩阵的零空间Ax=0,将x视为结点电势,则结果:MIT18.06线性代数 笔记1_第22张图片

可以看作结点间电势差,此时各点电势差为零,节点间没有电流

xi-xj电势差通过欧姆定律得到结点间电流y,对于左零空间ATy=0,即基尔霍夫电流定律(KCL)

对于左零空间的基,表现为满足基尔霍夫电流定律(流入=流出)的一组向量,每个元素是结点电流:

MIT18.06线性代数 笔记1_第23张图片

这里两个向量是无关的,即两个回路不产生嵌套,大的外城回路由两个小的回路组成

矩阵的主行对应的边组成了个没有回路的图(树),相关性均源自于回路

d i m N ( A T ) = m − r 相互无关的回路数量loops = 边的数量edges − ( 结点数量nodes − 1 ) n o d e s − e d g e s + l o o p s = 1 (欧拉公式) \begin{aligned} dim N(A^T) &= m-r\\ \text{相互无关的回路数量loops} &= \text{边的数量edges}-(\text{结点数量nodes}-1)\\ nodes - edges + loops &= 1 (欧拉公式) \end{aligned} dimN(AT)相互无关的回路数量loopsnodesedges+loops=mr=边的数量edges(结点数量nodes1)=1(欧拉公式)
r=n-1(n为结点数即列数)

回到电路
[ x i − x j … ] ⇒ e = A x 电势差 [ e 1 … ] ⇒ y = C e 电流 [ y 1 … ] \begin{bmatrix} x_i-x_j\\ \dots \end{bmatrix} \Rightarrow ^{e=Ax} \text{电势差}\begin{bmatrix} e_1\\ \dots \end{bmatrix} \Rightarrow ^{y=Ce} \text{电流}\begin{bmatrix} y_1\\ \dots \end{bmatrix} [xixj]e=Ax电势差[e1]y=Ce电流[y1]
总的来说:
A T C A x = f 加上电流源 A^TCAx=f\text{加上电流源} ATCAx=f加上电流源


复习一

已知 A x = [ 2 4 2 ] , 通解 x = [ 2 0 2 ] + c [ 1 1 0 ] + d [ 0 0 1 ] 已知Ax= \begin{bmatrix} 2 \\ 4 \\ 2 \end{bmatrix} ,通解x= \begin{bmatrix} 2 \\ 0 \\ 2 \end{bmatrix}+ c\begin{bmatrix} 1 \\ 1 \\ 0 \end{bmatrix}+ d\begin{bmatrix} 0 \\ 0 \\ 1 \end{bmatrix} 已知Ax= 242 ,通解x= 202 +c 110 +d 001

求行空间的维数:r=n-dimN(A)=n-2=1 (n可由b知为3)

求A,将特解(2 0 2)代入Ax=(2 4 2),得a1=(1 2 1)

将特解(1 1 0)代入Ax=0,得a2=(-1 -2 -1)

将特解(0 0 1)代入Ax=0,得a3=(0 0 0)

使Ax=b成立的b的条件:b是A中列向量的线性组合

所有同阶可逆矩阵不能组成子空间,因为可逆矩阵相加不能保证结果可逆

B 2 = 0 ⇏ B = 0 B = [ 0 1 0 0 ] B^2=0 \nRightarrow B=0 \\ B= \begin{bmatrix} 0 & 1\\ 0 & 0 \end{bmatrix} B2=0B=0B=[0010]
nxm,满秩矩阵Ax=b(可逆),对任意b有解

若C可逆,N(CD)=N(D)
已知 B = C D = [ 1 1 0 0 1 0 1 0 1 ] [ 1 0 − 1 2 0 1 1 − 1 0 0 0 0 ] 已知B=CD= \begin{bmatrix} 1 & 1 & 0\\ 0 & 1 & 0\\ 1 & 0 & 1 \end{bmatrix} \begin{bmatrix} 1 & 0 & -1 & 2\\ 0 & 1 & 1 & -1\\ 0 & 0 & 0 & 0 \end{bmatrix} 已知B=CD= 101110001 100010110210
不计算B,求B零空间的基(即N(D))
b a s i s = [ 1 − 2 − 1 1 1 0 0 1 ] basis= \begin{bmatrix} 1 & -2\\ -1 & 1\\ 1 & 0\\ 0 & 1 \end{bmatrix} basis= 11102101

v = [ 1 2 3 ] 不能既是 A 的一行,又在 A 的零空间内 [ X X X 1 2 3 X X X ] [ 1 2 3 ] ≠ [ 0 0 0 ] v=\begin{bmatrix} 1\\ 2\\ 3 \end{bmatrix} 不能既是A的一行,又在A的零空间内\\ \begin{bmatrix} X & X & X\\ 1 & 2 & 3\\ X & X & X \end{bmatrix} \begin{bmatrix} 1\\ 2\\ 3 \end{bmatrix}\not= \begin{bmatrix} 0\\ 0\\ 0 \end{bmatrix} v= 123 不能既是A的一行,又在A的零空间内 X1XX2XX3X 123 = 000

行空间和零空间的交集只有零向量

你可能感兴趣的:(MIT18.06线性代数,线性代数,笔记,决策树)