向量:
在二维空间中,向量表示为
也就是起点(0,0)到一个坐标(x,y)连线就可以构成一个向量,并且指向(x,y)
拓展到n维空间也是一样的,只是没有几何上的直观理解
基:
在我们熟悉的x,y坐标系中,选择两个向量,i=(0,1),j=(1,0)
i和j就可以称为R^2(二维空间)的一个基,容易知道 i和j是线性无关的,也就是不能表达为i = aj这种形式
空间中的一个基的线性组合可以表达任意一个向量,所以基的任意线性组合可以撑满一个R^2空间
i和j是一个比较特殊的基,它们的模都为1,并且是正交的,内积为1,这种基称为标准正交基
实际上空间中存在很多基,只要它们是线性无关,基的所有线性组合就可以撑满整个空间
线性相关,线性无关
线性无关指的是,向量组中的(任意)一个向量无法用向量组中其他向量的线性组合表示出来。换句话说,向量组中的每一个向量都为向量组所张成的空间贡献了一个维度,每一个向量都缺一不可,少了任何一个向量,都会改变向量组所张成的空间。
理解:
设二维空间中有两个向量,x1=[1,0],x2=[2,0]
容易知道x2=2*x1,也就是说x1和x2线性相关,这时两个向量位于同一条直线,这时候可以说两个向量有一个可以看做是多余的,另个向量无论怎么样线性组合都只能撑满一个一维空间
向量之间的运算:
(1)在二维空间里,两个向量进行加法运算根据平行四边形法则就可以得出结果向量
如果把向量看做一种运动就是在对应的维度按照规定的方向走几步
例如 (1,-1)就是沿着x正方向走1步,y的负方向走一步
(1,-1)+(2,3)就是先沿着x正方向走1步,再走2步,y方向同理
(2)一个常数乘以一个向量把这个向量沿着正方向或者反方向拉伸多少倍
向量和矩阵的运算:
给出一个m*n的矩阵我们把n个列向量看成一组基向量,用这些基向量来撑满一个R^m的空间(m维空间),
当然要撑满一个R^m的空间上述的n个列向量必须满足线性无关才行,如果线性无关就只能撑满一个R^m的子空间(比如三维空间中的一个平面)
以二维空间举例:
从这个式子可以看出来,矩阵乘上向量得到的就是把该向量变换(映射到)到矩阵列向量构成的空间中的一个向量
那么这个矩阵表达的是什么呢?可以看做就是把原来的标准的二维坐标轴(也就是i=(0,1,j=(1,0)两个基构成的坐标)变换到这个矩阵列向量构成的坐标轴(向量空间),比如
实际上我觉得直接理解为这样更好,该矩阵表达的就是一组基(如果线性相关了需要剔除一些列向量才能说成一组基),进行所有线性组合后可以构成一个空间
矩阵和矩阵的运算:
矩阵相乘:
上面我们说了一个单独的矩阵表达的意思就是把这标准的空间坐标变换到该矩阵列向量构成的空间坐标,这里的标准空间就是各个基相互正交并且模为1,我们把这段话写成矩阵相乘:
左边的矩阵把标准的空间坐标进行了变换(变换包括旋转和裁剪/shear)
所以矩阵A乘以B相当于把从空间B变换到空间A,无论多少个矩阵相乘比如X1*X2...*Xn相当于就是从Xn这个空间开始依次经过Xn-1,Xn-2...X1的变换,最后变换到一个向量空间
另外要说的是,有了空间的基就能任意描述整个线性空间,所以上面说的空间变换相当于是在对基做变换
将矩阵A的值进行|A|运算,也就是行列式运算得到的值是什么意义呢?
我们熟悉的二维坐标系,其中的两个基为i=(0,1),j=(1,0)
折两个基构成的四边形的面积为1,下面这个矩阵
行列式的值为-5,相当于把原来的标准正交基构成的面积缩放了-5倍,(符号代表方向)
如果行列式的值为0,相当于空间被降维到1维或者0维,这将解释为什么行列式值为0的矩阵不可逆
如果是更高维度,比如3维那么行列式的值可以对应体积,
但是更高维度就没有几何意义了
A*A^-1=E
加入A矩阵时将坐标轴逆时针旋转90度,那么A^-1就是将逆时针旋转90度后的坐标轴顺时针旋转90度变为原来的坐标
如果A的行列式的值为0那么相当于变换为一个一维或者0维空间,此时无法逆变换为原来维度的空间了,因为信息不够
A*X=V(线性方程写成矩阵乘向量形式)
也就是找到一个向量X再经过A变换后和b向量重合,如下
一个矩阵的秩代表将该标准正交基构成的空间变换到该矩阵构成的空间后,该空间的维度
形如上面的式子,我们称lambda为特征值,v为特征向量
特征向量就是矩阵A在做坐标变换时那些没有旋转过的变量,也就是在标准正交基的坐标中和变换后的坐标中这个向量的位置没有改变过,但是可能被拉伸过,而拉伸的度量就是lambda