线性代数说到底还是在研究线性关系。
线性方程可以表示成如下形式:
a 1 x 1 + a 2 x 2 = b 1 a 3 x 1 + a 4 x 2 = b 2 . . . a n − 1 x 1 + a n x 2 = b n a_1x_1+a_2x_2=b_1 \\ a_3x_1+a_4x_2=b_2 \\ ... \\ a_{n-1}x_1+a_nx_2=b_n a1x1+a2x2=b1a3x1+a4x2=b2...an−1x1+anx2=bn
也就是多元方程组。
如果我们直接解这些方程会非常繁琐,将这些线性方程换一种表达方法会简化我们的运算,“把握变量中的不变量。”,也就是变量 x x x前面的系数。
如果上述线性方程组改写成矩阵形式就是:
[ a 1 a 2 a 3 a 4 ⋮ ⋮ a n − 1 a n ] [ x 1 x 2 ] = [ b 1 b 2 ⋮ b n ] \begin{bmatrix} a_1 &a_2 \\a_3 & a_4\\ \vdots & \vdots \\ a_{n-1}&a_n \end{bmatrix} \begin{bmatrix}x_1\\x_2\end{bmatrix}=\begin{bmatrix}b_1\\b_2\\ \vdots \ \\ b_n\end{bmatrix} ⎣⎢⎢⎢⎡a1a3⋮an−1a2a4⋮an⎦⎥⎥⎥⎤[x1x2]=⎣⎢⎢⎢⎡b1b2⋮ bn⎦⎥⎥⎥⎤
以上形式就是 A x = b \bold Ax=b Ax=b的形式。
向量就是有方向有大小的量。
向量的运算:
在向量的基础上构建矩阵的概念是很自然的,简言之,矩阵就是把这些向量堆在了一起,比如上文中的矩阵 A = [ a 1 a 2 a 3 a 4 ⋮ ⋮ a n − 1 a n ] = [ c d ] \bold A = \begin{bmatrix} a_1 &a_2 \\a_3 & a_4\\ \vdots & \vdots \\ a_{n-1}&a_n \end{bmatrix}=\begin{bmatrix} \bold c&\bold d \end{bmatrix} A=⎣⎢⎢⎢⎡a1a3⋮an−1a2a4⋮an⎦⎥⎥⎥⎤=[cd]
其中 c \bold c c, d \bold d d均为向量(加粗表示向量),那么上文中的方程 A x = b \bold Ax=b Ax=b就可以表示为 c x 1 + d x 2 = b \bold cx_1+\bold dx_2=\bold b cx1+dx2=b,这类式子就被称为线性组合。(这里的向量 c d \bold c\ \bold d c d指的是列向量)
在本例中,如果从行视角来看待这个矩阵的话,就是一条条直线(形式就是 a x + b = c ax+b=c ax+b=c,如果有三个变量就是一个平面)。如果从列的角度来说,就是两个多维向量的线性组合。
可能这一节的叫法没有那么精确,之所以我称它为代数解法是因为对矩阵做的一些最基本的行消去运算本质上和初高中求解线性方程组的方法没什么区别。
a) Replacement
数乘其他的行与本行相加或相减。
b) Interchange
交换矩阵的两行
c) Scaling
对一行的所有元素进行数乘。
矩阵的阶梯型是由基本行变换获得的,它有如下的三个特点
- All nonzero rows are above any rows of all zeros.
- Each leading entry of a row is in a column to the right of the leading entry of the row above it.
- All entries in a column below a leading entry are zeros.
第二条,每一行的主元都在上一行主元的右侧。
- The leading entry in each nonzero row is 1.
- Each leading 1 is the only nonzero entry in its column
每一行的第一个非零元素都是1;每个1都是其所处列的唯一一个非零元素。
An elementary matrix is one that is obtained by performing a single elementary row operation on an identity matrix. The next example illustrates the three kinds of elementary matrices.
初等矩阵,记作 E E E,是通过对单位矩阵进行一次基本行变换得到的,一个矩阵乘上初等矩阵( E A EA EA)的效果就是对该矩阵进行基本行变换。
比如:
E = [ 1 0 0 0 1 0 − 3 0 1 ] , A = [ a b c d e f g h i ] E=\begin{bmatrix}1&0&0\\0&1&0\\-3&0&1\end{bmatrix},\ A=\begin{bmatrix}a&b&c\\d&e&f\\ g&h&i\end{bmatrix} E=⎣⎡10−3010001⎦⎤, A=⎣⎡adgbehcfi⎦⎤
E A = [ a b c d e f g − 3 a h − 3 b i − 3 c ] EA=\begin{bmatrix}a&b&c\\d&e&f\\g-3a&h-3b&i-3c\end{bmatrix} EA=⎣⎡adg−3abeh−3bcfi−3c⎦⎤
向量 x 1 , x 2 , , ⋯ , x n \bold {x_1},\ \bold{x_2},\ ,\cdots, \bold{x_n} x1, x2, ,⋯,xn线性无关的条件是:
它们的非零线性组合不会产生 0 \bold 0 0向量,也就是
c 1 x 1 + c 2 x 2 + ⋯ + c n x n ≠ 0 c_1\bold{x_1}+c_2\bold{x_2}+\cdots+c_n\bold x_n\ \ \neq\bold 0 c1x1+c2x2+⋯+cnxn =0
不满足上述条件的一组向量就被称为线性相关。
以上条件的推论:
如果矩阵A的零空间(下文有定义)只有0向量,那么矩阵 A A A的列向量就是线性无关的。
如果矩阵 A n × n A_{n\times n} An×n中的列向量可以张成整个 R n R^n Rn,则这些列向量是线性无关的。
向量空间需要满足以下几点条件:
矩阵 A A A的列空间就是由矩阵中的向量所张成的空间。
矩阵 A A A的零空间就是由齐次线性方程组 A x = 0 Ax=0 Ax=0的解构成的空间。零空间一定包含0向量。
(需要注意!线性方程组 A x = b Ax=b Ax=b的解不能构成子空间,因为子空间必须经过原点)
行空间和左零空间本质上就是矩阵 A T A^T AT的列空间和零空间。
由上文可知,左零空间是矩阵 A T A^T AT的零空间,由零空间的定义我们可以得到:
A T x = 0 A^Tx=0 ATx=0
两边同时转置之后可以得到:
x T A = 0 x^TA=0 xTA=0
这里的 x T x^T xT就是矩阵 A A A的左零空间。
上一节是关于矩阵的四个基本子空间是什么的问题。这一节主要关注这四个字空间的维度。
如果一个矩阵 A A A的维度是 m × n m\times n m×n,且它的秩是 r r r(主元数量),那么: