理解这个主题的方法是举例说明。我们以两个极其简单的方程开始,可以说大家在没有学习线性代数课程的情况下都能解决。不过我希望可以给高斯一个机会:
第一种方法主要看每个方程(行)。这是大家最熟悉的,对于两维的情况我们可以很快理解。方程 2x−y=1 表示 x−y 平面上的一条直线。该直线经过点 x=1,y=1 和 x=12,y=0 (也通过(2,3)和所有的中间点)。第二个方程 x+y=5 得到另一条线(图1a)。它的斜率是 dy/dx=−1 并且它与第一条线相交。
交点位于两条线上。它是这两个方程的唯一解。通过“消去法”可以快速的求出点 x=2,y=3 。
第二种方法是将线性系统看成列。两个独立方程实际是一个向量方程:
对这个例子再花点时间,我会前进一步,令 n=3 。三个方程仍然是可控的并且他们有更多的变形:
最后,第三个平面与这条直线交于一点。第三个方程 −2u+7v+2w=9 表示一个平面(未绘制),它通过点 u=1,v=1,w=2 。三个都相交的点 (1,1,2) 就是线性方程的解。
这个行图像如何扩展到 n 维呢?n个方程包含 n 个未知数。第一个方程仍然决定一个“平面”。不过它不再是三维空间里的二维平面;某种程度上来说,它是的维度是n−1。在 n 为空间里它必须是平的,并且非常薄。
如果时间是第四个维度,那么平面t=0削减了四维空间,产生了我们生活的三维宇宙(或相反,宇宙就是四维空间中 t=0 )。另一个平面是 z=0 ,这也是三维的;它就是普通的 x−y 平面,此时该平面覆盖了所有时间。这些三维平面也会相交!他们共享 t=0 处的 x−y 平面。我们现在降到两个维度,下一个平面留下了一条直线。最后,第四个平面留下了一个点。它是四维空间中四个平面的交点,它就是4个线性方程组的解。
如果这个来自相对论的例子在往前走一步,我就会陷入麻烦。针对这一点,线性代数可以解决任意数量的方程。第一个方程产生 n 为空间中n−1维的平面,第二个平面与它相交(我们希望如此)得到维数是 n−2 的更小集合。假如一切顺利,每个新平面(每个新方程)都减少一维度。到最后,当所有的 n 为平面都考虑进来后,交点的维数是零。它是一个点,位于所有平面上,并且其坐标满足所有的n个方程。它就是问题的解!
我们转向列。这一次向量方程(与(1)的方程相等)是
当成分水平列出时,我们使用括号和逗号;当垂直书写时,用方括号(不带逗号)。真正重要的是向量加法和标量(一个数)乘法。在图2a中是向量加法,各部分分别相加:
我们真正的目标是超越两个或三个维度,看到n维。对于 n 个未知量的n个方程,在行图像中有 n 个平面。在列图像中有n个向量,再加上右边的向量 b 。方程需要n列的线性组合等于 b 。当然对于某些方程可能不存在。比较矛盾的是,理解好案例的方式就是研究坏案例。因此当它不满足,也就是奇异的情形下,我们试着看看它的几何形状。
假设现在是三维空间,行图像中的三个平面不相交。那么将会有什么问题?一种可能是,两个平面平行。方程2u+v+w=5,4u+2v+2w=11不一致,平行的平面将无解(图4a所示)。在两维空间里,平行线是唯一的可能性。但在三维空间里,三个平面不想交的话会比较麻烦。
另一个与这个有关的奇异系统是有无限解。当最后那个方程的6换成7,三个方程结合起来得到 0=0 。现在第三个方程是前两个的和。这种情况下三个平面有一条共同直线(图4c)。改变右边的值将平行地移动图4b的平面,当 b=(2,5,7) 时,图像突然变得不同。最下面那条直线与另两条相交,这条线就是问题的解。图4c仍是奇异,但现在它是有太多的解,而不是太少。
极端的例子是三个平行平面。右边大部分情况下都没有解(图4d)。对于特殊的情况(像b=(0,0,0))整个平面都是解,因为三个平行平面移动成同一个平面。
当系统是奇异的时候,列图像会发生什么?方程左边仍有三列,并且我们试图组合他们得到 b 。
向量 b=(2,5,7) 位于列1加列3构成的平面上,所以 (1,0,1) 是一种解。我们可以添加组合 (3,−1,−2) 给出了 b=0 。所以解是一整条直线,正如我们从行图像中看到的。
事实是,我们知道列组合得到零,因为行就是这样。这是一个数学事实,不是计算得到的,而且 n 维情况依然正确。如果n个平面没有交点,或有无限多个交点,那么 n 列位于同一个平面上。
如果行图像不成立,那么列图像同样如此。接下来几篇文章先讨论最重要问题-非奇异的情况,即有一个解。再然后研究一般情况,也许有很多解或根本没有。对于这两种情况,我们不需要矩阵符号和消除算法才能继续。