图片来自 Europeana on Unsplash
欢迎阅读的系列文章的第二篇文章,内容是线性代数的基础知识,线性代数是机器学习背后的基础数学。在我之前的文章中,我介绍了线性方程和系统、矩阵符号和行缩减运算。本文将介绍梯队矩阵形式:行梯队形式和行缩减梯队形式,以及如何使用两者来解决线性系统。本文最好与David C. Lay,Steven R. Lay和Judi J. McDonald的线性代数及其应用一起阅读。将此系列视为外部配套资源。
高斯消除法是一种使用行运算将矩阵转换为一种形式的过程,在这种形式中,解决方案可以在一些反向替换后被检索。
回顾一下,行缩减操作是:
上述操作可以应用于矩阵,以将该矩阵转换为其行梯队形式。给定的 m x n 矩阵,其中 m 是行数,n 是列数,在以下情况下称为行梯队形式:
以下是行梯队形式 (REF) 中的矩阵示例。
花点时间了解一下,虽然矩阵的大小和条目存在差异,但根据上述标准,所有矩阵都被视为行梯队形式。注意到突出显示的引导条目下方的类似楼梯的图案了吗?这就是执行高斯消除将矩阵转换为行梯队形式自然而然的结果。这种形式的名字很贴切:梯队这个词来源于法语eschelon,意思是梯子的梯级,后来的意思是“台阶”。
将矩阵转换为行缩减形式的高斯消除背后的基本思想是选择一个枢轴(枢轴一词用于指代前导条目:该条目将是其行中的第一个非零条目),然后消除下面的所有条目,将枢轴下方列中的所有内容清零。要了解为什么此步骤在将矩阵转换为精简梯队形式方面取得进展,请重新访问缩减梯队形式的定义:在行梯队形式中,前导条目下方列中的所有条目均为零。然后针对每一行再次迭代此步骤,但要谨慎!我们必须确保每次枢轴选择时,我们都不会违反行梯队形式的核心特征之一;行的所有前导条目都位于其上方行右侧的列中。 考虑到此规则,通常最好从第一行中的第一个条目开始旋转,然后从右到左沿着行向下移动。
让我们再次考虑前面提到的行梯队形式的目的:将表示线性系统的给定矩阵转换为解决方案可以轻松读取的形式。为了更好地理解行梯队形式的基本效用,请考虑示例 1。
当我们执行高斯消除时,我们正在操纵矩阵以呈现对称但更易于破译的形式。使用从示例 1 获得的行梯队形式,我们现在可以使用反向替换来逐步获得每个解决方案。
从上面可以看到,这并不理想。这需要额外的不整洁的工作。减少行梯队也需要额外的工作,但符号更简洁,出错的余地更小。一旦我们将矩阵简化为减少的行梯队形式,我们就可以轻松地读取我们的解决方案,我们将解析线性系统。
当将矩阵简化为缩减的行梯队形式时,使用高斯-乔丹消除。该算法将表示线性系统的给定矩阵转换为简化梯队形式,其中解决方案可以通过应用一系列行缩减操作变得易于阅读。无需额外的反向替换。
如果给定的 m x n 矩阵满足行梯队形式的先决条件,则称其为缩减行梯队形式,此外,还满足以下标准:
让我们通过一个将矩阵缩减为缩减行梯队形式的示例。
阅读我们的简化行梯队形式矩阵,现在很明显我们的解决方案是 x₁ = -3, x₂ = -12, x₃ = -3。
到目前为止,我们已经为行梯队形式和缩减行梯队形式各计算了一个示例。您可能想尝试单独减少行梯队形式的行作为练习,结果却得到不同的行梯队形式矩阵。不用担心,这是很有可能的,只要正确执行计算并涵盖所有三个规则,两个版本都是同样正确的。这是一个奇妙的情况!它引导我们走向一个重要的定理:
定理 (1)
矩阵可以有多个行梯队形式;行梯队形式不是唯一的。可以通过应用行操作顺序的变化来获得不同但同样有效的梯队形式。
减少的行梯队形式不是这种情况,而是减少的行梯队形式的情况相反。
定理 (2)
矩阵只能有一个缩减的行梯队形式;减少的行梯队形式是唯一的。
为什么我们看到两种形式之间唯一性的差异的根源是由于我们对缩减的行梯队形式施加的额外限制。也就是说,围绕前导条目的要求等于 1。一旦我们将矩阵简化为行梯队形式,我们就可以将每行乘以任何非零常量,它仍然是行梯队形式,因为缩放矩阵不会破坏行梯队形式的任何规则。减少梯队的形式是不可能的,因为主要条目必须是一个。下面我用一个具体的例子进一步说明这一点。
求解线性系统自然产生的一个基本问题是存在多少个解?对于任何线性系统,分辨率始终是三种情况之一。线性系统要么有一个唯一的解,要么有无限解,要么没有解。如果你有兴趣考虑为什么它必须是这三个之一,(重新)访问我之前的文章。
让我们更详细地仔细看看每个案例,看看我们如何识别给定矩阵的解案例,并轻轻地探索和探索每个案例场景表现自己的确切原因和方式背后的直觉。
唯一解决方案:当线性系统的矩阵的缩减行梯队形式对每一列都有一个透视时,线性系统具有唯一的解决方案。
当我们把矩阵形式重写为一系列线性方程时,为什么会这样就变得更加明显了。我们看到,因为每列都有一个透视(上面或下面没有条目),所以每个变量都有一个明确的解决方案,你可以逐个方程地读出。
无解:当矩阵的约化行梯队形式具有代数不一致时,线性系统没有解。
如上所示,没有 x₁、x₂、x₃ 和 x₄ 的值允许方程四为真。左侧将始终为 0,不等于 0,因此该系统不存在解决方案。通常,任何带有行 [0, 0, ...0 |b] 其中 b 不为零将没有解,因为 <> ≠ b。
无限解:线性系统在至少有一个自由变量时具有无限解。当相应的列没有透视时,会出现自由变量。另一方面,基本变量是相应列具有透视的变量。让我们研究一下为什么自由变量的存在暗示了无限解。
顾名思义,自由变量意味着您可以自由地为它们分配任何值。所有基本变量都是相对于自由变量定义的,因此基本变量的值将取决于为自由变量分配的值。这是无限解决方案存在的本质;只要基本变量与为自由变量选择的值一致,无限多个解决方案都是有效的。
将矩阵转换为缩减的行梯队形式后,系统是否有一个、无或无限多个解决方案将立即变得显而易见。
在本章中,我们学习了:
参考资料:
数学
数学
机器学习
线性代数