看机器学习如何求解多元一次方程？

问题起源
求解多元一次方程的解似乎看起来不是一件很难的事情，可以通过方程组的合并求解，从技术可行性上是完全没有问题的，但是能否有一个通用的模型帮助我们去求解多元一次方式呢？例如给定下列方程：

　　5x+ 2y = 10
　　x + 4y = 11

通过方程组的合并消元求解，则很容易得 x=1，y=0.25。如果写一个求解的该二元一次方程的求解函数，似乎也不是什么难事，但是如果变量不只是两个，对方程组合并消元的复杂度则会加大，甚至造成程序的可读性也变差。

机器学习的核心思想源自于数学，方程组合并消元的方法只是数学中人们总结的技巧，但并不是方程组求解的原始思路，此时此刻，我们需要借助最原始的数学思维帮助我们建立一个数学模型，辅助求解多元一次方程组。

问题抽象
我们将公式进一步抽象，变成程序可理解的数组，如下：

      5x+ 2y = 10 转变为数组[5,2,10]

      x + 4y = 11 转变为数组[1,4,11]

我们希望有一个数学模型的输入是两个数组：[5,2,10]，[1,4,11]，输出是方程求解的数组[1,0.25]。即希望有下所示的功能，将数学问题转变了计算机的工程问题。

// 定义线性方程组求解模型，2表示变量的个数
LinearEquation linearEquation = LinearEquation(2);
// 将第一个方程加入到模型中[5,2,10]
linearEquation.addEquation(new Double[]{5.0, 2.0}, 10.0);
// 将第二个方程加入到模型中[1,4,11]
linearEquation.addEquation(new Double[]{1.0, 4.0}, 11.0);
// 模型进行训练
linearEquation.practice();
// 输出训练后的x和y的值
System.out.println(Arrays.toString(linearEquation.getVariables()));

模型引入
对机器学习而言，永远逃不过两类计算，一个是距离计算，一个是概率计算。而方程式中的x和y我们可以理解为权重，即当x和y为某值时(5x+2y-10) 的距离尽可能短，使得几乎等于0，同理(x+4y-11)的距离也尽可能短，使得几乎也等于0，权重或为概率或为距离。类似这样的计算，很容易想到人工神经网络。

人工神经网络可以处理线性与非线性的问题，由于本问题是求解多元一次方程，因此是线性问题，可以采用人工神经网络中最基本的模型感知器进行求解，感知器是Frank Rosenblatt在1957年就职于Cornell航空实验室（Cornell Aeronautical Laboratory）时所发明的一种人工神经网络。它可以被视为一种最简单形式的前馈神经网络，是一种二元线性分类器。感知器使用特征向量来表示的前馈神经网络，把矩阵上的输入x（实数值向量）映射到输出值 f(x)上（一个二元的值）。感知器模型如下图所示：

感知器.png

通过上图可以看出，感知器模型由一下几个部分组成：
　　1. 输入。输入主要是包括n个输入项pi，以及每一个输入项下对应的权重wi
　　2. 激活函数。感知器可以灵活选择激活函数。激活函数给神经元引入了非线性因素，使得神经网络可以任意逼近任何非线性函数，这样神经网络就可以应用到众多的非线性模型中。
　　3. 输出。感知器的输出则比较容易理解如下公式所示，其中b是偏执项：

感知器公式.png

一个较为实际的理解感知器即为:输入的x是对结果y的影响参数，但是每一个输入的x对y的影响都有相应的权重w，最终对y的影响结果则等于每一个输入与权重之和的累积。

模型应用与求解多元一次方程
感知器的训练过程是使得对应的wi处于某值的时候，输入的xi能够得到相应的y，实际也是在求wi的过程。而在对多元一次方程求解的时候，可以将未知数xi的系数视为wi，则多元一次方程是已知wi，y，求xi的过程。因此，我们可以将方程中的xi视为感知器中wi，方程中的wi视为xi，这样求方程的解，则完全转变为感知器的训练过程。而方程式的系数即可为感知器的训练集。如果方程式有三个未知数，则至少有三个方程（即三个训练集）才可能获得解，应用代码如下所示：

// 方程式一： 10.0*x1+2.0*x2 = 12.0
// 方程式二：1.0*x1+1.0*x2  = 2.0
// 根据上述方程可知： x1 = 1.0, x2 = 1.0
com.iveely.ml.application.LinearEquation linearEquation =
                new com.iveely.ml.application.LinearEquation(2);
linearEquation.addEquation(new Double[]{10.0, 2.0}, 12.0);
linearEquation.addEquation(new Double[]{1.0, 1.0}, 2.0);
linearEquation.practice();
Double[] ret = linearEquation.getVariables();
// 计算结果误差需小于0.1，可以根据学习速率和迭代次数调整精确度
assertEquals(1.0, ret[0], 0.1);
assertEquals(1.0, ret[1], 0.1);

归纳总结
这是机器学习中神经网络最基本的实际应用，感知器能够解决多元一次方程问题的根本原因也是在于线性可分，理论上其它的机器学习模型也是可以做到。如果方程无解，则可以通过最小二乘法，找到一条最佳的直线，尽可能满足点的覆盖。

您的朋友：刘凡平（[email protected]），LinearEquation源码请参见这里，iveely.ml源码参见这里。

看机器学习如何求解多元一次方程？

你可能感兴趣的:(看机器学习如何求解多元一次方程？)