翻译 | 徐进
审校 | 薛命灯
基于 JavaScript 的机器学习?!没错,是 基于 JavaScript 的机器学习!关注前端之巅系列文章——《机器学习与 JavaScript》,利用 JavaScript 开启机器学习之路!
基于 JavaScript 的机器学习?
你应该觉得基于 JavaScript 的机器学习不简单吧?
JAVASCRIPT?!我难道不应该用 Python 么?我难道要用 JavaScript 去做如此复杂的运算?难道我不应该使用 Python 或者 R 语言么?scikit-learn 算法库会不会不能在 JavaScript 中使用?简单来说:基于 JavaScript 的机器学习完全没有问题。
详细来讲,基于 JavaScript 的机器学习是有可能的,并且我总是很吃惊为什么开发者们没有给予它应有的关注。就 scikit-learn 算法库而言,JavaScript 开发者已经开发了一系列实现该算法的库,一会儿就会用到一个库。接下来会先讲一点机器学习的知识,然后就放松心情一起来看代码吧。
据 Arthur Samuel 所讲,机器学习 就是在不对其进行具体编程的情况下,使计算机拥有学习的能力。换句话说,它在我们不操作计算机的情况下,却能拥有自我学习的能力,并能执行正确的指令。并且谷歌公司已经将策略从移动优先转变为 AI 优先很长一段时间了。
为什么在机器学习领域没有提到 JavaScript 呢?
JavaScript 很慢。(完全错误的观念 !?! )
JavaScript 很难进行矩阵操作。(但是有很多库的,比如math.js )
JavaScript 仅仅被认为是用来做 web 开发的。(Node.js 默默的笑了)
机器学习中很多库都是基于 Python 开发的。(那是因为 JavaScript 开发者并没有在场)
现在已经有很多的 JavaScript 库了,它们已经预定义了机器学习算法,比如:线性回归、支持向量机、朴素贝叶斯算法等,以下列出了几个库:
brain.js(神经网络)
Synaptic(神经网络)
Natural(自然语言处理)
ConvNetJS(卷积神经网络)
mljs(一种具有多个函数方法的子库)
开启 JavaScript 的机器学习之路
我将使用mljs的回归库来执行线性回归模型的分析。全部代码都在 Github 上:machine-learning-with-js(https://github.com/abhisheksoni27/machine-learning-with-js )。
第一步. 安装依赖的库
$ yarn add ml-regression csvtojson
或者你更喜欢 npm:
$ npm install ml-regression csvtojson
ml-regression所做的事正如它的名字那样,机器学习线性回归库。
csvtojson是在node.js环境中的一个cvs数据解析器,它可以在你加载完cvs 数据后将其快速的转换为JSON。
第二步. 初始化依赖库并加载数据
首先从 这里 下载数据文件,并将数据文件放在你的工程目录中。假设你已经初始化了一个空的 npm 工程,打开index.js文件,并输入以下代码:(你可以直接复制 / 粘贴,但为了能够更好的理解它,建议你能亲自输入这段代码)
const ml = require('ml-regression');
const csv = require('csvtojson');
const SLR = ml.SLR; // 简单线性回归
const csvFilePath = 'advertising.csv'; // 数据文件
let csvData = [], // 已解析的数据
X = [], // 输入
y = []; // 输出
let regressionModel;
我把这个文件放在了项目的根目录下,因此如果你放在了别的目录下,请同时更改上述代码中的csvFilePath变量。
这样的代码看起来相当整洁,不是么?
接下来使用csvtojson库的fromFile方法加载数据文件。
csv()
.fromFile(csvFilePath)
.on('json', (jsonObj) => {
csvData.push(jsonObj);
})
.on('done', () => {
dressData(); // 从 JSON 对象中获取数据点
performRegression();
});
第三步. 将数据加以装饰,以准备开始执行
保存在csvData变量中的 JSON 对象已经准备好了,同时还分别需要一个数组,用来存储输入点数据和输出点数据。然后将通过dressData函数来运行数据,且dressData函数将会计算出X和Y变量。
function dressData() {
/**
* 一个数据对象应该这样:
* {
* TV: "10",
* Radio: "100",
* Newspaper: "20",
* "Sales": "1000"
* }
*
* 因此,在添加数据点的同时,
* 我们需要将 String 类型的值解析为 Float 类型。
*/
csvData.forEach((row) => {
X.push(f(row.Radio));
y.push(f(row.Sales));
});
}
function f(s) {
return parseFloat(s);
}
第四步. 训练模型,并开始进行预测
现在数据已经装饰好了,是时候来训练模型了。
为了实现这一目标,我们需要一个performRegression函数:
function performRegression() {
regressionModel = new SLR(X, y); // 基于训练数据来训练模型
console.log(regressionModel.toString(3));
predictOutput();
}
regressionModel有一个toString方法,它所接收的参数代表输出值浮点数的精度。
predictOutput方法能够接收所输入的值,并且向终端输出所预测的值。
以下就是这个函数的代码:(这里使用了node.js的readline模块)
function predictOutput() {
rl.question('Enter input X for prediction (Press CTRL+C to exit) : ', (answer) => {
console.log(`At X = ${answer}, y = ${regressionModel.predict(parseFloat(answer))}`);
predictOutput();
});
}
以下代码读取了用户的输入值:
const readline = require('readline'); // 同时预测用户的输入值
const rl = readline.createInterface({
input: process.stdin,
output: process.stdout
});
第五步. 恭喜你!做到了。
如果你跟着我一步一步的做,现在你的index.js文件应该是这样子的:
const ml = require('ml-regression');
const csv = require('csvtojson');
const SLR = ml.SLR; // 简单线性回归
const csvFilePath = 'advertising.csv'; // 数据
let csvData = [], // 已解析的数据
X = [], // 输入
y = []; // 输出
let regressionModel;
const readline = require('readline'); // 同时预测用户的输入值
const rl = readline.createInterface({
input: process.stdin,
output: process.stdout
});
csv()
.fromFile(csvFilePath)
.on('json', (jsonObj) => {
csvData.push(jsonObj);
})
.on('done', () => {
dressData(); // 从 JSON 对象中获取数据点
performRegression();
});
function performRegression() {
regressionModel = new SLR(X, y); // 基于训练数据来训练模型
console.log(regressionModel.toString(3));
predictOutput();
}
function dressData() {
/**
* 一个数据对象应该这样:
* {
* TV: "10",
* Radio: "100",
* Newspaper: "20",
* "Sales": "1000"
* }
*
* 因此,在添加数据点的同时,
* 我们需要将 String 类型的值解析为 Float 类型。
*/
csvData.forEach((row) => {
X.push(f(row.Radio));
y.push(f(row.Sales));
});
}
function f(s) {
return parseFloat(s);
}
function predictOutput() {
rl.question('Enter input X for prediction (Press CTRL+C to exit) : ', (answer) => {
console.log(`At X = ${answer}, y = ${regressionModel.predict(parseFloat(answer))}`);
predictOutput();
});
}
打开终端,输入并运行node index.js,它将会输出如下所示内容:
$ node index.js
f(x) = 0.202 * x + 9.31
Enter input X for prediction (Press CTRL+C to exit) : 151.5
At X = 151.5, y = 39.98974927911285
Enter input X for prediction (Press CTRL+C to exit) :
恭喜你!刚刚用 JavaScript 训练了你的第一个线性回归模型。(你有注意到它的速度么?)
PS: 我将使用 ml 和其他的库(上面所列出的那些)在各种数据集上执行目前比较流行的机器学习算法。请时刻关注我的动态,获取最新的机器学习教程。
感谢你的阅读! 如果你喜欢这篇文章的话,请为我点赞,以让别人知道 JavaScript 是多么的强大,以及为什么在机器学习领域中 JavaScript 不应该落后。
英文原文链接
Machine Learning with JavaScript : Part 1
https://hackernoon.com/machine-learning-with-javascript-part-1-9b97f3ed4fe5
注:本文翻译及转载均已获得作者授权。
今日荐文
点击下方图片即可阅读
前端每周清单第 19 期: Vue 的优势与劣势;Node.js 有望超越 Java;JS 在嵌入式及物联网的应用现状
视野拓展
推荐一个不可错过的会议:ArchSummit 全球架构师峰会,邀请了上百位国内外顶尖技术专家前来分享各业务的核心架构设计,从 Web 协议底层优化到超级 App 的系列魔改,这里只谈最优秀的架构实践。
距离大会 7 月 7 日开幕仅剩两周时间,点击“阅读原文”可获取 100+ 落地案例,如需报名,可直接识别下方二维码联系大会售票天使豆包,欢迎骚扰~!