开源机器学习工具SQLFlow

在北京QCon全球软件开发大会上,蚂蚁金服副CTO胡喜正式宣布开源机器学习工具 SQLFlow

SQLFlow抽象出端到端从数据到模型的研发过程,配合底层的引擎及自动优化,

具备基础SQL知识的技术人员即可完成大部分的机器学习模型训练及预测任务.

“机器学习”需要极为丰富的知识储备:

     1、高等数学、统计学、概率论以及编程等,

     2、需要他在其他领域保持非常高的知识水平,

从而这些苛刻的要求让很多技术人很难成为机器学习领域的专家,因此制约着整个人工智能产业的发展.

Github 上,蚂蚁金服提供了SQLFlow 的安装指引,以及快速入门

https://github.com/sql-machine-learning/sqlflow

训练模型

SELECT *
FROM iris.train  --从元数据表读数据
TRAIN DNNClassifier --选择 DNN 分类器
WITH n_classes = 3, hidden_units = [10, 20] --设置分类数(训练数据是三分类)和 hidden layer
COLUMN sepal_length, sepal_width, petal_length, petal_width  --选择加入训练的数据列
LABEL iris.train.class --选择标注的 label 列
INTO sqlflow_models.my_dnn_model;  --保存模型	

用训练好的模型预测一组数据的 label

SELECT *
FROM iris.test  --从待预测的数据表读数据( sepal_length, sepal_width, petal_length, petal_width 有数据,但 label 为空)
PREDICT iris.predict.class --待填充的 label 数据列
USING sqlflow_models.my_dnn_model; --选择已训练好的模型

 

 

 

你可能感兴趣的:(大数据)