SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫 ...

项目git:https://github.com/lqkweb/sqlflow

SQLflow (python3+)

Sqlflow based on python development, support to Spark, Flink, etc as the underlying distributed computing engine, through a set of unified configuration file to complete the batch, flow calculation, the Rest service development.

2019-01-22 更新界面,近期会规范一下代码,写一些注释并加入读写功能

主页:
SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫 ..._第1张图片

结果页面:
SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫 ..._第2张图片

项目目标

基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫。

安装python3环境, 执行项目

git clone https://github.com/lqkweb/sqlflow.git

pip install -r requirements.txt

(sqlflow/sqlflow/execute/main.py 中的data.csv需要修改成你电脑中的绝对路径,数据文件在sqlflow/data/中)

python manage.py

打开http://127.0.0.1:5000 就可以测试了。

项目测试

在http://127.0.0.1:5000/demo输入框输入:
测试1:

select * from A limit 3;

测试2:

select * from A limit 3 as B;

新开一个http://127.0.0.1:5000/demo网页, 直接就可以查询数据表B了:

select * from B limit 2;

as B 相当于创建了一个B临时表。
是不是很简单。

正在新增sql版机器学习算法功能, 谢谢支持。
正在新增sql版爬虫功能, 谢谢支持。
记得给个start鼓励一下!Thanks(・ω・)ノ

你可能感兴趣的:(SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫 ...)