原作者: 黄进然 文章自:土拨鼠的菜地园
开源篇
一、Superset
1、技术架构:Python + Flask + React + Redux + SQLAlchemy
2、使用人群:
(1)开发/分析人员做好看板,业务人员浏览看板数据
(2)业务人员可自行编辑图表,查看满足条件的结果,但使用上对业务人员不是很友好
3、安装部署:
(1)docker方式的安装部署最简单
4、数据源:支持各种数据源,包括Hive、Kylin等
5、创建步骤:连接数据源-->定义数据表/SQL查询-->图表-->看板
6、可视化:
(1)支持的图表类型多,达47种
(2)图表可视化选项少,例如,数据格式选项偏少,如需添加,需要修改配置文件
(3)可在看板中添加筛选框,支持在不同条件下查看
(4)不支持图表和看板分组管理
(5)没有提供图表的下钻功能,不支持多图表间的复杂联动
(6)不支持跨库的表关联查询
7、支持文档:
(1)安装部署和快速入门方面的文档详细
(2)但具体功能和图表制作方面的介绍文档几乎没有,需要自己摸索尝试
8、邮件通知:不支持
9、权限管理:
(1)报表权限设置复杂、繁琐、不好用
(2)可实现对菜单、数据源、数据表、字段、图表、看板等权限控制
10、二次开发:
(1)支持 RESTful API
(2)原属Airbnb的开源项目,有大公司团队维护,版本更新、Bug修复、二次开发有较大保障。
11、源代码:代码质量较差
12、Github星数:22132
二、Redash
1、技术架构:Python + Flask + AngularJS + SQLAlchemy
2、使用人群:由于是对SQL查询结果进行可视化,需要开发/分析人员做好看板,业务人员浏览看板数据。
3、安装部署:
(1)安装部署相对较麻烦
(2)参考文档:
4、数据源:支持数据源比superset少,不支持Kylin
5、创建步骤:连接数据源-->SQL查询-->图表-->看板
6、可视化:
(1)支持的图表类型不如Superset多,仅12种
(2)图表可视化选项多
(3)不支持在看板种添加筛选框
(4)不支持图表和看板分组管理
(5)没有提供图表的下钻功能,不支持多图表间的复杂联动
(6)不支持跨库的表关联查询
7、支持文档:
(1)提供快速入门教程
(2)每一个功能模块都有文档且条理清晰
8、邮件通知:支持定时发送邮件
9、权限管理:权限设置简单,仅控制用户组对数据源的权限(只有两个权限:Full access或View only)
10、二次开发:
(1)提供完整的 RESTful API 接口
11、源代码:代码质量比Superset要好,但比Metabase差一点
12、Github星数:10891
三、Metabase
1、技术架构:Clojure + React + Redux
2、使用人群:界面漂亮、友好,使用体验好,适合业务人员使用
3、安装部署:
(1)windows下安装部署非常简单
4、数据源:支持数据源少(12种),不支持Hive、Kylin
5、创建步骤:连接数据源-->图表-->看板-->定时任务
6、可视化:
(1)支持的图表类型不如superset多,仅14种
(2)图表可视化选项多,例如,提供数据格式多,设置灵活
(3)可在看板中添加筛选框,支持在不同条件下查看
(4)通过创建集合,支持图表、看板、定时任务分组管理
(5)提供图表的简单钻取功能,不支持图表间的复杂联动
(6)不支持跨库的表关联查询
7、支持文档:
(1)安装部署、快速入门、具体功能、API等方面的文档详细
8、邮件通知:支持定时发送邮件
9、权限管理:
(1)权限设置单一,只有访问权限
(2)仅实现对数据源、数据表、图表、集合等权限控制
10、二次开发:提供完整的API文档,即使完全不会 Clojure,依然可以凭借丰富的 API 与文档完成许多二次开发。
11、源代码:代码质量最好,结构清晰,整洁度高
12、Github星数:12368
最后,几个开源BI工具的详细对比
最后,除了以上的开源BI产品(大规模推广应用还是有难度的),可以试试个人版免费的FineBI,学习文档,产品稳定性,易用性相对开源都比较成熟。
FineBI
1、技术架构:纯java开发,后台业务层spring mvc + Hibernate,前台框架fineui,底层架构引擎不明,只知道有大数据引擎。
2、使用人群:
(1)开发/数据人员准备好数据,数据人员/业务人员分析。
(2)业务人员完全可自行分析、制作可视化。整个数据分析流程分工明确。
3、安装部署:
(1)直接官网下载电脑适配的版本安装激活即可
4、数据源:支持各种数据源,支持Apache Kylin、Derby、HP Vertica、IBM DB2、Informix、Sql Server、MySQL、Oracle、Pivotal Greenplum Database、Postgresql、ADS、Amazon Redshift、Apache Impala、Apache Phoenix、Gbase 8A、Gbase8S、Gbase 8T、Hadoop Hive、Kingbase、Presto、SAP HANA、SAP Sybase、Spark、Transwarp Inceptor、Hbase等主流的一些关系型数据库及非关系数据库MongoDB等
5、创建步骤:连接数据源-->建立数据业务包-->建立分析数据表-->图表分析-->看板
6、可视化:
(1)支持的图表类型多,达47种
(2)图表可视化选项少,例如,数据格式选项偏少,如需添加,需要修改配置文件
(3)可在看板中添加筛选框,支持在不同条件下查看
(4)不支持图表和看板分组管理
(5)没有提供图表的下钻功能,不支持多图表间的复杂联动
(6)不支持跨库的表关联查询
7、支持文档:
(1)安装部署和快速入门方面的文档详细,还有教学视频
(2)但具体功能和图表制作方面的介绍文档几乎没有,需要自己摸索尝试
8、邮件通知:支持
9、权限管理:
(1)有一套完整的数据、业务包、报表、人员部门权限管理,有流程节点。
(2)可实现数据源、数据表、字段、图表、看板等权限控制
10、二次开发:
(1)不支持java层面的开发
(2)只有web接口
(3)能与.NET集成、JBPM工作流集成、CAS单点登录
11、源代码:不公开,人家商业产品,有整个团队在运营。
12、个人用户使用免费,商业部署有两个并发限制,多了就要钱了,不过相比sap这种也不贵。
工具地址
私信回复“bi工具”获得。
由于一些限制,这里没法贴上安装部署的教程文档,我也将一并回复,整理成资料包。
以上都是精心推荐的BI工具,大家勤学勤用,期待你们的反馈。
最后,整理不容易,求转发点赞啦(●ˇ∀ˇ●)
更多关于数据分析的干货可以关注我的公众号“数据分析不是个事儿”