1. Superset介绍
Superset(中文翻译是快船)是由Airbnb开源BI数据分析与可视化平台,其实是一个自助式数据分析工具,为数据分析提供了轻量级的数据查询和可视化方案。
主要特点是可自助分析、自定义仪表盘、分析结果可视化(导出)、用户/角色权限控制,还集成了一个SQL编辑器,可以进行SQL编辑查询等,原来是用于支持Druid的可视化分析,后面发展为支持很多种关系数据库及大数据计算框架,例如:mysql, oracle, Postgres, Presto, sqlite, Redshift, Impala, SparkSQL, Greenplum, MSSQL等。
主要目标是简化我们的数据探索分析操作,它的强大之处在于整个过程一气呵成,几乎不用片刻的等待。
2. Superset官网
Superset官网地址:https://airbnb.io/projects/superset/
Superset官方文档:https://superset.incubator.apache.org/index.html
Superset学习交流QQ群:895772133
3. Superset安装
3.1 环境
windows 7/10 64位
3.2 安装步骤
3.2.1 安装Python
建议安装Python 3.7 以上版本,Python官网:https://www.python.org/downloads/release/python-373/
下载64位Python下载 python-3.7.3-amd64.exe,直接使用exe的安装包即可,安装过程中选中增加到环境变量。
3.2.2 安装VS2015
Superset中依赖的一些库需要使用microsoft visual c++ 2010编译。
也可安装 Visual C++ 2015 Build Tools:https://download.csdn.net/download/ws3243666/11289820
3.2.3 安装sasl
通过 http://www.lfd.uci.edu/~gohlke/pythonlibs/#sasl 下载对应的版本,此处下载较慢,
可以在CSDN资源里面下载:https://download.csdn.net/download/ws3243666/11279591
比如现在安装的python 是3.7版本,系统是64位,就下载sasl-0.2.1-cp37-cp37m-win_amd64.whl。
这里一定要注意版本对上, 不然会安装不成功,报错(sasl.h 找不到),本文安装为3.7。
pip install D:\Downloads\sasl-0.2.1-cp37-cp37m-win_amd64.whl
3.2.4 安装superset
前置项安装完毕,开始安装superset。
先cmd进入dos界面,切换到superset下面的bin文件下,开始操作安装。
(1)下载Superset
pip install superset
(2)创建管理员帐号
fabmanager create-admin --app superset
(3)初始化数据库
# 初始化数据库 (windows下,先进入到 Python安装目录(或者virtualEnv的虚拟目录)下,Lib\site-packages\superset\bin下)
Python superset db upgrade
(4)加载例子、初始化角色、启动
# 加载例子(后续操作都需要在Lib\site-packages\superset\bin下)
Python superset load_examples
# 初始化角色和权限
Python superset init
# 启动服务,端口 8088, 使用 -p 更改端口号。
Python superset runserver -d
3.2.5 打开页面
使用浏览器,打开localhost:8088即可看到登录页面。
4. Superset数据源
Superset默认使用sqllite,支持以下数据库。
databasepypi packageSQLAlchemy URI prefix
MySQLpip install mysqlclientmysql://
Postgrespip install psycopg2postgresql+psycopg2://
Prestopip install pyhivepresto://
Oraclepip install cx_Oracleoracle://
sqlitesqlite://
Redshiftpip install sqlalchemy-redshiftpostgresql+psycopg2://
MSSQLpip install pymssqlmssql://
Impalapip install impylaimpala://
SparkSQLpip install pyhivejdbc+hive://
Greenplumpip install psycopg2postgresql+psycopg2://
Athenapip install "PyAthenaJDBC>1.0.9"awsathena+jdbc://
Verticapip install sqlalchemy-vertica-pythonvertica+vertica_python://
ClickHousepip install sqlalchemy-clickhouseclickhouse://