1.背景
Superset 是 Airbnb 开源的数据分析与可视化平台,同时也是由 Python 语言构建的轻量级 BI 系统。Superset 可实现对 TB 量级数据进行处理,兼容常见的数十种关系或非关系型数据库,并在内部实现 SQL 编辑查询等操作。除此之外,基于 Web 服务的 Superset 可实现多用户协使用,并可针对不同角色进行权限管理。Superset 如今已归属于 Apache 孵化项目,并被 Yahoo,豆瓣等国内外知名公司使用。
示例图截图如下:
2.环境
3.适合人群
本课程难度为一般,属于初级级别课程,适合具有 Python 基础,并对数据分析与可视化感兴趣的用户。
4.创建虚拟机
使用vagrant+visual box创建centos7 64位虚拟机一台(省略)
5.安装superset
5.1安装依赖的软件包
yum -y install gcc gcc-c++ libffi-devel python-devel python-wheel openssl-devel libsasl2-devel openldap-devel epel-release
yum -y install python-pip
5.2安装并更新setuptools和pip
pip install --upgrade setuptools pip
5.3安装click和markdown
pip install click==6.7 "markdown<3.0.0"
5.4查看本地安装版本和最新版本
pip freeze | grep superset
pip install superset==-1
当前最新版本为0.27.0
5.5安装superset
pip install superset
文件比较大,需要的依赖包比较多,请耐心等待,如遇报错,大部分是超时造成的,多试几次此命令,直至安装成功。
5.6安装Mysql驱动
yum -y install mysql-devel
pip install mysqlclient
5.7修改数据库连接
vi /usr/lib/python2.7/site-packages/superset/config.py
5.7创建超级用户
fabmanager create-admin --app superset
5.8升级superset数据库配置
superset db upgrade
5.9加载测试样例到数据库(可选)
superset load_examples
5.10初始化角色和权限
superset init
6.启动superset
nohup superset runserver -p 8000 &
7.登录WEB界面
访问http://192.168.56.11:8000
点击登录之后,即可进入到主界面
8.superset使用
8.1查看示例
点击“看板”—>” Misc Charts”
点击“Charts”—>“Trends”
效果还是不错的。
8.2添加新的数据源
在MYSQL中创建一个新的数据库mydb
在superset主界面,点击“数据源”—>”数据库”
在弹出界面输入相关信息
点击“保存”按钮,我们就成功添加了一个新的数据库源。
8.3添加测试表
在Mysql中添加一张表
插入测试数据
INSERT INTO items(pinming,city,price,number)
VALUES
('耐克运动鞋','南京',500,960),
('耐克运动鞋','沈阳',500,830),
('安踏运动鞋','北京',100,900),
('安踏运动鞋','重庆',100,3200),
('安踏运动鞋','贵州',100,1030),
('安踏运动鞋','武汉',100,680);
8.4 SQL编辑器
在superset界面,点击“SQL工具箱”—>”SQL编辑器”
好了,其他的功能自行研究吧。