前言
没有声音,再好的戏也出不来;同样,没有可视化,再好的数据分析也不完美,数据可视化是大数据的『最后一公里』。
当你向上级做一份关于世界人口数据的调查时,又或者你需要向客户介绍一份基于地点的产品使用量报告,你拿出事先做好的 Excel 表格或者世界地图,切换着 PPT,一个国家一个国家的分析,在听众睡眼惺忪中结束了报告;又或者你拿出了这个——统观世界地图的数据报表,一张清晰扼要的图片可胜过千言万语。希望阅读本文后,你也可以做出一份大获好评的数据分析报表。
Superset 是一个用于数据探索和可视化功能的开源数据分析工具。当在 GitHub 上搜索 Data Visualization 时,Superset 的收藏数比其他可视化工具高出一个数量级。
Superset 通过让用户创建并且分享仪表盘的方式为数据分析人员提供一个快速的数据可视化功能,用丰富的数据可视化方案来分析你的数据。炫目的可视化效果, 成熟的数据抽象层可以用来提供敏捷、美观、稳定的交互式分析体验。目前 Superset 支持多达47种不同的图表,根据需求使用不同的图表显示不同的效果。
为了服务 Kyligence 用户,Kyligence 开发了定制版的 Kyligence Insight for Superset,现在 Kyligence Cloud 已与 Superset 无缝集成,免去安装和数据同步等烦恼,只需专注于数据分析。相比原生 Superset , Kyligence Insight for Superset 提供了如下新增功能:
统一用户管理,用户无需在 Superset 上额外创建用户和赋予权限,统一在 Kyligence/Kylin 后端管理用户访问权限,直接使用 Kyligence/Kylin 账户登录Superset。
支持一键安装,一键启动,一键同步 Kyligence Enterprise 数据。
无需在 Superset 端重新定义数据模型,可对海量数据直接查询。
支持多表连接模型,支持 inner join 和 outer join。
自动适配 Kyligence/Kylin 查询语法。
安装步骤
Step1:申请 Kyligence Cloud 试用后,在新建集群时勾选 Superset。
Step2:待集群状态变为 RUNNING 后点击 Superset 并登录。
Step3:在数据源一栏中选择 Refresh Kylin Cube 即可自动同步 Kyligence Enterprise 中的所有数据。
Kyligence Insight for Superset 使用方法
我们以 Kyligence Enterprise 中自带的数据为例,以时间为维度,为大家简单展示 Kyligence Insight for Superset 的用法。当我们点击需要查询的 Cube 名字后可进入查询详情页面,Superset 有 8 种专门针对时间序列的图表,使用这些图表时,你需要指定一个字段为时间维度,之后就可以对时间维度做丰富的操作。(同理,如需要使用基于地图的图表需要指定经纬度等字段才能使用对应的图表)。
海量数据查询
分析界面在各栏选择相应的值,您可以设置时间范围,设置时间粒度从每秒到每年,设置数据范围,维度和度量值,以及行数限制等,然后点击左上角的运行查询,即可运行查询,得到结果集图表 。
点击图表类型可以更改可视化图表类型
使用SQL 实验室进行自定义查询
点击 SQL 实验室— SQL 编辑器即可进入自定义 SQL 查询,选择对应的数据库和表,输入 SQL 查询语句,点击运行查询即可得到查询结果。在查询结果处选择可视化,可对查询结果集进行可视化。
保存与分享
在数据探索界面,点击左上角的保存 填入对应的信息,然后点击保存。在仪表版界面,点击 Edit Dashboard, 然后点击 Actions 中的邮件即可使用邮件分享仪表板,收件人点击邮件中的链接,即可在浏览器中进入到相应的仪表板页面。
了解更多详情还可点击教学视频!
关于 Kyligence Cloud
Kyligence Cloud 是 Kyligence 公司基于云端的一站式大数据分析平台,以 Apache Kylin 企业版(Kyligence Enterprise)为核心,为客户将大数据分析平滑上云提供解决方案。用户可以在公有云(如微软 Azure、 亚马逊 AWS、阿里云等)上快速建立大数据分析集群,接入各种云端数据源并进行建模分析, 实现对 PB 级数据的交互式分析与关键业务查询的亚秒级响应。点击申请免费试用 Kyligence Cloud。