如何通过Zeppelin查询Greenplum数据

摘要:
Zeppelin做为大数据分析查询工具由于简单易用被广泛使用,本文通过图文的方式说明如何通过Zeppelin查询Greenplum数据。

1.下载

下载Zeppelin 0.5.6 Binary package

http://zeppelin.apache.org/do...

2.解压缩程序

$ tar xzf zeppelin-0.5.6-incubating-bin-all.tgz

3.启动Zeppelin服务

$ bin/zeppelin-daemon.sh start

4.访问Zeppelin服务

http://yourIP:8080/

登录后,如下图所示:
如何通过Zeppelin查询Greenplum数据_第1张图片

5.配置连接 HashData Warehouse 的解释器

Zeppelin 解释器类似于数据库连接信息,Zeppelin 通过 JDBC 连接 HashData Warehouse 服务。连接配置示例如图 4-2 所示。

如何通过Zeppelin查询Greenplum数据_第2张图片

参数说明:

postgresql.max.result:结果集最大数量,结果集太大将会占用前端大量的内存。数据分析产生的结果数量一般不多,因此此属性不建议超过1000。
postgresql.user:登陆 HashData Warehouse 的用户名
postgresql.password:用户名密码
postgresql.url:用于定位 HashData Warehouse 服务的连接信息,格式:jdbc:postgresql://主机ip:端口/数据库名

6. 使用Zeppelin创建表,导入数据

Zeppelin 中通过使用 %psql.sql 来指定使用 HashData Warehouse 解释器和语法。图 4-3 给创建一个表,并插入了一些数据。

如何通过Zeppelin查询Greenplum数据_第3张图片

7.使用Zeppelin进行数据

Zeppelin 可以显示查询结果情况,图 4-4 显示了在不同参数下,COUNT() 聚合函数的不同返回结果。

如何通过Zeppelin查询Greenplum数据_第4张图片

相关资源

  • Zeppelin 官方 PostgreSQL 配置说明(英文)

  • Zepplin 动态表格帮助(英文)

你可能感兴趣的:(zeppelin,greenplum)