常见的交互式分析(Interactive Analytics)和开发工具

交互式分析(Interactive Analytics)当前版本能支持的工具如下。

名称 是否能连接 基本功能 查询功能
Navicat 是 是 是
DataWorks-HoloStudio 是 是 是
psql 是 是 是
JDBC 是 是 是
本文将重点为您介绍其中几种开发工具:

HoloStudio
HoloStudio是面向交互式分析引擎的数据开发和数据分析平台,提供实时数据写入、数据查询、资产管理、ETL调度、Query诊断、开发运维等功能,提高实时数仓建设的开发效率,并通过无缝对接大数据应用开发生态,实现流批OLAP数据服务的一站式开发体验。详细操作步骤请参见开始使用HoloStudio。

psql客户端
psql是PostgreSQL的一个命令行交互式客户端工具,在本机安装PostgreSQL数据库将默认安装psql客户端。通过psql在命令行下可以连接交互式分析,语法与连接PostgreSQL数据库一致。详细使用步骤请参见开始使用。

PGUSER=accessID PGPASSWORD=accessKey psql -p -h -d
说明 :
Access ID:当前访问账号的AccessID。
Access Key:当前访问账号的AccessKey。
port:连接交互式分析的公共网络端口。
endpoint:连接交互式分析的公共网络地址。
databasename:访问的交互式分析数据库名。

说明 :psql默认优先通过SSL方式连接。
JDBC
交互式分析也提供JDBC/ODBC Driver,让您可以轻松对接各种开发工具。使用JAVA配置JDBC的操作如下:
mvn配置示例


org.postgresql
postgresql
9.4.1212.jre6



java代码配置
public class HologresTest {

private void jdbcExample() throws Exception {
    String url = "jdbc:postgresql://{ENDPOINT}:{PORT}/{DBNAME}?user={ACCESS_ID}&password={ACCESS_KEY}";
    Connection conn = DriverManager.getConnection(url);
    Statement st = conn.createStatement();
    String sql = "SELECT * FROM table where xxx limit 100";
    ResultSet rs = st.executeQuery(sql);
    String c1 = rs.getString(1);
}

}
Navicat
Navicat是一个多连接数据库开发工具,可让您在一个应用程序中最多连接多个数据库,帮助您快速轻松地创建、管理和维护数据库。Navicat for PostgreSQL是一套易于使用的图形化PostgreSQL数据库开发工具。使用Navicat连接交互式分析进行数据开发的步骤如下:
下载并安装Navicat for PostgreSQL。
打开Navicat,单击左侧菜单栏连接并选择PostgreSQL。
填写连接信息,单击测试连接,跳出弹框显示连接成功,表明Navicat已成功与交互式分析连接,单击确定,即可在Navicat中进行数据开发。使用教程可参见Navicat官网手册。
配置参数说明如下:
配置项 说明 备注
连接名 自定义 无
主机 连接的交互式分析公共网络地址 示例:holodemo-cn-hangzhou.hologres.aliyuncs.com
端口 连接的交互式分析公共网络端口 示例:80
初始数据库 要连接的交互式分析数据库 示例:postgres
用户名 当前交互式分析账号的Access ID 无
密码 当前交互式分析账号的Access Key 无

Impala
Impala是Cloudera在受到Google的Dremel启发下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的Hive+MapReduce批处理,而是通过使用与商用并行关系数据库中类似的分布式查询引擎(由Query Planner、Query Coordinator和Query Exec Engine三部分组成),可以直接从HDFS或HBase中用SELECT、JOIN和统计函数查询数据,从而大大降低了延迟。其架构如图 1所示,Impala主要由Impalad, State Store和CLI组成。
Hive
Impala与Hive都是构建在Hadoop之上的数据查询工具各有不同的侧重适应面,但从客户端使用来看Impala与Hive有很多的共同之处,如数据表元数据、ODBC/JDBC驱动、SQL语法、灵活的文件格式、存储资源池等。Impala与Hive在Hadoop中的关系如图 2所示。Hive适合于长时间的批处理查询分析,而Impala适合于实时交互式SQL查询,Impala给数据分析人员提供了快速实验、验证想法的大数据分析工具。可以先使用hive进行数据转换处理,之后使用Impala在Hive处理后的结果数据集上进行快速的数据分析。

你可能感兴趣的:(技术)