8.2 Impala

一、Hive缺陷

Hive建立在Hadoop平台上,依赖底层的MapReduce和HDFS,因此延迟高

二、Impala简介

Impala由Cloudera公司开发实时交互查询系统,参照Dremel系统设计。运行需要要依赖Hive的元数据。


Impala不需要把SQL转换为MapReduce任务(是批处理,Hive需要),而是采用了分布式查询引擎(与商业并行关系数据库类似),可以之间与HDFS和HBase做交互查询,因此响应比Hive快得多,实时交互性更好。

Impala和hive采用相同的SQL语法、ODBC驱动程序和用户访问接口。

Reference:
https://www.icourse163.org/learn/XMU-1002335004?tid=1450180443#/learn/content?type=detail&id=1214310162&cid=1217922321&replay=true

你可能感兴趣的:(8.2 Impala)