Impala大数据分析引擎视频教程
课程网盘下载:https://pan.baidu.com/s/1_nrM2bb2QSolBBKwjkO6aQ
提取码:uv5z

Impala由Cloudera公司主导开发的大数据实时查询分析工具,宣称比原来基于MapReduce的HiveSQL查询速度提升3~90倍,且更加灵活易用。提供类SQL的查询语句,能够查询存储在Hadoop的HDFS、Kudu、HBase(实际生产环境中不用)中的PB级大数据。查询速度快是其最大的卖点。简言之impala作为大数据实时查询分析工具,具有查询速度快,灵活性高,易整合,可伸缩性强等特点
但是在一些实时性要求很高的场景中,一方面满足实时性要求,一方面提升用户体验。Impala因其快速的响应能力当之无愧作为首选查询分析工具。

课程包含技术:
编程简单:适用于所有的etl开发工作者,sql几乎通用
高性能:轻松的应用复杂的分析场景
查询速度快:中间结果不写入磁盘,及时通过网络以流的形式传递,大大降低的节点的IO开销
灵活性高:可以直接查询存储在HDFS上的原生数据,也可以查询Kudu的数据原生数据
易整合:很容易和hadoop系统整合,并使用Hadoop生态系统的资源和优势,不需要将数据迁移到特定的存储系统就能满足查询分析的要求
可伸缩性:可以很好的与一些BI应用系统协同工作,如Cboard、Tableau等
可扩展: 随着业务发展,数据量和计算量越来越大,系统可水平扩展
容错:单个节点挂了不影响应用