从Elasticsearch详解Ambari与第三方软件的集成(一)

一. 简单介绍

1. 软件介绍

1)Ambari(HDP)

玩过大数据的人都知道,除了原生的apache hadoop,有两大hadoop厂商(现在已经合并了。。喜闻乐见。。。):Hortonworks 和 Cloudera。Cloudera的hadoop产品相对来讲成熟度高,商业化程度高。而Hortonworks的hadoop产品种类更多,且开源度高,社区活跃。正是因为开源,才能自定义第三方软件集成,所以本文接下来的内容也是由此引出的。关于Ambari的安装,请参考本人之前的教程文档。

 

2)Elasticsearch

现在非常流行的开源全文索引工具,与apache的solr并列。虽然solr诞生的更早,但是就近来讲elasticsearch的活跃度更高,迭代也更频繁。加之Elastic的大家族,功能之强大不言而喻。

 

2. 实现目的

虽然上述两个生态应用软件在数据处理上都颇为重要,但是毕竟不是一家人。可是在打造工业产品的过程中,hadoop和elasticsearch经常是缺一不可的(一个用于高吞吐高延迟场景,一个用于低延迟搜索场景)。因此将二者合二为一的需求也是比较明显的。

 

3. 已完成的项目

Elasticsearch与Kibana的集成:https://github.com/BalaBalaYi/Ambari-Elastic-Service

Redis的集成:https://github.com/BalaBalaYi/Ambari-Redis-Service

你可能感兴趣的:(hadoop)