HDP与CDH

一、 Hadoop版本

目前Hadoop发行版本非常多,我个人接触的有HDP和CDH,Hortonworks版本(Hortonworks Data Platform,简称“HDP”),Cloudera版本(Cloudera Distribution Hadoop,简称“CDH),还有其他的版本,目前中国公司我发现用的CDH版本较多,至于什么原因我也不是很清楚,不知道是不是跟风,从我个人的角度使用来看,我觉得HDP版本要比CDH要好。

二、 HDP与CDH对比

1. 据个人了解HDP是100%完全开源的,而CDH还不是100%完全开源。Hortonworks的工程师是社区的主要贡献者,Cloudera的发行版本也是比较清晰的。

2. HDP使用开源工具Ambari安装,CDH使用Cloudera Manager工具安装。对配置的修改与更新我喜欢Ambari的界面,可以很方便的修改集群配置,Cloudera Manager的配置界面真的是太烂了,不方便,发现有些配置竟然没法改。

3. 支持的组件,HDP基本上支持所有的开源大数据组件,CDH也基本上支持所有的开源大数据组件。

4. 代码包依赖,如果是HDP平台,编写代码直接依赖hadoop版本即可,如果是CDH平台,编写代码要依赖cdh的版本,否则运行不成功,这是坑啊。

三、安装参考

1. https://docs.hortonworks.com/ HDP

2. https://www.cloudera.com/documentation.html CDH

你可能感兴趣的:(大数据)