000X000

CDH优化(收藏篇)

1 测试环境参考方案

1.0 资源：集群服务安排

1.1 优化：Cloudera Management

1.2 优化：Zookeeper

1.3 优化：HDFS

1.4 优化：YARN + MapReduce

1.5 优化：Kafka

1.6 优化：HBase

1.7 优化：Hive

1.8 优化：Oozie、Hue、Solr、Spark

2 线上集群参考方案

2.0 资源：集群服务安排

2.1 优化：Cloudera Management

2.2 优化：Zookeeper

2.3 优化：HDFS

2.4 优化：YARN + MapReduce

2.5 优化：Kafka

2.6 优化：HBase

2.7 优化：Hive

2.8 优化：Oozie、Hue、solr、spark

1 测试环境参考方案

1.0 资源：集群服务安排

表格方便大家复制修改

服务名称	子服务	CM-24G	ZK-Kafka(3台)-12G	DataNode(3台)-64G	NameNode1-16G	NameNode2-16G	Resourcemanager1-16G	Resourcemanager2-16G	hive-hbase-24G	hive-hbase-24G
MySQL	MySQL	√
CM	Activity Monitor Alert Publisher Event Server Host Monitor Service Monitor	√ √ √ √ √
HDFS	NameNode DataNode Failover Controller JournalNode		X X X √	X √ X X	√ X √ X	√ X √ X
Yarn	NodeManager Resourcemanager JobHisoryServer			√ X X			X √ √	X √ √
Zookeeper	Zookeeper Server		√
Kafka	Kafka Broker		√
Hive	Hive Metastore Server HiveServer2 Gateway（安装对应应用服务器）			X √ √			X X √	X X √	√ X X	√ X X
Hbase	HMaster HRegionServer Thrift Server			X √ √					√ X X	√ X X
Oozie	Oozie Server						√
Hue	Hue Server Load Balancer						X √	√ X
Spark	History Server Gateway（安装对应应用服务器）			X √			X √	√ X
Flume	Flume Agent （安装对应应用服务器）
Sqoop	Sqoop（安装对应应用服务器）
sorl			√

1.1 优化：Cloudera Management

这些服务主要是提供监控功能，目前的调整主要集中在内存放，以便有足够的资源完成集群管理。

服务	选项	配置值
Activity Monitor	Java Heap Size	2G
Alert Publisher	Java Heap Size	2G
Event Server	Java Heap Size	2G
Host Monitor	Java Heap Size	4G
Service Monitor	Java Heap Size	4G

1.2 优化：Zookeeper

服务	选项	配置值
Zookeeper	Java Heap Size (堆栈大小)	2G
Zookeeper	maxClientCnxns (最大客户端连接数)	1024
Zookeeper	dataDir (数据文件目录+数据持久化路径)	/hadoop/zookeeper (建议独立目录)
Zookeeper	dataLogDir (事务日志目录)	/hadoop/zookeeper_log (建议独立目录)
Zookeeper	maxSessionTimeout	180000

1.3 优化：HDFS

服务	选项	配置值
NameNode	Java Heap Size (堆栈大小)10	10G
NameNode	dfs.namenode.handler.count (详见3.3.2)	30
NameNode	dfs.namenode.service.handler.count (详见3.3.2)	30
NameNode	fs.permissions.umask-mode (使用默认值022)	027(使用默认值022)
DataNode	Java Heap Size (堆栈大小)	8G
DataNode	dfs.datanode.failed.volumes.tolerated (详见3.3.3)	0
DataNode	dfs.datanode.balance.bandwidthPerSec (DataNode 平衡带宽)	100M
DataNode	dfs.datanode.handler.count (服务器线程数)	64
DataNode	dfs.datanode.max.transfer.threads (最大传输线程数)	20480
JournalNode	Java Heap Size (堆栈大小)	512M

1.3.1 数据块优化

dfs.blocksize = 128M

文件以块为单位进行切分存储，块通常设置的比较大（最小6M，默认128M）,根据网络带宽计算最佳值。
块越大，寻址越快，读取效率越高，但同时由于MapReduce任务也是以块为最小单位来处理，所以太大的块不利于于对数据的并行处理。
一个文件至少占用一个块（如果一个1KB文件，占用一个块，但是占用空间还是1KB）
我们在读取HDFS上文件的时候，NameNode会去寻找block地址，寻址时间为传输时间的1%时，则为最佳状态。
- 目前磁盘的传输速度普遍为100MB/S
- 如果寻址时间约为10ms，则传输时间=10ms/0.01=1000ms=1s
- 如果传输时间为1S，传输速度为100MB/S，那么一秒钟我们就可以向HDFS传送100MB文件，设置块大小128M比较合适。
- 如果带宽为200MB/S，那么可以将block块大小设置为256M比较合适。

1.3.2 NameNode 的服务器线程的数量

dfs.namenode.handler.count=20*log2(Cluster Size)，比如集群规模为16 ，8以2为底的对数是4，故此参数设置为80
dfs.namenode.service.handler.count=20*log2(Cluster Size)，比如集群规模为16 ，8以2为底的对数是4，故此参数设置为80

NameNode有一个工作线程池，用来处理不同DataNode的并发心跳以及客户端并发的元数据操作。该值需要设置为集群大小的自然对数乘以20,。

1.3.3 DataNode 停止提供服务前允许失败的卷的数量

DN多少块盘损坏后停止服务，默认为0，即一旦任何磁盘故障DN即关闭。对盘较多的集群（例如DN有超过2块盘），磁盘故障是常态，通常可以将该值设置为1或2，避免频繁有DN下线。