Hadoop节点的磁盘RAID

当搭建hadoop集群的时候首先要注意的是节点的磁盘选型,这对hadoop集群的读写和高可用有着很重要的影响

以下是对Hadoop集群节点的磁盘配置建议:

  • HDFS NameNode作为重要的节点,其元数据存储区最好做Raid-1(RAID-5需要至少3块硬盘),当然较高版本 2.3 later 之后也无需这样做了,可以对fsimage 和editlog 对目录挂载在两块(也可以多块)硬盘上,hadoop 会自动备份冗余信息的。

  • DataNode不要做Raid,因为在HDFS的软件层面提供了数据的冗余,而且如果磁盘阵列出现问题可能会导致整个节点不可用,读写性能测试并不如单盘mount的效果好,只需要挂在JBOD,dfs.data.dir配置多个磁盘挂载分区即可

  • 所有的节点的OS盘最好两块盘做Raid-1,防止os的问题导致节点不可用

你可能感兴趣的:(hadoop拾遗)