CDH集群中NameNode处于safe mode问题的解决

在安装配置完3个节点的CDH集群后,在cloudera manager的主界面中显示HDFS的红色报警,点进去以后看到如下错误:
该NameNode当前处于safe mode.
CDH集群中NameNode处于safe mode问题的解决_第1张图片

尝试在报错的hadoop01节点上手动disable safe mode:

hdfs dfsadmin -safemode leave
在这里插入图片描述

root用户的权限竟然不够!好像只能通过Cloudera Manager的管理界面进行操作。

在实例界面,发现cloudera manager提示HDFS至少要有3个data node。目前只配置了2个data node,因此数据块无法复制,导致name node自动切换到safe mode。

问题原因既然查明,接下来就让我们添加第3个data node。
在实例界面,点击添加角色实例。
CDH集群中NameNode处于safe mode问题的解决_第2张图片
进入自定义角色分配界面
CDH集群中NameNode处于safe mode问题的解决_第3张图片

由于总共只有3台主机,那我们在DataNode的下拉列表中就选择“所有主机”选项。
添加完成以后,发现NameNode还是处于safe mode,同样无法退出。
检查后发现,将NameNode和Secondary NameNode同时配置在hadoop01主机上无效。于是我们将其中一个NameNode迁移到hadoop02主机上。
在实例界面中选中报警的NameNode,点击“迁移角色”:
CDH集群中NameNode处于safe mode问题的解决_第4张图片

我们发现配置2台NameNode,要求启用高可用。那就点击“启用高可用”:
CDH集群中NameNode处于safe mode问题的解决_第5张图片

接下来向导要求输入Nameservice的名称,我们接受默认的名称nameservice1,点击继续
CDH集群中NameNode处于safe mode问题的解决_第6张图片

到这里,我们又发现了新大陆,使用cloudera manager配置hadoop集群的优势就体现了出来。原来还要配置JournalNode,而且还要至少配置3台,我们只有3台主机,所以不用选择。直接点击继续
CDH集群中NameNode处于safe mode问题的解决_第7张图片

在JournalNode编辑目录的设置中输入/dfs/jn,点击继续,开始进行配置
CDH集群中NameNode处于safe mode问题的解决_第8张图片

CDH集群中NameNode处于safe mode问题的解决_第9张图片

到这里我们发现cloudera manager真的为我们做了很多事情,大大减轻了手工的配置工作。大概过了10多分钟,配置完成。
CDH集群中NameNode处于safe mode问题的解决_第10张图片

配置完成后返回实例界面,发现多了一个NameNode(hadoop02),而且也多了一个DataNode。可是,NameNode(hadoop01)上原先的红色报警仍旧没有消失。现在,我们点击报警的NameNode,再次执行退出safe mode的操作。
CDH集群中NameNode处于safe mode问题的解决_第11张图片
CDH集群中NameNode处于safe mode问题的解决_第12张图片

没有什么好犹豫的,点击“离开安全模式”
CDH集群中NameNode处于safe mode问题的解决_第13张图片

CDH集群中NameNode处于safe mode问题的解决_第14张图片

返回实例界面,发现原先NameNode上的红色报警已经消失。
CDH集群中NameNode处于safe mode问题的解决_第15张图片

稍微过了几分钟以后,HDFS上的红色报警也消失了。结果发现,数据块能够正常在3个DataNode之间进行复制以后,所有的红色警报全都消失了。
Bottoms up!
CDH集群中NameNode处于safe mode问题的解决_第16张图片
CDH集群中NameNode处于safe mode问题的解决_第17张图片

你可能感兴趣的:(大数据)