记录一次namenode ha中一个namenode失效处理过程

生产环境中,一次重启,ha中一个namenode下image全部消失,最后没找到原因,所以进行恢复
首先进入安全模式:
hdfs dfsadmin -safemode enter
然后刷一下active节点的log到image
hdfs dfsadmin -saveNamespace
然后将active节点的image文件全部拷贝到故障节点的相应目录下
然后重启故障namenode
最后hdfs namenode -bootstrapStandby
到此,故障解决。
后来还解决过一次hdfs的block丢失的问题,也是将原先的image全部拷贝回来搞定的。
所以说,即便有ha,定期备份image文件还是很重要的。

你可能感兴趣的:(Hadoop)