Datanode启动后秒挂

查看日志

Datanode启动后秒挂_第1张图片

报错说明:namenode的clusterID与datanode的clusterID不一样

为什么会不一样呢?

查阅网站后在https://blog.csdn.net/baidu_16757561/article/details/53698746这篇博客中找到了原因:

而当我们执行文件系统格式化时,会在namenode数据文件夹(即配置文件中dfs.name.dir在本地系统的路径)中保存一个current/VERSION文件,记录namespaceID,标志了所有格式化的namenode版本。如果我们频繁的格式化namenode,那么datanode中保存(即dfs.data.dir在本地系统的路径)的current/VERSION文件只是你地第一次格式化时保存的namenode的ID,因此就会造成namenode和datanode之间的ID不一致。

而我之前也刚好format了一次,导致了clusterID不同


解决方法一:(推荐) 

删除DataNode的所有资料及将集群中每个datanode节点的/dfs/data/current中的VERSION删除,然后重新执行hadoop namenode -format进行格式化,重启集群,错误消失。

解决方法二: 

将name/current下的VERSION中的clusterID复制到data/current下的VERSION中,覆盖掉原来的clusterID


参考文章:

https://blog.csdn.net/baidu_16757561/article/details/53698746

你可能感兴趣的:(Datanode启动后秒挂)