ambari系列:
Ambari 服务器节点动态换盘操作
Ambari的Metrics Collector启动后自动关闭的解决
Ambari动态添加节点
基于ambari的HDP集群其中一spark节点出现内存盘损坏故障。Applicaton是Spark on yarn的模式,共8台Spark节点。
不要怕,大胆的开启host Level 维护模式。
Spark问题节点 turn on maintenance mode,内存更换完毕,turn off maintenance mode,启动服务。
第一步选中服务器192.168.11.22,点击action 进行第二步turn on maintenance mode。
观察spark数据处理应用,没有受到影响,通知运维人员进行换内存操作。
运维人员完成换内存操作,启动服务器,通知可以进行下一步操作。换内存过程,观察spark应用会有几分钟的quened状态,之后恢复正常。yarn自动跨过服务器192.168.11.22,进行资源的分配,(节点换内存处于ping不通状态)
查看ambari-agent 状态,如下图,正常运行中,说明该服务开机自启动。
因为服务器重启后yarn不能短时间内重新平衡资源(观察时间5分钟左右)以便于yarn重新分配资源,重启spark数据处理应用。
观察集群状态半小时无异常,spark应用运行正常。
大家好,我是徐小慧
博客主页:徐小慧_Blog
欢迎 点赞 | 收藏 ⭐ | 留言 如有错误敬请指正!