datanode01:该主机已与 Cloudera Manager Server 建立联系。 该主机未与 Host Monitor 建立联系。

问题描述:

大数据平台的datanode01意外宕机,重启服务器后大数据平台告警,datanode01运行状况测试不良。

问题分析:

1.检查angent状态:/etc/init.d/cloudera-scm-agent status
发现是active的
2.查看agent的日志:
tail -f /var/log/cloudera-scm-agent/cloudera-scm-agent.log
datanode01:该主机已与 Cloudera Manager Server 建立联系。 该主机未与 Host Monitor 建立联系。_第1张图片
发现报错,这事由于无法和server连接的报错信息

解决办法:

修改hosts文件:对比datanode02和datanode03的服务器的hosts文件修改
vi /etc/hosts
添加:
127.0.0.1 localhost.localdomain localhost
::1 localhost6.localdomain6 localhost6
127.0.0.1 localhost.node1

重启网卡:service network restart
重启agent:
/etc/init.d/cloudera-scm-agent stop
/etc/init.d/cloudera-scm-agent start

再次查看日志:
tail -f /var/log/cloudera-scm-agent/cloudera-scm-agent.log
发现都变正常了,再次登录CM平台查看各个服务的状态,发现都变正常
问题解决。

你可能感兴趣的:(大数据平台,踩坑日志,cloudera,datanode,scm-agent)