解决hadoop集群搭建中的INFO org.apache.hadoop.ipc.Client: Retrying connect to server: master/(ipv4)问题

在虚拟机环境中搭建hadoop完全分布集群,发现在Hadoop Resource-Manager web界面master:8088和NameNode HDFS Web界面master:50070中livenodes显示为0。而slave节点中使用jps命令查看datanode和nodemanager启动正常,虚拟机之间可以相互ping通,ssh免密登录也没有问题。分析可能是端口问题

因为core-site-xml文件中设置slave和master节点连接使的端口为9000,使用以下命令开放master9000端口:

sudo apt install ufw

sudo ufw enable

sudo ufw allow 9000或sudo ufw allow from IPv4(slaves节点的ip地址)

再在slaves节点中使用sudo ufw disable关闭slaves的Firewall

重新start-all.sh,live nodes仍然显示为0。使用cat  hadoop-hduser-datanode-data1.log查看日志文件,发现问题

由于core-site-xml中设定namenode为域名master,使用start-all.sh时,发现namenode将主机名master解析为127.0.1.1,原来是/etc/hosts文件中master 127.0.1.1的映射在master 192.168.1.103前面,hadoop默认将其解析为127.0.1.1解决hadoop集群搭建中的INFO org.apache.hadoop.ipc.Client: Retrying connect to server: master/(ipv4)问题_第1张图片

 

使用sudo vim /etc/hosts 将映射127.0.1.1 master删除 如图:

解决hadoop集群搭建中的INFO org.apache.hadoop.ipc.Client: Retrying connect to server: master/(ipv4)问题_第2张图片

再重新start-all.sh,启动web,master:8088和master:50070,即可观察到live node2数量为2,集群搭建成功

你可能感兴趣的:(解决hadoop集群搭建中的INFO org.apache.hadoop.ipc.Client: Retrying connect to server: master/(ipv4)问题)