先电版大数据平台搭建问题之down机问题

先电版大数据平台搭建问题之down机问题_第1张图片

在部署hadoop集群过程中,每当安装进行大约百分之70左右,master节点会出现崩掉现象,自动关机,然后无法启动实例。经查/var/log/libvirt/qemu/下 相关云主机日志文件。

先电版大数据平台搭建问题之down机问题_第2张图片

解决步骤:

1, 查看节点内存使用率,控制节点内存紧缺,计算节点内存充足。
2, 测试,发现web上创建云主机优先分配资源在控制节点上,但控制节点资源不足
3, 手动调度云主机使用 计算节点资源 命令: nova boot --flavor master --image master.hadoop --nic net-id=ede376f1-6446-4c3f-a4ba-70503e13d659 --availability-zone nova:compute master

总结:

此集群并非完全分布式集群,由两个节点构成,其中一个节点既为master 节点,也是slaver节点。导致在搭建平台过程中内存使用量急剧增加,云平台控制节点内存使用完毕,最终导致平台崩掉。


你可能感兴趣的:(先电版大数据平台搭建问题之down机问题)