Vsphere集群维护经验

结构简述:

用十台服务器做的Vsphere的集群,其中使用了超融合将硬盘组合。三个千兆网口,一个为管理网口,另外两个为业务网口,两个万兆光口,做磁盘交换。

问题再现:

有一台服务器下线,因为主板有问题。当这台服务器修好并重新上线之后,有检测出另外一台服务器的主板也有问题。从管理端将服务器置为维护模式后大部分虚拟机迁移失败,登陆服务器的管理界面,下线虚拟机并关闭服务器。

后Vcenter出现错误,Vsphere管理端登陆异常,出现了部分服务器下线,时间不长后,所有服务器在Vcenter中的状态均为下线,单独登陆每台服务器可以查看出,服务器中的业务运转正常。

通过物理机登陆系统,发现明显卡顿,所以机器均为此状态。通过SSH连接后查看处理器的负载情况,发现负载情况很低。

解决方法:

集群的问题出现是从第二台,等待服务器维护完成之后上线,集群系统恢复正常,卡顿消失,其中的业务迁移失败是因为管理网络中的Vmotion并没有开启的原因。

你可能感兴趣的:(Vsphere集群维护经验)