最近群里陆续有人反映vShpere5 HA测试失败,有物理机环境的,也有Workstation环境下部署的vShpere,症状都表现为Slave Host关机时,其上的虚机可以正常切换到另一台Host启动,反之则不行。


测试环境:

VMware Workstation 10

vShpere 5.5.0 Build 1331820


DC: 192.168.50.110

ESXi55-1: 192.168.50.61  Gateway和DNS都填写为192.168.50.110

ESXi55-2: 192.168.50.62  Gateway和DNS都填写为192.168.50.110

vCenter: 192.168.50.63

共享存储使用Openfiler,这里不详述。


虚机win2k8:新建的一个windows虚机的配置文件,并没有实际安装系统。


测试流程:

    1、win2k8位于ESXi55-2(slave)上,手动关闭ESXi55-2主机电源,观察虚机情况。

    2、win2k8位于ESXi55-1(master)上,手动关闭ESXi55-2主机电源,观察虚机情况。


测试结果:

    关闭Slave Host后,HA自动将win2k8在192.168.50.61上restart

   

VMware Workstation环境下的vShpere HA测试_第1张图片

   

同样,关闭Master Host后,HA自动将win2k8在192.168.50.62上restart

   VMware Workstation环境下的vShpere HA测试_第2张图片


HA功能测试正常,但是什么原因造成本文开头的故障呢?

个人判断如下:

    测试环境中,很多人只是在ESXi中设置了IP地址和掩码,并未配置可用的网关和DNS,导致HA中主机故障时,无法ping通隔离地址(一般情况下就是是网关IP),触发隔离响应流程,使虚机无法正常切换。

    建议大家在测试HA环境是,搭建一台windows域控,把HA中所有主机的网关和DNS都指向这个域控的IP,可以避免很多麻烦。