vSphere HA在ESXi主机群集的环境中运行。必须创建群集,然后有主机填充群集,并配置vSphere HA设置,才能建立故障切换保护。可以为群集启用vSphere HA。启用了vSphere HA的群集是Fault Tolerance的必备条件。可以先创建 空群集。在规划好群集的资源和网络架构之后,可以通过vSphere Client将主机添加到群集,并指定群集的vSphere HA设置。

一、创建vSphere HA群集

步骤1 创建一个空群集,然后将主机添加到群集里。右击清单树的数据中心,然后在弹出的快捷菜单中单击“新建群集”,完成新建群集向导,此时不要启用vSphere HA(或DRS)。单击“完成”按钮,关闭向导并创建群集。此时创建了一个空群集。之后使用vSphere Client将主机添加到群集。

步骤2 创建完成一个空的群集后,打开vSphere HA。右击群集,然后在弹出的快捷菜单中单击“编辑设置”。在群集的“设置”对话框中,可以修改群集的vSphere HA或其他设置。

步骤3 右击群集,选择“编辑设置”,“新建群集”向导中的第一面板可用为群集指定的基本选项。在该面板中,可以指定群集名称并选择一个或两个群集功能。选择“打开HA”之后,根据需要为群集配置vSphere HA设置,包括主机监控状态、接入控制、虚拟机选项、虚拟机监控、数据存储检测信号等,如图:

创建和使用vSphere HA群集_第1张图片步骤4 在主机监控状态下,如果选择启用主机监控,则会检查群集内的每台主机以确保其正在运行。如果某台主机出现故障,则会在另一台主机行重新启动虚拟机。主机监控还是vSphere Fault Tolerance恢复进程正常运行所必须的,如图:

创建和使用vSphere HA群集_第2张图片在“接入控制”中,可以为vSphere HA群集启用或禁用接入控制.


  • 启用:禁止违反可用性限制的打开虚拟机电源操作启用接入控制并执行可用性限制,同时保留故障切换容量。不允许在虚拟上执行会减少群集内的未预留资源并违反可用性限制的任何操作。

  • 禁用:允许违反可用性限制的打开虚拟机电源操作禁用接入控制。例如,即使打开虚拟机电源会造成故障切换容量不足,仍然可执行该操作。在执行该操作时,不会显示任何警告,而且群集不会变为红色。如果群集的故障切换容量不足,vSphere HA仍可以执行故障切换,并使用“虚拟机重新启动优先级”设置来确定要先打开电源的虚拟机。

在“接入控制”策略中,如果启用了接入控制,vSphere HA会提供3个强制接入控制的策略:群集允许的主机故障数量、作为故障切换空间容量保留的群集资源的百分比和指定故障切换主机。

步骤5 默认虚拟机设置控制虚拟机的重新启动顺序(虚拟机重新启动顺序优先级)以及在主机之间失去网络连接时vSphere HA的响应方式(主机隔离响应)。这些设置适用于主机发生故障或主机隔离时群集内的所有虚拟机。此外,也可以为特定虚拟机配置异常,如图:

创建和使用vSphere HA群集_第3张图片步骤6 如果在设置的时间内没有收到单个虚拟机的VMware Tools检测信号,虚拟机监控将重新启动该虚拟机。同样,如果没有收到虚拟机正在运行的应用程序的检测信号,应用程序监控也会重新启动该虚拟机。可以启用虚拟机监控功能,并配置vSphere HA监控无响应时的敏感度。

在“默认群集设置”中可以配置监控敏感度的级别。高敏感度监控可以更快的得出已发生故障的结论。然而,如果受监控的虚拟机或应用程序实际仍在运行,但由于资源限制等因素导致未收到检测信号,高敏感度监控可能会错误的认为此虚拟机发生了故障,而低敏度监控会延长实际故障和虚拟机重置之间服务中断的时间。检测到故障后,vSphere HA会重置 虚拟机,重置可确保这些服务仍然可用。为了避免非瞬态错误而反复重置虚拟机,在默认情况下,在某个可配置的时间间隔内将对虚拟机仅重置3次。在对虚拟机执行过3次重置后,指定的时间结束之前,vSphere HA不会在后续故障出现后进一步尝试重置虚拟机。可以使用每个虚拟机的最大重置次数自定义设置来配置重置次数。

在监控灵敏度高时,故障时间间隔为30秒,重置期为1小时;在监控灵敏度中时,故障时间间隔为60秒,重置时间为24小时;在监控灵敏度低时,故障时间间隔为120秒,重置时间为7天,在“默认群集设置”中,左右调整按钮来控制监控灵敏度,如图:

创建和使用vSphere HA群集_第4张图片步骤7 当vSphere HA群集中的首选主机无法通过管理网络与从属主机通信时,首选主机将使用数据存储检测信号来确定从属主机是否出现故障,是否位于网络分区中,或者是否与网络隔离。vCenter Server为每个主机选择的检测信号数据存储的数量,默认值为2,最大有效值为5.最后单击“确定”按钮,完成vSphere HA的设置和创建,如图:

创建和使用vSphere HA群集_第5张图片(二)使用vSphere HA群集

目前群集中有两台主机,使用两个共享iSCSI存储LUN,并且已经打开vSphere HA。虚拟机Linux FTPServer运行在10.128.114.74的上,虚拟机文件在共享iSCSI存储中的一个LUN上,如图:

创建和使用vSphere HA群集_第6张图片现在进行人为重启来模仿10.128.114.74主机发生故障,如图:

创建和使用vSphere HA群集_第7张图片通过HA,虚拟机Linux  FTPServer(备用)会自动切换到10.128.114.76主机上。之后由于主机发生故障,导致HA无效,因而无法满足HA要求,如图:

创建和使用vSphere HA群集_第8张图片