VMware vSphere5.0 HA高可用性原理

HA(hight availability)是ESXi服务器集群提供的功能,主要目的是当虚拟机运行所在的物理主机、虚拟机操作系统、虚拟机中的应用程序发生故障时,能保证虚拟机快速重启。对外提供的服务不中断,数据不丢失。

故障层次:一、ESXi物理主机故障。二、虚拟机操作系统故障。三、应用程序故障。
对于第一种故障的处理原理:在一个集群中启用了HA功能的ESXi物理主机,默认每隔5秒(可以自己设定时间)就会向这个集群中的其他物理主机发送一个心跳检测信号,用于证明自己是存活的。如果其他物理主机在3个周期也就是15秒后没有收到该主机的信号,其他主机就认为这台主机出现了物理故障,就会将原来这台主机上运行的虚拟机在其他物理主机上重启,以重新对外提供服务。注意这里有个很重要的前提:每个虚拟机的文件不是本地存储模式,而是以共享的方式存储在其他磁盘阵列上的(这在我的另一篇文章 VMFS数据存储中有介绍)。这样,当物理主机A发生故障,物理主机B就可以在共享磁盘阵列中将A上的虚拟机文件拷贝出来,重新运行在物理主机B上。因此从外界的客户端看来,仅仅是一次系统重启而已。

第二种故障和第三种故障的处理原理类似:首先在虚拟机操作系统中安装了一个wmware的代理工具,虚拟机和虚拟机上运行的软件通过该代理工具来与WMware Vcenter 互相发送心跳检测信号。如果虚拟机发送的心跳检测信号在3个周期没收到,Vcenter就重启该虚拟机(还是在原来的物理主机上重启)。同理如果某软件故障,要先重启虚拟机再重启软件。

你可能感兴趣的:(云计算)