背景介绍

高可用架构对于互联网服务基本是标配,无论是应用服务还是数据库服务都需要做到高可用。本文是对MySQL数据库的高可用方案中,基于主从复制的MHA软件理论部分进行梳理和小结。

MHA软件介绍

1.MHA软件是由MHA Manager(管理节点)和MHA Node(数据节点)组成
2.MHA Manager可以单独部署在一台独立的机器上,也可以部署在一台slave节点上
3.MHA Node运行在每台MySQL服务器上
4.MHA Manager会定时探测集群中的master节点,当master出现故障时,自动将数据最新的slave提升为新的master,然后将其他slave重新指向新的master恢复主从复制。
5.整个故障转移过程对应用程序完全透明

MHA架构介绍

1.目前MHA主要支持一主多从的架构,要搭建MHA,要求一个复制集群中必须最少有三台数据库服务器
2.在一主两从的MHA集群架构中,一台充当master,一台充当备用master,一台充当slave
3.因为至少需要三台服务器,出于机器成本的考虑,淘宝在该基础上做了改进,目前淘宝TMHA支持一主一从
4.我们自己使用时,也可以使用1主1从,但是master主机宕机后无法切换,以及无法补全binlog。不过,master的mysqld进程crash后,还是可以切换成功,以及补全binlog

MHA切换原理

自动故障切换过程

1.配置文件检查阶段,这个阶段会检查整个集群配置文件配置
2.宕机的master处理,这个阶段包括vip移除操作,主机关机操作
3.复制dead master和最新slave相差的relay log,并保存到MHA Manager定义的目录下
4.识别含有最新更新的slave
5.应用从master保存的二进制日志事件(binlog events)
6.提升一个slave为新的master
7.使其他的slave连接新的master进行复制

手工故障切换过程

注意事项:MHA Manager必须没有运行
1.手工调用MHA进行故障切换,masterha_master_switch
2.在经历配置文件检查、存活服务器检查、集群复制检查、备用master设置检查后,询问master阵亡,是否进行切换
3.宕机的master处理,这个阶段包括vip移除操作,主机关机操作
4.复制dead master和最新slave相差的relay log,并保存到MHA Manager定义的目录下
5.识别含有最新更新的slave
6.应用从master保存的二进制日志事件(binlog events)
7.提升一个slave为新的master
8.使其他的slave连接新的master进行复制

手工在线切换过程

1.检测集群复制设置和确定当前master
2.确定新的master
3.阻塞写入到当前master
4.等待所有slave赶上复制
5.授予写入到新的master
6.重新设置slave从新的master进行复制