搭建mysql高可用集群之MHA

一、简介

MHA(Master HA)是一款开源的 MySQL 的高可用程序,它为 MySQL 主从复制架构提供了 automating master failover 功能。MHA 在监控到 master 节点故障时,会提升其中拥有最新数据的 slave 节点成为新的master 节点,在此期间,MHA 会通过于其它从节点获取额外信息来避免一致性方面的问题。MHA 还提供了 master 节点的在线切换功能,即按需切换 master/slave 节点。
  MHA 是由日本人 yoshinorim(原就职于DeNA现就职于FaceBook)开发的比较成熟的 MySQL 高可用方案。MHA 能够在30秒内实现故障切换,并能在故障切换中,最大可能的保证数据一致性。目前淘宝也正在开发相似产品 TMHA, 目前已支持一主一从。

二、MHA 服务工作流程

1)把宕机的master二进制日志保存下来。
2)找到binlog位置点最新的slave。
3)在binlog位置点最新的slave上用relay log(差异日志)修复其它slave。
4)将宕机的master上保存下来的二进制日志恢复到含有最新位置点的slave上。
5)将含有最新位置点binlog所在的slave提升为master。
6)将其它slave重新指向新提升的master,并开启主从复制。

三.MHA架构图

image.png

四.MHA工具介绍

MHA软件由两部分组成,Manager工具包和Node工具包,具体的说明如下:

masterha_check_ssh #检查MHA的
ssh-key masterha_check_repl #检查主从复制情况
masterha_manger #启动MHA
masterha_check_status #检测MHA的运行状态
masterha_master_monitor #检测master是否宕机
masterha_master_switch #手动故障转移
masterha_conf_host #手动添加server信息
masterha_secondary_check #建立TCP连接从远程服务器
masterha_stop #停止MHA

五.MHA的搭建

1、搭建MHA架构图

image.png

2、相关配置

192.168.0.4 manager
192.168.0.5 node1
192.168.0.6 node2
192.168.0.7 node3

为了方便操作,每个机器都做好解析vim /etc/hosts

3、部署一主多从的mysql集群

这里我们用192.168.0.5 node1 为集群的主节点

  • 在主节点上操作
[root@node1 ~]# vim /etc/my.cnf
    [mysqld]
    server-id = 1               //复制集群中的各节点的id均必须唯一
    log-bin = master-log        //开启二进制日志
    relay-log = relay-log       //开启中继日志
    skip_name_resolve           //关闭名称解析(非必须)
[root@node1 ~]# systemctl restart mysqld
# 进入主 mysql中添加主从同步时使用的用户
mysql> grant replication slave,replication client on *.* to 'slave'@'192.168.0.%' identified by 'keer';
mysql> flush privileges;
mysql> show master status\G
  • 所用从节点上操作
[root@node2 ~]# vim /etc/my.cnf
    [mysqld]
    server-id = 2               //复制集群中的各节点的id均必须唯一;
    relay-log = relay-log       //开启中继日志
    log-bin = master-log        //开启二进制日志
    read_only = ON              //启用只读属性
    relay_log_purge = 0         //是否自动清空不再需要中继日志
    skip_name_resolve           //关闭名称解析(非必须)
    log_slave_updates = 1       //使得更新的数据写进二进制日志中
[root@slave1 ~]# systemctl restart mysqld
# 进入从mysql服务器中,填写主从的配置
mysql> change master to master_host='node1', 
    -> master_user='slave', 
    -> master_password='keer',
    -> master_log_file='mysql-bin.000001',
    -> master_log_pos=415;
mysql> start slave;
mysql> show slave status\G

请确保server-id 的不同

4、安装配置MHA

  • 准备 ssh 互通环境

在所有服务器中执行

[root@manager ~]# ssh-keygen -t rsa
[root@manager ~]# ssh-copy-id -i .ssh/id_rsa.pub root@manager

在manager主机上执行

scp authorized_keys root@node1:~/.ssh/
scp authorized_keys root@node2:~/.ssh/
scp authorized_keys root@node3:~/.ssh/

这样我们就完成了四台机器之间基于ssh 互相通信,以实现远程控制及数据管理功能。简单起见,可在Manager节点生成密钥对儿,并设置其可远程连接本地主机后, 将私钥文件及authorized_keys文件复制给余下的所有节点即可。

  • 安装 MHA包

https://directory.fsf.org/wiki/Mha4mysql-manager

下载MHA manager 和node 包
mha4mysql-manager-0.580.el7.centos.noarch.rpm
mha4mysql-node-0.58-0.el7.centos.noarch.rpm

yum -y install mha4mysql-manager-0.580.el7.centos.noarch.rpm
yum -y install  mha4mysql-node-0.58-0.el7.centos.noarch.rpm
  • 定义 MHA 管理配置文件
    为MHA专门创建一个管理用户, 方便以后使用, 在mysql的主节点上, 三个节点自动同步:
[root@manager ~]# mkdir /etc/masterha
[root@manager ~]# vim /etc/masterha/app1.cnf
[server default]            //适用于server1,2,3个server的配置
user=mhaadmin               //mha管理用户
password=mhapass            //mha管理密码
manager_workdir=/etc/masterha/app1      //mha_master自己的工作路径
manager_log=/etc/masterha/manager.log   // mha_master自己的日志文件
remote_workdir=/mydata/masterha/app1        //每个远程主机的工作目录在何处
ssh_user=root               // 基于ssh的密钥认证
repl_user=slave             //数据库用户名
repl_password=keer      //数据库密码
ping_interval=1             //ping间隔时长
[server1]                   //节点1
hostname=192.168.0.5    //节点1主机地址
ssh_port=22                 //节点1的ssh端口
candidate_master=1          //主节点
[server2]
hostname=192.168.0.6
ssh_port=22
candidate_master=1
[server3]
hostname=192.168.0.7
ssh_port=22
candidate_master=1
  • 对三个节点进行检测
    1、检测各节点间 ssh 互信通信配置是否 ok
[root@manager ~]# masterha_check_ssh -conf=/etc/masterha/app1.cnf

如果最后一行显示为[info]All SSH connection tests passed successfully.则表示成功。

2、检查管理的MySQL复制集群的连接配置参数是否OK

[root@manager ~]# masterha_check_repl -conf=/etc/masterha/app1.cnf

最后出现 MySQL Replication Health is OK.则表示成功

  • 启动 MHA
    我们在 manager 节点上执行以下命令来启动 MHA:
[root@manager ~]# nohup masterha_manager -conf=/etc/masterha/app1.cnf &> /etc/masterha/manager.log &

启动成功以后,我们来查看一下 master 节点的状态:

[root@manager ~]# masterha_check_status -conf=/etc/masterha/app1.cnf
mha (pid:7598) is running(0:PING_OK), master:192.168.0.4

关闭MHA的命令

root@manager ~]# masterha_stop -conf=/etc/masterha/app1.cnf
  • 测试MHA的故障转移
    在mysql 主服务器node1中
[root@node1 ~]# systemctl stop mysqld 

在manager中查看日志

tail -200 /etc/master/manager.log
.....
.....
Master 192.168.0.5(192.168.0.5:3306) is down!

Check MHA Manager logs at node1:/etc/mha_master/manager.log for details.

Started automated(non-interactive) failover.
The latest slave 192.168.0.6(192.168.0.6:3306) has all relay logs for recovery.
Selected 192.168.0.6(192.168.0.6:3306) as a new master.
192.168.0.6(192.168.0.6:3306): OK: Applying all logs succeeded.
192.168.0.7(192.168.0.7:3306): This host has the latest relay log events.
Generating relay diff files from the latest slave succeeded.
192.168.0.7(192.168.0.7:3306): OK: Applying all logs succeeded. Slave started, replicating from 192.168.0.6(192.168.0.6:3306)
192.168.0.6(192.168.0.6:3306): Resetting slave info succeeded.
Master failover to 192.168.0.6(192.168.0.6:3306) completed successfully.

从中我们可以看到 检测到192.168.0.5 节点故障,然后执行了故障 转移,将192.168.0.6提升为了主节点。

注意,故障转移完成后, manager将会自动停止, 此时使用 masterha_check_status 命令检测将会遇到错误提示, 如下所示:

[root@manager ~]# masterha_check_status -conf=/etc/masterha/app1.cnf
mha is stopped(2:NOT_RUNNING).

你可能感兴趣的:(搭建mysql高可用集群之MHA)