MySQL ---- MHA高可用群集架构

MySQL ---- MHA高可用群集架构

前言:

​ MHA目前在MySQL高可用方面是一个相对成熟的解决方案,它由日本DeNA公司youshimaton (现就职于Facebook公司) 开发,是一套优秀的作为MySQL高可用性环境下故障切换和主从提升的高可用软件。 在MySQL故障切换过程中,MHA能做到在0~30秒之内自动完成数据库的故障切换操作,并且在进行故障切换的过程中,MHA能在最大程度上保证数据的一致性,以达到真正意义上的高可用。

一:MHA的组成

  • MHA Manager (管理节点)

可以单独部署在一台独立的机器上管理多个master-slave集群,也可以部署在一台slave节点上 。会定时探测集群中的master节点,当master出现故障时,它可以自动将最新数据的slave提升为新的master,然后将所有其他的slave重新指向新的master

  • MHA Node (数据节点)

运行在每台MySQL服务器上

二:MHA的特点

  • 自动故障切换过程中,MHA试图从宕机的主服务器上保存二进制日志,最大程度的保证数据的不丢失

  • 使用MySQL 5.5的半同步复制,可以大大降低数据丢失的风险

三:实验配置

1、拓扑图

MySQL ---- MHA高可用群集架构_第1张图片

2、需求

  • 通过MHA监控MySQL数据库,在故障时自动进行切换,不影响业务
  • 当主库失效时,备选主库自动成为主库

3、实验环境

  • 一台centos7作为MHA-manager (操作系统是centos7,所以要下载MHA 0.57版本)

    【 MHA ---- IP地址 : 192.168.34.190 】

  • 三台装有mysql 服务器的centos7 【 1台主服务器 ,2台从服务器 (其中一台为主备)】

    【 主服务器(master)IP地址 :192.168.34.188

    ​ 从服务器(slave1)IP地址 : 192.168.34.189

    ​ 从服务器(slave2)IP地址 : 192.168.34.192 】

所需软件包自行下载:

链接 : https://pan.baidu.com/s/1C4ESguj2uB_YJdrZlKW13A 提取码: erh3

4、实验过程

mysql安装之前博客有写过,这里就不详细介绍了。

(1)配置mysql 的一主两从
  • 在 主服务器上 (master)

[root@master ~]# vim /etc/my.cnf    
‘添加两行’
server-id = 1
log-bin=master-bin
log-slave-updates=true

MySQL ---- MHA高可用群集架构_第2张图片

[root@master ~]# systemctl restart mysqld         ‘开启服务’
[root@master ~]# systemctl stop firewalld.service 
[root@master ~]# setenforce 0            ‘关闭防火墙’
  • 在 从服务器上 (slave1)

[root@slave1 ~]# vim /etc/my.cnf
‘添加三行’
server-id = 2
log-bin=slave-bin
relay-log=relay-log-bin
relay-log-index=slave-relay-bin.index

因为mysql手工编译安装的是5.7版本,所以从服务器要在client段把utf-8这行注释掉,否则检查MHA健康状况时报错。

MySQL ---- MHA高可用群集架构_第3张图片

[root@slave1 ~]# systemctl restart mysqld
[root@slave1 ~]# systemctl stop firewalld.service 
[root@slave1 ~]# setenforce 0

同样的,另一台从服务器(slave2)也需要配置
MySQL ---- MHA高可用群集架构_第4张图片

(2)在 三台mysql 服务器上创建软链接
[root@master ~]# ln -s /usr/local/mysql/bin/mysql /usr/sbin
[root@master ~]# ln -s /usr/local/mysql/bin/mysqlbinlog /usr/sbin
  • 在 主服务器上

(3)在所有数据库节点上授权两个用户,一个是从库同步使用的用户‘“myslave” ,密码设置为’‘123’‘ ; 另一个是 manager 使用监控用户“ mha ” ,密码设置为 “manager”

[root@master ~]# mysql -uroot -p123         ’进入数据库‘
mysql> grant replication slave on *.* to 'myslave'@'192.168.34.%' identified by'123';            ’给从服务器授权访问主服务器‘
mysql> grant all privileges on *.* to 'mha'@'192.168.34.%' identified by 'manager';
mysql> flush privileges;        ’刷新‘
(4)查看主服务器上二进制文件和同步点

MySQL ---- MHA高可用群集架构_第5张图片

两台从服务器上( slave1 、slave2 )也需要授权 :

MySQL ---- MHA高可用群集架构_第6张图片

  • 在从服务器上

(5)在两台从服务器中 (slave1 、slave2) 分别执行同步
mysql> change master to master_host='192.168.34.188',master_user='myslave',master_password='123',master_log_file='master-bin.000001',master_log_pos=1745;
(6) 查看两台服务器是否与主服务器同步

MySQL ---- MHA高可用群集架构_第7张图片

(7)设置两台从服务器为只读模式
mysql> set global read_only=1;     

四:配置MHA

1、所有服务器上都安装 MHA依赖的环境包 ,先安装epel 源
yum install epel-release --nogpgcheck mysql -y

yum install -y perl-DBD-MySQL \
perl-Config-Tiny \
perl-Log-Dispatch \
perl-Parallel-ForkManager \
perl-ExtUtils-CBuilder \
perl-ExtUtils-MakeMaker \
perl-CPAN
2、manager 依赖node组件,所以 所有服务器上都要安装node组件,最后在MHA-manager节点上安装manager组件。
  • 所有服务器上都要安装node组件

    (不一一展示出来了)

[root@master ~]# mount.cifs //192.168.10.24/share /abc
[root@master ~]# cd /abc
[root@master abc]# tar zxvf mha4mysql-node-0.57.tar.gz -C /opt
[root@master abc]# cd /opt/mha4mysql-node-0.57/
[root@master mha4mysql-node-0.57]# perl Makefile.PL 
[root@master mha4mysql-node-0.57]# make && make install

(先安装node组件,再安装manager组件)

  • 在MHA-manager 上安装manager 组件
[root@manager ~]# cd /abc
[root@manager abc]# tar zxvf mha4mysql-manager-0.57.tar.gz -C /opt
[root@manager abc]# cd /opt/mha4mysql-manager-0.57/
[root@manager mha4mysql-manager-0.57]# perl Makefile.PL
[root@manager mha4mysql-manager-0.57]# make && make install
3、manager 服务器安装后会在 /usr/local/bin 目录下生成几个工具。

MySQL ---- MHA高可用群集架构_第8张图片

masterha_check_ssh: 检查 MHA 的SSH配置状况
masterha_check_repl: 检查 MYSQL 复制状况
masterha_manager: 启动 manager 的脚本
masterha_check_status: 检查当前 MHA 的运行状态
masterha_master_monitor: 检测 master 是否宕机
masterha_master_switch : 开始故障转移 (自动或者手动)
masterha_conf_host: 添加或者删除配置的 server 信息
masterha_stop: 关闭manager

4、安装node 组件也生成了几个工具 ,通常由MHA-manager 的脚本触发,无需认为操作。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Qp9Dak85-1579003374667)(C:\Users\xumin\AppData\Roaming\Typora\typora-user-images\1578990500286.png)]

apply_diff_relay_logs : 识别差异的中继日志事件并将其差异的事件应用于其他的 slave
save_binary_logs: 保存和复制 master 的二进制日志
filter_mysqlbinlog : 去除不必要的 ROLLBACK 事件 (MHA 已不再使用这个工具)
purge_relay_logs: 清除中继日志(不会阻塞 SQL 线程)

5、配置无密码认证
  • 在manager 上配置到所有数据库节点的无密码认证
[root@manager ~]# ssh-keygen -t rsa		‘非对称密钥形式,无密码认证,全部按回车键’
[root@manager ~]# ssh-copy-id 192.168.34.188
Are you sure you want to continue connecting (yes/no)?  yes
[email protected]'s password: 				‘输入主服务器密码’

[root@manager ~]# ssh-copy-id 192.168.34.189          ‘步骤一致’
[root@manager ~]# ssh-copy-id 192.168.34.192

  • 在master上配置到数据库节点slave1和slave2 的无密码认证
[root@master ~]# ssh-keygen -t rsa
[root@master ~]# ssh-copy-id 192.168.34.189
[root@master ~]# ssh-copy-id 192.168.34.192
  • 在slave1 上配置数据库节点 master 和slave2 的无密码认证
[root@slave1 ~]# ssh-keygen -t rsa
[root@slave1 ~]# ssh-copy-id 192.168.34.188
[root@slave1 ~]# ssh-copy-id 192.168.34.192
  • 在 slave2 上配置数据库节点 master 和slave1 的密码认证
[root@slave2 ~]# ssh-keygen -t rsa
[root@slave2 ~]# ssh-copy-id 192.168.34.188
[root@slave2 ~]# ssh-copy-id 192.168.34.189

6、配置MHA-Manager 组件

  • 在manager 节点上 复制相关脚本到 /usr/local/bin 的目录
[root@manager ~]# cp -ra /opt/mha4mysql-manager-0.57/samples/scripts/ /usr/local/bin/ 

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HVqopxb0-1579003374667)(C:\Users\xumin\AppData\Roaming\Typora\typora-user-images\1578992115371.png)]

master_ip_failover : 自动切换时 VIP 管理的脚本

master_ip_online_change : 在线切换时 VIP 的管理

power_manager : 故障发生后关闭主机的脚本

send_report : 因故障切换后发送报警的脚本

  • 将自动切换时VIP 管理的脚本复制到 /usr/local/bin/目录下
[root@manager scripts]# cp /usr/local/bin/scripts/master_ip_failover /usr/local/bin/
7、重新编写master_ip_failover 脚本

(删除原有内容,增加以下内容 。 也可以在原有内容上进行修改,注意不要改错)

[root@manager scripts]#  vim /usr/local/bin/master_ip_failover

#!/usr/bin/env perl
use strict;
use warnings FATAL => 'all';

use Getopt::Long;

my (
$command, $ssh_user, $orig_master_host, $orig_master_ip,
$orig_master_port, $new_master_host, $new_master_ip, $new_master_port
);
#############################添加内容部分#########################################
my $vip = '192.168.34.100';
my $brdc = '192.168.34.255';
my $ifdev = 'ens33';
my $key = '1';
my $ssh_start_vip = "/sbin/ifconfig ens33:$key $vip";
my $ssh_stop_vip = "/sbin/ifconfig ens33:$key down";
my $exit_code = 0;
#my $ssh_start_vip = "/usr/sbin/ip addr add $vip/24 brd $brdc dev $ifdev label $ifdev:$key;/usr/sbin/arping -q -A -c 1 -I $ifdev $vip;iptables -F;";
#my $ssh_stop_vip = "/usr/sbin/ip addr del $vip/24 dev $ifdev label $ifdev:$key";
##################################################################################
GetOptions(
'command=s' => \$command,
'ssh_user=s' => \$ssh_user,
'orig_master_host=s' => \$orig_master_host,
'orig_master_ip=s' => \$orig_master_ip,
'orig_master_port=i' => \$orig_master_port,
'new_master_host=s' => \$new_master_host,
'new_master_ip=s' => \$new_master_ip,
'new_master_port=i' => \$new_master_port,
);

exit &main();

sub main {

print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n";

if ( $command eq "stop" || $command eq "stopssh" ) {

my $exit_code = 1;
eval {
print "Disabling the VIP on old master: $orig_master_host \n";
&stop_vip();
$exit_code = 0;
};
if ($@) {
warn "Got Error: $@\n";
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "start" ) {

my $exit_code = 10;
eval {
print "Enabling the VIP - $vip on the new master - $new_master_host \n";
&start_vip();
$exit_code = 0;
};
if ($@) {
warn $@;
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "status" ) {
print "Checking the Status of the script.. OK \n";
exit 0;
}
else {
&usage();
exit 1;
}
}
sub start_vip() {
`ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`;
}
# A simple system call that disable the VIP on the old_master
sub stop_vip() {
`ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`;
}

sub usage {
print
"Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n";
}
8、创建 MHA软件目录并拷贝配置文件
[root@manager scripts]# vim /etc/masterha/app1.cnf

[server default]
manager_log=/var/log/masterha/app1/manager.log        ‘manager工作日志’
manager_workdir=/var/log/masterha/app1         ‘manager工作目录’
master_binlog_dir=/usr/local/mysql/data      ‘master保存binlog的位置’
master_ip_failover_script=/usr/local/bin/master_ip_failover
master_ip_online_change_script=/usr/local/bin/master_ip_online_change
password=manager         ‘设置mysql中的root密码,就是创建监控用户的密’
ping_interval=1      
remote_workdir=/tmp      ‘设置远端mysql在发生切换时binlog的保存位置’
repl_password=123      ‘设置复制用户的密码’
repl_user=myslave      ‘设置复制用户的用户’
secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.34.189 -s 192.168.34.192
shutdown_script=""
ssh_user=root          ‘设置ssh的登录用户名’
user=mha

[server1]
hostname=192.168.34.188
port=3306

[server2]
candidate_master=1       
check_repl_delay=0
hostname=192.168.34.189
port=3306

[server3]
hostname=192.168.34.192
port=3306
9、测试SSH密钥验证
[root@manager scripts]# masterha_check_ssh -conf=/etc/masterha/app1.cnf

出现 successfully 说明正常
MySQL ---- MHA高可用群集架构_第9张图片

10 、检查健康状态
[root@manager ~]# masterha_check_repl -conf=/etc/masterha/app1.cnf

MySQL ---- MHA高可用群集架构_第10张图片

11、在master 上手动配置虚拟IP
[root@master ~]# /sbin/ifconfig ens33:1 192.168.34.100/24
12、启动MHA
[root@manager ~]#  nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/masterha/app1/manager.log 2>&1 &
  • 查看MHA状态,可看到当前master 是mysql1节点
[root@manager ~]# masterha_check_status --conf=/etc/masterha/app1.cnf
app1 (pid:8469) is running(0:PING_OK), master:192.168.34.188

五:故障模拟

1、启用监控观察日志记录
[root@manager ~]# tailf /var/log/masterha/app1/manager.log
2、在主服务器上关闭服务,查看状态
[root@master ~]# systemctl stop mysqld
3、在从服务器(slave1)上查看

MySQL ---- MHA高可用群集架构_第11张图片

因为一开始的主服务器被关闭了,虚拟IP切换到slave1上,slave1 自动成为主服务器了。

在manager 上查看 :
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CQlRdum3-1579003374669)(C:\Users\xumin\AppData\Roaming\Typora\typora-user-images\1579001953544.png)]

4、在客户机上可以通过虚拟ip ,连接数据库
[root@manager ~]# mysql -h 192.168.34.100 -p123

如 报错: (ERROR 1045 (28000): Access denied for user ‘root’@‘192.168.34.190’ (using password: YES)

则 需要给新的主服务器添加权限 : mysql> grant all on . to ‘root’@’%’ identified by ‘123’;

5、在manger 上添加一个库,可以在新的主服务器和 从服务器(slave2 )中查看到

MySQL ---- MHA高可用群集架构_第12张图片

你可能感兴趣的:(MySQL)