MySQL数据库MHA高可用


MHA
MHA(MsterHigh Availability)目前在MySQL高可用方面是一个相对成熟的解决方案,是一套优秀的MySQL高可用环境下故障切换和主从复制软件。在MySQL故障切换过程中,MHA能做到在0~30秒之内自动完成数据库的故障切换操作,并且在进行故障切换的过程中,MHA能在最大程度上保证数据的一致性,以达到真正意义上的高可用。



MHA的组成
该软件由两部分组成:MHA Manager(管理节点)和MHA Node(数据节点)。MHA Manager可以单独部署在一台独立的机器上,管理多个master-slave集群:也可以部署在一台slave节点上。MHA Node运行在每台MySQL服务器上,MHA Manager会定时探测集群中的master节点。当master出现故障时,它可以自动将最新数据的slave提升为新的master,然后将所有其他的slave重新指向新的master。整个故障转移过程对应用程序完全透明。



MHA优势
在MHA自动故障切换过程中,MHA试图从宕机的主服务器上保存二进制日志,最大程度的保证数据的不丢失,但这并不总是可行的。例如,如果主服务器硬件故障或无法通过SSH访问,MHA无法保存二进制日志,就会出现只进行故障转移但丢失了最新数据的情况。使用MySQL5.5的半同步复制,可以大大降低数据丢失的风险。MHA可以与半同步复制结合起来。如果只有一个slave已经收到了最新的二进制日志,MHA可以将最新的二进制日志应用于其他所有的slave服务器上,因此可以保证所有节点的数据一致性。



MHA现状
目前MHA主要支持一主多从,要搭建MHA要求一个复制集群中必须最少有三台数据库服务器,即一台充当master,一台充当备用master,另外一台充当从库。



MHA架构
1)数据库
2)一主两从
3)MHA搭建

故障模拟
1)主库宕机
2)备选主库成为主库


案例环境
服务器 CentOS7.4(64 位) MHA-manager/20.0.0.34 管理节点,安装node、 manager 组件
服务器 CentOS7.4(64 位) Mysql1/20.0.0.31 Master 节点,安装 node 组件
服务器 CentOS7.4(64 位) Mysql2/20.0.0.32 Slave1 节点,安装 node 组件
服务器 CentOS7.4(64 位) Mysql3/20.0.0.33 Slave2 节点,安装 node 组件

(在搭建的时候,master 、slave1、slave2分别是mysql1、mysql2、mysql3)

这里的操作系统是 CentOS7 版本,所以这里下载 MHA 版本为0.57 版本。


案例需求
本案例要求通过 MHA 监控 MySQL 数据库在故障时进行自动切换,不影响业务。
3. 案例实现思路
1) 安装 MySQL 数据库
2) 配置 MySQL 一主两从
3) 安装 MHA 软件
4) 配置无密码认证
5) 配置 MySQL MHA 高可用
6) 模拟 master 故障切换

在三台 MySQL 节点上分别安装数据库,MySQL 版本请使用 5.6.36,cmake 版本使用 2.8.6。
以下为 Mysql1 上面安装mysql5.6.36,安装过程如下,另外两台mysql安装过程一样。

软件包:
cmake-2.8.6.tar.gz
mysql-5.6.36.tar.gz
放到/opt目录下

  1. 安装编译依赖的环境
    [root@Mysql1 ~]# yum -y install ncurses-devel gcc-c++ perl-Module-Install

  2. 安装 gmake 编译软件
    [root@Mysql1 ~]# tar zxvf cmake-2.8.6.tar.gz
    [root@Mysql1 ~]# cd cmake-2.8.6
    [root@Mysql1 cmake-2.8.6]# ./configure
    [root@Mysql1 cmake-2.8.6]# gmake -j4 && gmake install

  3. 安装 MySQL 数据库
    [root@Mysql1 ~]# tar -zxvf mysql-5.6.36.tar.gz
    [root@Mysql1 ~]# cd mysql-5.6.36
    cmake -DCMAKE_INSTALL_PREFIX=/usr/local/mysql
    -DDEFAULT_CHARSET=utf8
    -DDEFAULT_COLLATION=utf8_general_ci
    -DWITH_EXTRA_CHARSETS=all
    -DSYSCONFDIR=/etc
    [root@Mysql1 mysql-5.6.36]# make -j4 && make install
    [root@Mysql1 mysql-5.6.36]# cp support-files/my-default.cnf /etc/my.cnf
    [root@Mysql1 mysql-5.6.36]# cp support-files/mysql.server /etc/rc.d/init.d/mysqld
    [root@Mysql1 ~]# chmod +x /etc/rc.d/init.d/mysqld
    [root@Mysql1 ~]# chkconfig --add mysqld
    [root@Mysql1 ~]# echo “PATH=$PATH:/usr/local/mysql/bin” >> /etc/profile
    [root@Mysql1 ~]# source /etc/profile
    [root@Mysql1 ~]# groupadd mysql
    [root@Mysql1 ~]# useradd -M -s /sbin/nologin mysql -g mysql
    [root@Mysql1 ~]# chown -R mysql.mysql /usr/local/mysql
    [root@Mysql1 ~]# mkdir -p /data/mysql
    /usr/local/mysql/scripts/mysql_install_db
    –basedir=/usr/local/mysql
    –datadir=/usr/local/mysql/data
    –user=mysql

4.修改 Master和slave1、slave 的主配置文件/etc/my.cnf ,三台服务器的 server-id 不能一样。
master配置:
(在[mysqld]下找一个空地添加以下内容)
[root@Mysql1 ~]# cat /etc/my.cnf
[mysqld]
server-id = 1
log_bin = master-bin
log-slave-updates = true

配置slave1从服务器:
在/etc/my.cnf 中修改或者增加下面内容。
vim /etc/my.cnf
server-id = 2
log_bin = master-bin
relay-log = relay-log-bin
relay-log-index = slave-relay-bin.index

配置slave2从服务器:
在/etc/my.cnf 中修改或者增加下面内容。
vim /etc/my.cnf
server-id = 3
log_bin = master-bin
relay-log = relay-log-bin
relay-log-index = slave-relay-bin.index

  1. Mysql1、Mysql2、Mysql3 分别做两个软链接
    [root@Mysql1 ~]# ln -s /usr/local/mysql/bin/mysql /usr/sbin/
    [root@Mysql1 ~]# ln -s /usr/local/mysql/bin/mysqlbinlog /usr/sbin/

  2. Mysql1、Mysql2、Mysql3 启动 MySQL。
    [root@Mysql1 ~]# /usr/local/mysql/bin/mysqld_safe --user=mysql &

  3. 配置 MySQL 一主两从

1)MySQL 主从配置相对比较简单。需要注意的是授权。步骤如下:
在所有数据库节点上授权两个用户,一个是从库同步使用用户myslave,另外一个是 manager 使用监控用户mha。
mysql> grant replication slave on . to ‘myslave’@‘20.0.0.%’ identified by ‘123’;
mysql> grant all privileges on . to ‘mha’@‘20.0.0.%’ identified by ‘manager’;
mysql> flush privileges;

2)下面三条授权按理论是不用添加的,但是做案例实验环境时候通过 MHA 检查MySQL 主从有报两个从库通过主机名连接不上主库的错,所以所有数据库加上以下授权。
mysql> grant all privileges on . to ‘mha’@‘master’ identified by ‘manager’;
mysql> grant all privileges on . to ‘mha’@‘slave1’ identified by ‘manager’;
mysql> grant all privileges on . to ‘mha’@‘slave2’ identified by ‘manager’;

3)在 master 上查看二进制文件和同步点
mysql> show master status;
二进制文件:master-bin.000001
Position:1363 (数字不是固定的,根据实际给出的数字为准)

4)在 slave1 和 slave2都执行同步。
mysql> change master to master_host=‘20.0.0.31’,master_user=‘myslave’,master_password=‘123’,master_log_file=‘master-bin.000001’,master_log_pos= 1363;
mysql> start slave;

5)查看 IO 和 SQL 线程都是 yes 代表同步是否正常。
mysql> show slave status\G;
Slave_IO_Running: Yes
Slave_SQL_Running: Yes

6) 然后设置slave1和slave2两个从库为只读模式:
mysql> set global read_only=1;


验证主从复制功能,关于主从复制详细参考https://blog.csdn.net/KY05QK/article/details/109207193





安装MHA软件

1.所有服务器上都安装 MHA 依赖的环境,首先安装 epel 源。
[root@MHA-manager ~]# yum install epel-release --nogpgcheck -y

yum install -y perl-DBD-MySQL
perl-Config-Tiny
perl-Log-Dispatch
perl-Parallel-ForkManager
perl-ExtUtils-CBuilder
perl-ExtUtils-MakeMaker
perl-CPAN

(如果在执行yum install epel-release --nogpgcheck -y,有提示找不到包,例如提示没有epel-release包,通过将yum本地源换成官方源解决,
执行命令:
mv /etc/yum.repos.d/backup/CentOS-Base.repo /etc/yum.repos.d/
mv /etc/yum.repos.d/local.repo /etc/yum.repos.d/backup/

2.MHA 软件包对于每个操作系统版本不一样,这里 CentOS7.4 必须选择 0.57 版本,在所有服务器上必须先安装 node 组件,最后在 MHA-manager 节点上安装 manager 组件,因为 manager 依赖 node 组件,以下在 master(mysql1)服务器上安装 node 组件,其他服务器一样。

将软件包mha4mysql-node-0.57.tar.gz传到/opt目录下

[root@Mysql1 ~]# tar zxvf mha4mysql-node-0.57.tar.gz
[root@Mysql1 ~]# cd mha4mysql-node-0.57
[root@Mysql1 mha4mysql-node-0.57]# perl Makefile.PL
[root@Mysql1 mha4mysql-node-0.57]# make
[root@Mysql1 mha4mysql-node-0.57]# make install


3.在 MHA-manager 上安装 manager 组件(一定要先安装node 组件才能安装manager 组件)

将mha4mysql-manager-0.57.tar.gz软件包传到/opt目录下

[root@MHA-manager ~]# tar zxvf mha4MHA-manager-0.57.tar.gz
[root@MHA-manager ~]# cd mha4MHA-manager-0.57
[root@MHA-manager mha4MHA-manager-0.57]# perl Makefile.PL
[root@MHA-manager mha4MHA-manager-0.57]# make
[root@MHA-manager mha4MHA-manager-0.57]# make install

备注:
manager 安装后在/usr/local/bin 下面会生成几个工具,主要包括以下几个:
masterha_check_ssh #检查 MHA 的 SSH 配置状况
masterha_check_repl #检查 MySQL 复制状况
masterha_manger #启动 manager的脚本
masterha_check_status #检测当前 MHA 运行状态
masterha_master_monitor #检测 master 是否宕机
masterha_master_switch #控制故障转移(自动或者手动)
masterha_conf_host #添加或删除配置的 server 信息
masterha_stop #关闭manager


4. node 安装后也会在/usr/local/bin 下面会生成几个脚本(这些工具通常由 MHA Manager 的脚本触发,无需人为操作)主要如下:

save_binary_logs 保存和复制 master 的二进制日志
apply_diff_relay_logs 识别差异的中继日志事件并将其差异的事件应用于其他的 slave
filter_mysqlbinlog 去除不必要的 ROLLBACK 事件(MHA 已不再使用这个工具)
purge_relay_logs 清除中继日志(不会阻塞 SQL 线程)


5. 配置无密码认证
1.) 在 manager 上配置到所有数据库节点的无密码认证
[root@MHA-manager ~]# ssh-keygen -t rsa //一路按回车键
[root@MHA-manager ~]# ssh-copy-id 20.0.0.31
[root@MHA-manager ~]# ssh-copy-id 20.0.0.32
[root@MHA-manager ~]# ssh-copy-id 20.0.0.33
2.)在 Mysql1 上配置到数据库节点Mysql2和Mysql3的无密码认证
[root@Mysql1 ~]# ssh-keygen -t rsa
[root@Mysql1 ~]# ssh-copy-id 20.0.0.32
[root@Mysql1 ~]# ssh-copy-id 20.0.0.33
3.)在 Mysql2 上配置到数据库节点Mysql1和Mysql3的无密码认证
[root@Mysql2 ~]# ssh-keygen -t rsa
[root@Mysql2 ~]# ssh-copy-id 20.0.0.31
[root@Mysql2 ~]# ssh-copy-id 20.0.0.33
4.)在 Mysql3 上配置到数据库节点Mysql1和Mysql2的无密码认证
[root@Mysql3 ~]# ssh-keygen -t rsa
[root@Mysql3 ~]# ssh-copy-id 20.0.0.31
[root@Mysql3 ~]# ssh-copy-id 20.0.0.32


6.配置 MHA
1)在 manager 节点上复制相关脚本到/usr/local/bin 目录。
[root@MHA-manager ~]# cp -ra /opt/mha4mysql-manager-0.57/samples/scripts/ /usr/local/bin
//拷贝后会有四个执行文件
[root@atlas ~]# ll /usr/local/bin/scripts/
总用量 32
-rwxr-xr-x 1 mysql mysql 3648 5 月 31 2015 master_ip_failover #自动切换时 VIP 管理的脚本
-rwxr-xr-x 1 mysql mysql 9872 5 月 25 09:07 master_ip_online_change #在线切换时 vip 的管理
-rwxr-xr-x 1 mysql mysql 11867 5 月 31 2015 power_manager #故障发生后关闭主机的脚本
-rwxr-xr-x 1 mysql mysql 1360 5 月 31 2015 send_report #因故障切换后发送报警的脚本

2)复制上述的自动切换时 VIP 管理的脚本到/usr/local/bin 目录,这里使用脚本管理 VIP。
[root@MHA-manager ~]# cp /usr/local/bin/scripts/master_ip_failover /usr/local/bin

3)修改内容如下:

[root@MHA-manager ~]#vim /usr/local/bin/master_ip_failover
(删除原有内容,替换如下内容)
#!/usr/bin/env perl
use strict;
use warnings FATAL => 'all';

use Getopt::Long;

my (
$command, $ssh_user, $orig_master_host, $orig_master_ip,
$orig_master_port, $new_master_host, $new_master_ip, $new_master_port
);
#############################添加内容部分#########################################
my $vip = '20.0.0.200';
my $brdc = '20.0.0.255';
my $ifdev = 'ens33';
my $key = '1';
my $ssh_start_vip = "/sbin/ifconfig ens33:$key $vip";
my $ssh_stop_vip = "/sbin/ifconfig ens33:$key down";
my $exit_code = 0;
#my $ssh_start_vip = "/usr/sbin/ip addr add $vip/24 brd $brdc dev $ifdev label $ifdev:$key;/usr/sbin/arping -q -A -c 1 -I $ifdev $vip;iptables -F;";
#my $ssh_stop_vip = "/usr/sbin/ip addr del $vip/24 dev $ifdev label $ifdev:$key";
##################################################################################
GetOptions(
'command=s' => \$command,
'ssh_user=s' => \$ssh_user,
'orig_master_host=s' => \$orig_master_host,
'orig_master_ip=s' => \$orig_master_ip,
'orig_master_port=i' => \$orig_master_port,
'new_master_host=s' => \$new_master_host,
'new_master_ip=s' => \$new_master_ip,
'new_master_port=i' => \$new_master_port,
);

exit &main();

sub main {
     

print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n";

if ( $command eq "stop" || $command eq "stopssh" ) {
     

my $exit_code = 1;
eval {
     
print "Disabling the VIP on old master: $orig_master_host \n";
&stop_vip();
$exit_code = 0;
};
if ($@) {
     
warn "Got Error: $@\n";
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "start" ) {
     

my $exit_code = 10;
eval {
     
print "Enabling the VIP - $vip on the new master - $new_master_host \n";
&start_vip();
$exit_code = 0;
};
if ($@) {
     
warn $@;
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "status" ) {
     
print "Checking the Status of the script.. OK \n";
exit 0;
}
else {
     
&usage();
exit 1;
}
}
sub start_vip() {
     
`ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`;
}
# A simple system call that disable the VIP on the old_master
sub stop_vip() {
     
`ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`;
}

sub usage {
     
print
"Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n";
}

复制过来后每一行前面都会有#号,这时候在命令行模式输入如下即可:
:% s/^#//

4)创建 MHA 软件目录并拷贝配置文件。
[root@MHA-manager ~]# mkdir /etc/masterha
[root@MHA-manager ~]# cp /opt/mha4mysql-manager-0.57/samples/conf/app1.cnf /etc/masterha/
[root@MHA-manager ~]# vim /etc/masterha/app1.cnf

删除原有内容,替换以下内容:
[server default]
manager_log=/var/log/masterha/app1/manager.log
manager_workdir=/var/log/masterha/app1
master_binlog_dir=/usr/local/mysql/data
master_ip_failover_script=/usr/local/bin/master_ip_failover
master_ip_online_change_script=/usr/local/bin/master_ip_online_change
password=manager
user=mha
ping_interval=1
remote_workdir=/tmp
repl_password=123
repl_user=myslave
secondary_check_script=/usr/local/bin/masterha_secondary_check -s 20.0.0.32 -s 20.0.0.33
shutdown_script=""
ssh_user=root
user=root

[server1]
hostname=20.0.0.31
port=3306

[server2]
candidate_master=1
check_repl_delay=0
hostname=20.0.0.32
port=3306

[server3]
hostname=20.0.0.33
port=3306

配置文件解析:
[server default]
manager_workdir=/var/log/masterha/app1.log               ##manager工作目录
manager_log=/var/log/masterha/app1/manager.log            #manager日志
master_binlog_dir=/usr/local/mysql/data/                #master保存binlog的位置,这里的路径要与master里配置的binlog的路径一致,以便mha能找到
#master_ip_failover_script= /usr/local/bin/master_ip_failover    #设置自动failover时候的切换脚本,也就是上边的哪个脚本
master_ip_online_change_script= /usr/local/bin/master_ip_online_change  #设置手动切换时候的切换脚本
password=manager      #设置mysql中root用户的密码,这个密码是前文中创建监控用户的那个密码
user=mha        #设置监控用户root
ping_interval=1      #设置监控主库,发送ping包的时间间隔,默认是3秒,尝试三次没有回应的时候自动进行railover
remote_workdir=/tmp    #设置远端mysql在发生切换时binlog的保存位置
repl_password=123        #设置复制用户的密码
repl_user=myslave           #设置复制用户的用户
report_script=/usr/local/send_report      //设置发生切换后发送的报警的脚本
secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.195.130 -s 192.168.195.131
shutdown_script=""  #设置故障发生后关闭故障主机脚本(该脚本的主要作用是关闭主机放在发生脑裂,这里没有使用)
ssh_user=root      #设置ssh的登录用户名

[server1]
hostname=20.0.0.31
port=3306

[server2]
hostname=20.0.0.32
port=3306
candidate_master=1    #//设置为候选master,如果设置该参数以后,发生主从切换以后将会将此从库提升为主库,即使这个主库不是集群中事件最新的slave
check_repl_delay=0    #默认情况下如果一个slave落后master 100M的relay logs的话,MHA将不会选择该slave作为一个新的master,因为对于这个slave的恢复需要花费很长时间,通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,因为这个候选主在切换的过程中一定是新的master

[server3]
hostname=20.0.0.33
port=3306

5)测试 ssh 无密码认证,如果正常最后会输出 successfully,如下所示。
[root@MHA-manager ~]# masterha_check_ssh -conf=/etc/masterha/app1.cnf
MySQL数据库MHA高可用_第1张图片


MySQL5.7注意:
注释/etc/my.cnf 中 【client】下 #default-character-set=utf8
在所有数据库中建立以下指令软连接
ln -s /usr/local/mysql/bin/mysql /usr/sbin/
ln -s /usr/local/mysql/bin/mysqlbinlog /usr/sbin/

6)健康检查
[root@MHA-manager ~]# masterha_check_repl -conf=/etc/masterha/app1.cnf
MySQL数据库MHA高可用_第2张图片



#注意:第一次配置需要去master上手动开启虚拟IP
[root@master ~]# /sbin/ifconfig ens33:1 20.0.0.200/24



7. 启动 MHA
[root@MHA-manager ~]# nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/masterha/app1/manager.log 2>&1 &
[1] 53582

解释:
–remove_dead_master_conf 该参数代表当发生主从切换后,老的主库的 ip 将会从配置文件中移除。
–manger_log 日志存放位置。
–ignore_last_failover 在缺省情况下,如果 MHA 检测到连续发生宕机,且两次宕机间隔不足 8 小时的话,则不会进行 Failover,之所以这样限制是为了避免 ping-pong 效应。该参数代表忽略上次 MHA 触发切换产生的文件,默认情况下,MHA 发生切换后会在日志记录,也就是上面设置的日志 app1.failover.complete 文件,下次再次切换的时候如果发现该目录下存在该文件将不允许触发切换,除非在第一次切换后收到删除该文件,为了方便,这里设置为–ignore_last_failover。



8.查看 MHA 状态,可以看到当前的 master 是 Mysql1 节点。
[root@MHA-manager ~]# masterha_check_status --conf=/etc/masterha/app1.cnf
app1 (pid:53582) is running(0:PING_OK), master:20.0.0.31



9.查看 MHA 日志,也以看到当前的 master 是 20.0.0.31
[root@MHA-manager ~]# cat /var/log/masterha/app1/manager.log



10.查看 Mysql1 的 VIP 地址 20.0.0.200 ,这个 VIP 地址不会因为manager 节点停止而消失。
[root@Mysql1 ~]# ifconfig

MHA搭建完成。




测试:

在manager服务器上:
[root@MHA-manager ~]#tailf /var/log/masterha/app1/manager.log //启用监控观察日志记录

在master服务器上:
[root@Mysql1 ~]# pkill -9 mysqld //让现在的master宕掉,查看master的变化

可以看到从库的状态,其中之一肯定有切换为主库的
现在slave1从库变为了主库:
MySQL数据库MHA高可用_第3张图片
在这里插入图片描述


切换备选主库的算法:
1.一般判断从库的是从(position/GTID)判断优劣,数据有差异,最接近于master的slave,成为备选主。
2.数据一致的情况下,按照配置文件顺序,选择备选主库。
3.设定有权重(candidate_master=1),按照权重强制指定备选主。
1)默认情况下如果一个slave落后master 100M的relay logs的话,即使有权重,也会失效。
2)如果check_repl_delay=0的话,即使落后很多日志,也强制选择其为备选主。


故障修复:
1.修复db,恢复原master数据库
/etc/init.d/mysqld start
2.修复主从,在mysql1上
>change master to master_host=‘20.0.0.32’,master_port=3306,master_log_file=‘master-bin.000001’,master_log_pos=1363,master_user=‘myslave’,master_password=‘123’;
>start slave;
3.在manager上修改配置文件(再把这个记录添加进去,因为它检测掉失效时候会自动消失)
vim /etc/masterha/app1.cnf
[server1]
hostname=20.0.0.31
port=3306
4.启动manager(在manager那台机器上)
nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/masterha/app1/manager.log 2>&1 &

备注:
dos2unix /usr/local/bin/master_ip_failover 解决中英字不兼容报错的问题

你可能感兴趣的:(linux,mysql,MHA)