MHA是一种方便简单可靠的MySQL高可用架构
该软件由两部分组成:MHA Manager(管理节点)和MHA Node(数据节点)
MHA Manager可以单独部署在一台独立的机器上管理多个master-slave集群,也可以部署在一台slave节点上。MHA Node运行在每台MySQL服务器上,MHA Manager会定时探测集群中的master节点,当master出现故障时,它可以自动将最新数据的slave提升为新的master,然后将所有其他的slave重新指向新的master。整个故障转移过程对应用程序完全透明。
在MHA自动故障切换过程中,MHA试图从宕机的主服务器上保存二进制日志,最大程度的保证数据的不丢失,但这并不总是可行的。例如,如果主服务器硬件故障或无法通过ssh访问,MHA没法保存二进制日志,只进行故障转移而丢失了最新的数据。使用MySQL 5.5的半同步复制,可以大大降低数据丢失的风险。MHA可以与半同步复制结合起来。如果只有一个slave已经收到了最新的二进制日志,MHA可以将最新的二进制日志应用于其他所有的slave服务器上,因此可以保证所有节点的数据一致性。
原理图
大概的安装步骤
1) 用ssh-keygen实现四台主机之间相互免密钥登录
2) 安装MHAmha4mysql-node,mha4mysql-manager和perl环境包
3) 管理机manager上配置MHA文件
4) masterha_check_ssh工具验证ssh信任登录是否成功
5) masterha_check_repl工具验证mysql复制是否成功
6) 搭建虚拟IP,MHA自动切换后,IP漂移
7) 启动MHA manager,并监控日志文件
8) 测试master宕机后,是否会自动切换
9) 处理原master主机,MHA重新修改搭建
下面就开始搭建MHA,mysql的主从已经搭建好了,这里就不介绍主从搭建了。
准备主机和IP分配
主机 | IP |
MHA管理机 | 192.168.88.132 |
mysql master机 | 192.168.88.129 |
mysql slave从机1 | 192.168.88.130 |
mysql slave从机2 | 192.168.88.131 |
虚拟IP | 192.168.88.188 |
一、四台主机相互免密钥登录
参考 Linux机器之间免密登录设置_小何117KNO的博客-CSDN博客_linux 免密登录
例如:在master主机做免密登录
ssh-keygen -t rsa ##enter键执行3次
ssh-copy-id -i ~/.ssh/id_rsa.pub 192.168.88.130 ##含义是对192.168.88.130登录做免密
ssh-copy-id -i ~/.ssh/id_rsa.pub 192.168.88.131 ##含义是对192.168.88.131登录做免密
ssh-copy-id -i ~/.ssh/id_rsa.pub 192.168.88.132 ##含义是对192.168.88.132登录做免密
在4台主机都需要相互做一些免密登录。验证直接
ssh 192.168.88.130
看是否能正常进入
二、安装MHAmha4mysql-node,mha4mysql-manager和perl环境包
perl-Config-Tiny-2.14-7.el7.noarch.rpm
perl-Email-Date-Format-1.002-15.el7.noarch.rpm
perl-Log-Dispatch-2.41-1.el7.1.noarch.rpm
perl-Mail-Sender-0.8.23-1.el7.noarch.rpm
perl-Mail-Send-Loop-0.3-alt1.noarch.rpm ##没有装成功 后面发现不需要
perl-Mail-Sendmail-0.79-21.el7.noarch.rpm
perl-MIME-Lite-3.030-1.el7.noarch.rpm
perl-MIME-Types-1.38-2.el7.noarch.rpm
perl-Parallel-ForkManager-1.18-2.el7.noarch.rpm
perl-Params-Validate-1.08-4.el7.x86_64.rpm
下载的地址在
https://centos.pkgs.org/下载
https://pkgs.org/search/?q=Socket 下载推荐
mha manager下载
https://github.com/yoshinorim/mha4mysql-manager/releases
mha node下载
https://github.com/yoshinorim/mha4mysql-node/releases
直接用yum localinstall *.rpm安装即可,有问题直接百度;
三、管理机manager上配置MHA文件
vim /etc/masterha/app1.cnf
[server default]
manager_workdir=/masterha/app1 ##工作目录 目录需要自己创建
manager_log=/masterha/app1/manager.log ##日志文件 目录需要自己创建
master_ip_failover_script=/etc/masterha/master_ip_failover ##vip切换脚本
user=manager ##操作mysql的账户 三台主机都必须一样
password=123456 ##操作mysql的密码 三台主机都必须一样
ssh_user=root ##ssh面密登录账户
repl_user=rpl ##mysql的复制账户
repl_password=123456 ##mysql的复制密码
ping_interval=1 ##每隔ping_interval秒检测主库心跳,最多四次机会,如果都没有心跳,主库宕机
[server1]
hostname=192.168.88.130 ##mysql master主机ip
port=3306 ##端口
master_binlog_dir=/mdata/mysql_data ##二进制日志目录
candidate_master=1 # 设置为候选master,如果设置该参数以后,发生主从切换以后将会将此从库提升为主库,即使这个主库不是集群中事件最新的slave
[server2]
hostname=192.168.88.129 ##从机ip
port=3306 ##从机端口
master_binlog_dir=/mdata/mysql_data ##二进制日志目录
candidate_master=1 ##是否候选备用master主机
check_repl_delay=0 ### 默认情况下,如果一个slave落后master 100M的relay logs的话,MHA将不会选择该slave作为一个新的master,因为对于这个slave的恢复需要花费很长时间。如果设置 check_repl_delay=0,MHA在触发切换选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,可以保证候选主在切换后一定是新master。
[server3]
hostname=192.168.88.131 ##从机ip
port=3306
master_binlog_dir=/mdata/mysql_data
no_master=1 ##不适合做主库的从机
上面的 app1.cnf 的备注都需要去掉,下面放一个没有备注的
[server default]
manager_workdir=/masterha/app1
manager_log=/masterha/app1/manager.log
master_ip_failover_script=/etc/masterha/master_ip_failover
user=manager
password=123456
ssh_user=root
repl_user=rpl
repl_password=123456
ping_interval=1
[server1]
hostname=192.168.88.130
port=3306
master_binlog_dir=/mdata/mysql_data
candidate_master=1
[server2]
hostname=192.168.88.129
port=3306
master_binlog_dir=/mdata/mysql_data
candidate_master=1
check_repl_delay=0
[server3]
hostname=192.168.88.131
port=3306
master_binlog_dir=/mdata/mysql_data
no_master=1
注意:这里如果还没有配置master_ip_failover可以先不用master_ip_failover_script配置,不然下面的检测可能会出问题
MHA的命令行工具
masterha_check_ssh 检查MHA的SSH配置状况
masterha_check_repl 检查MySQL复制状况
masterha_manger 启动MHA
masterha_check_status 检测当前MHA运行状态
masterha_master_monitor 检测master是否宕机
masterha_master_switch 控制故障转移(自动或者手动)
masterha_conf_host 添加或删除配置的server信息
四、masterha_check_ssh工具验证ssh信任登录是否成功
masterha_check_ssh --conf=/etc/masterha/app1.cnf
显示All SSH connection tests passed successfully. 即可
五、 masterha_check_repl工具验证mysql复制是否成功
masterha_check_repl --conf=/etc/masterha/app1.cnf
最后显示 MySQL Replication Health is OK即可
六、 搭建虚拟IP,MHA自动切换后,IP漂移
因为我们的mysql主从,一开始给客户端读的时候,给的是192.168.88.129,当我们129的的主机宕机了,MHA会把130的从机自动升级为master,那么现在写的mysql则为130,而我们客户端还是用的129肯定是不行的,所以这里需要配置一个虚拟ip,简称VIP,mysql所有的写都是从虚拟IP来的,当我们129的master宕机了,虚拟ip就漂移到130,对于客户端来说是透明的。
ifconfig ens33:1 192.168.88.188/24
vim /etc/masterha/master_ip_failover
#!/usr/bin/env perl
use strict;
use warnings FATAL => 'all';
use Getopt::Long;
my (
$command, $ssh_user, $orig_master_host, $orig_master_ip,
$orig_master_port, $new_master_host, $new_master_ip, $new_master_port
);
my $vip = '192.168.88.188/24';
my $key = '1';
my $ssh_start_vip = "/sbin/ifconfig ens33:$key $vip";
my $ssh_stop_vip = "/sbin/ifconfig ens33:$key down";
my $ssh_Bcast_arp= "/sbin/arping -I ens33 -c 3 -A 192.168.88.188";
GetOptions(
'command=s' => \$command,
'ssh_user=s' => \$ssh_user,
'orig_master_host=s' => \$orig_master_host,
'orig_master_ip=s' => \$orig_master_ip,
'orig_master_port=i' => \$orig_master_port,
'new_master_host=s' => \$new_master_host,
'new_master_ip=s' => \$new_master_ip,
'new_master_port=i' => \$new_master_port,
);
exit &main();
sub main {
print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n";
if ( $command eq "stop" || $command eq "stopssh" ) {
my $exit_code = 1;
eval {
print "Disabling the VIP on old master: $orig_master_host \n";
&stop_vip();
$exit_code = 0;
};
if ($@) {
warn "Got Error: $@\n";
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "start" ) {
my $exit_code = 10;
eval {
print "Enabling the VIP - $vip on the new master - $new_master_host \n";
&start_vip();
$exit_code = 0;
};
if ($@) {
warn $@;
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "status" ) {
print "Checking the Status of the script.. OK \n";
exit 0;
}
else {
&usage();
exit 1;
}
}
sub start_vip() {
`ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`;
}
sub stop_vip() {
return 0 unless ($ssh_user);
`ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`;
}
sub usage {
print
"Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n";
}
上面需要修改的地方,就是把192.168.88,188改成自己的ip
然后在加一个可执行的权限
chmod +x master_ip_failover
添加
master_ip_failover_script=/etc/masterha/master_ip_failover
当master主机宕机后,mha会立即切换master,并执行master_ip_failover,master_ip_failover脚本就是ip漂移的脚本
七、启动MHA manager,并监控日志文件
启动:
masterha_manager --conf=/etc/masterha/app1.cnf
如果后台运行
nohup masterha_manager --conf=/etc/masterha/app1.cnf &
查看mha的运行状态
masterha_check_status --conf=/etc/masterha/app1.cnf
查看日志
cat /masterha/app1/manager.log
八、测试master宕机后,是否会自动切换
mysql -h 192.168.88.188 -u rpl -p"123456"
查看server_id
查看/masterha/app1/manager.log 日志,看一下mha是否成功切换
然后在第①部上面执行 show variables like 'server_id'; 查看server_id是否切换
切换成了130了,表示mysql的master已经切换到了130了,则表示MHA已经配置成功
九、处理原master主机,MHA重新修改搭建
当130的从机升级为master主机后,原来的129master主机怎么处理了?
一般是把129当从机处理,
我们可以执行
CHANGE MASTER TO MASTER_HOST='192.168.88.130', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='rpl', MASTER_PASSWORD='123456';
start slave
这样配置以后,现在是以ip 130为主机,ip 129和 ip 131为从机.
如果报错可以执行reset slave; 再执行
vim /etc/masterha/app1.cnf 把server1和server2的ip换一下,以130为master主机 129和131为从机
删除failover.complete文件
rm -f /masterha/app1/app1.failover.complete
这里的删除必须要,不然重新启动MHA会有提示
十、手动线上切换主从需要配置 master_ip_online_change_script
这个主要是线上手动切换主从时,执行的脚本配置,
十一、 配置邮箱通知
vim /etc/masterha/send_report
chmod +x send_report
#!/usr/bin/perl
# Copyright (C) 2011 DeNA Co.,Ltd.
#
# This program is free software; you can redistribute it and/or modify
# it under the terms of the GNU General Public License as published by
# the Free Software Foundation; either version 2 of the License, or
# (at your option) any later version.
#
# This program is distributed in the hope that it will be useful,
# but WITHOUT ANY WARRANTY; without even the implied warranty of
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
# GNU General Public License for more details.
#
# You should have received a copy of the GNU General Public License
# along with this program; if not, write to the Free Software
# Foundation, Inc.,
# 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
## Note: This is a sample script and is not complete. Modify the script based on your environment.
use strict;
use warnings FATAL => 'all';
use Mail::Sender;
use Getopt::Long;
#new_master_host and new_slave_hosts are set only when recovering master succeeded
my ( $dead_master_host, $new_master_host, $new_slave_hosts, $subject, $body );
my $smtp='smtp.163.com';
my $mail_from='[email protected]';
my $mail_user='[email protected]';
my $mail_pass='123456';
#my $mail_to=['[email protected]'];
my $mail_to='[email protected]';
GetOptions(
'orig_master_host=s' => \$dead_master_host,
'new_master_host=s' => \$new_master_host,
'new_slave_hosts=s' => \$new_slave_hosts,
'subject=s' => \$subject,
'body=s' => \$body,
);
# Do whatever you want here
mailToContacts($smtp,$mail_from,$mail_user,$mail_pass,$mail_to,$subject,$body);
sub mailToContacts {
my ($smtp, $mail_from, $mail_user, $mail_pass, $mail_to, $subject, $msg ) = @_;
open my $DEBUG, ">/var/log/masterha/app1/mail.log"
or die "Can't open the debug file:$!\n";
my $sender = new Mail::Sender {
ctype => 'text/plain;charset=utf-8',
encoding => 'utf-8',
smtp => $smtp,
from => $mail_from,
auth => 'LOGIN',
TLS_allowed => '0',
authid => $mail_user,
authpwd => $mail_pass,
to => $mail_to,
subject => $subject,
debug => $DEBUG
};
$sender->MailMsg(
{
msg => $msg,
debug => $DEBUG
}
) or print $Mail::Sender::Error;
return 1;
}
exit 0;
report_script=/etc/masterha/send_report
可以通过关闭master主机然后测试邮箱是否发送成功
参考
https://www.cnblogs.com/gomysql/p/3675429.html
https://blog.csdn.net/weixin_44907813/article/details/107309347