前面写过一篇:浅谈MySQL集群高可用架构。之后一直有很多小伙伴在后台或其它渠道问我,何时有相关的深入配置管理文章出来,因此,民工哥,也将对前面的各类架构逐一进行整理,然后发布出来。那么今天将来发布的MHA的架构整体规划与配置操作。
1、架构简介
MHA(Master High Availability)目前在MySQL高可用方面是一个相对成熟的解决方案,作为MySQL高可用性环境下故障切换和主从提升的高可用软件。在MySQL故障切换过程中,MHA能做到在0~30秒之内自动完成数据库的故障切换操作,并且在进行故障切换的过程中,MHA能在最大程度上保证数据的一致性,以达到真正意义上的高可用。
该软件由两部分组成:MHA Manager(管理节点)和MHA Node(数据节点)。MHA Manager可以单独部署在一台独立的机器上管理多个master-slave集群,也可以部署在一台slave节点上。MHA Node运行在每台MySQL服务器上,MHA Manager会定时探测集群中的master节点,当master出现故障时,它可以自动将最新数据的slave提升为新的master,然后将所有其他的slave重新指向新的master。整个故障转移过程对应用程序完全透明。
目前MHA主要支持一主多从的架构,要搭建MHA,要求一个复制集群中必须最少有三台数据库服务器,一主二从,即一台充当master,一台充当备用master,另外一台充当从库,因为至少需要三台服务器。
2、布署规划
系统信息
[root@db250 ~]# cat /etc/redhat-release
CentOS release 6.8 (Final)
[root@db250 ~]# uname -r
2.6.32-642.el6.x86_64
数据库版本
mysql-5.7.17
环境规划
Db250 集群管理节点 192.168.4.250
Db251 主库 192.168.4.251
Db253 从库(备主库) 192.168.4.253
Db254 从库 192.168.4.254
3、配置Hosts文件
配置hosts文件
cat>>/etc/hosts<
配置完成后检查下
[root@db254 ~]# tail -4 /etc/hosts
192.168.4.250 db250
192.168.4.251 db251
192.168.4.253 db253
192.168.4.254 db254
4、SSH免密登录配置
配置SSH免密钥登陆
ssh-keygen -t rsa
ssh-copy-id 192.168.4.251
ssh-copy-id 192.168.4.253
ssh-copy-id 192.168.4.254
----以上两步配置所有服务器都需要配置
5、安装MySQL与配置主从同步
同步主库数据到从库,主从同步操作请参考之前的文章
检查主从同步状态
mysql -uroot -p123456 -e "show slave status\G"|egrep "Slave_IO_Running|Slave_SQL_Running"
所有数据库节点配置MHA管理用户与权限
grant all on *.* to mha@'192.168.4.%' identified by '123456';
至此所有基础环境组建完成
6、安装配置MHA
https://downloads.mariadb.com... #下载地址
将相关的安装包传到其它节点
整个MHA服务安装过程如下:
安装依赖包
yum install perl-DBD-MySQL perl-Config-Tiny perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes –y
管理节点安装
rpm -ivh http://dl.fedoraproject.org/pub/epel/6/x86_64/epel-release-6-8.noarch.rpm
yum localinstall -y mha4mysql-manager-0.52-0.noarch.rpm
yum localinstall -y mha4mysql-node-0.52-0.noarch.rpm
其它节点安装
yum localinstall -y mha4mysql-node-0.52-0.noarch.rpm
安装过程中可能会报错,根据提示去解决
配置过程如下:
[root@db250 ~]# mkdir /mha
[root@db250 ~]# vim /etc/masterha_default.cnf
[server default]
#刚才授权的mysql管理用戶名
user=mha
password=123456
manager_workdir=/mha
manager_log=/mha/manager.log
remote_workdir=/mha
#ssh免密钥登录的帐号名
ssh_user=root
#mysql复制帐号,用来在主从机之间同步二进制日志等
repl_user=slave
repl_password=123456
#ping间隔,用来检测master是否正常
ping_interval= 1
[server1]
hostname=db251
master_binlog_dir=/var/lib/mysql
#候选master挂掉时候优先让它顶
candidate_master=1
[server2]
hostname=db253
master_binlog_dir=/var/lib/mysql/
candidate_master=1
[server3]
hostname=db254
master_binlog_dir=/var/lib/mysql/
no_master=1
#不能成为master
------相关的检测命令如下------------------
masterha_check_ssh 检查MHA的SSH配置状况
masterha_check_repl 检查MySQL复制状况
masterha_manger 启动MHA
masterha_check_status 检测当前MHA运行状态
masterha_master_monitor 检测master是否宕机
masterha_master_switch 控制故障转移(自动或者手动)
masterha_conf_host 添加或删除配置的server信息
7、启动MHA服务
[root@db250 ~]# masterha_manager --conf=/etc/masterha_default.cnf &
[1] 2035Fri Sep 1 01:52:25 2017 - [info] Reading default configuratoins from /etc/masterha_default.cnf..
Fri Sep 1 01:52:25 2017 - [info] Reading application default configurations from /etc/masterha_default.cnf..
Fri Sep 1 01:52:25 2017 - [info] Reading server configurations from /etc/masterha_default.cnf..
查看启动日志
从启动日志也可以看出目前的DBmaster是DB251这台服务器,说明启动成功。
8、测试故障自动切换
接下来模拟下故障,将db251关闭
[root@db251 ~]# /etc/init.d/mysqld stop
Stopping mysqld: [ OK ]
当原来的主服务器故障修复后,需要手工将原主变成从
[root@db250 ~]# grep -i"All other slaves should start" /mha/manager.log
Fri Sep 1 01:59:05 2017 - [info] All other slaves should start replicationfrom here. Statement should be: CHANGE MASTER TO MASTER_HOST='db253 or192.168.4.253', MASTER_PORT=3306,MASTER_LOG_FILE='slave-bin.000003',MASTER_LOG_POS=760546, MASTER_USER='slave', MASTER_PASSWORD='xxx';
发现原来的主库修复上线后成为了新的从库,然后同DB253进行同步
同步正常
点击-->民工哥技术之路 关注微信公众号,对话框回复关键字:1024 可以获取一份最新整理的 2048G 技术干货:包括系统运维、数据库、redis、MogoDB、电子书、Java基础课程、Java实战项目、架构师综合教程、架构师实战项目、大数据、Docker容器、ELK Stack、机器学习、BAT面试精讲视频等。