随着信息技术的发展,企业越来越依赖于信息化管理,各业务应用的数据信息,主要存储在数据库中
企业对这些数据访问的连续性要求越来越高,为了避免因为数据的中断导致各种损失,数据库的高可用已成了企业信息化建设的重中之中
同时,对于政府、电信、金融、能源、军工等等涉及国计民生的行业或领域的关键业务对于关键数据存储都需要高可用
必须保证数据系统7×24小时全天候运行,防止数据丢失、数据损坏
MySQL高可用性大杀器之MHA
MHA(Master High Availability)目前在MySQL高可用方面是一个相对成熟的解决方案,它由日本DeNA公司youshimaton(现就职于 Facebook公司)开发,是一套优秀的作为MySQL高可用性环境下故障切换和主从提升的高可用软件。在MySQL故障切换过程中,MHA能做到在 0~30秒之内自动完成数据库的故障切换操作,并且在进行故障切换的过程中,MHA能在最大程度上保证数据的一致性,以达到真正意义上的高可用。
该软件由两部分组成:MHA Manager(管理节点)和MHA Node(数据节点)。MHA Manager可以单独部署在一台独立的机器上管理多个master-slave集群,也可以部署在一台slave节点上。MHA Node运行在每台MySQL服务器上,MHA Manager会定时探测集群中的master节点,当master出现故障时,它可以自动将最新数据的slave提升为新的master,然后将所有其他的slave重新指向新的master。整个故障转移过程对应用程序完全透明。
在MHA自动故障切换过程中,MHA试图从宕机的主服务器上保存二进制日志,最大程度的保证数据的不丢失,但这并不总是可行的。例如,如果主服务器 硬件故障或无法通过ssh访问,MHA没法保存二进制日志,只进行故障转移而丢失了最新的数据。使用MySQL 5.5的半同步复制,可以大大降低数据丢失的风险。MHA可以与半同步复制结合起来。如果只有一个slave已经收到了最新的二进制日志,MHA可以将最 新的二进制日志应用于其他所有的slave服务器上,因此可以保证所有节点的数据一致性。
目前MHA主要支持一主多从的架构,要搭建MHA,要求一个复制集群中必须最少有三台数据库服务器,一主二从,即一台充当master,一台充当备用master,另外一台充当从库,因为至少需要三台服务器,出于机器成本的考虑,淘宝也在该基础上进行了改造,目前淘宝TMHA已经支持一主一从。
(1)需要奇数个节点
(2)当一个master节点挂掉之后投票选出一个新的master,偶数个节点会出现票数相同的状况,但奇数个就不会
(3)所有数据节点的数据一致,每一台数据节点都有可能作为master
(4)每个节点都要安装master和slave插件;
当master节点挂了之后,一般选出数据最近的slave节点作为新的master节点
数据最近指的是数据的差异性小
主机名 | IP | 角色 |
---|---|---|
server1 | 172.25.12.1 | master |
server2 | 172.25.12.2 | slave(备master) |
server3 | 172.25.12.3 | slave |
server4 | 172.25.12.4 | MHA |
(1)重新配置server1的mysql服务
[root@server1 mysql]# systemctl stop mysqld
[root@server1 mysql]# vim /etc/my.cnf
加入一下内容:
29 server-id=1
30 gtid_mode=ON
31 enforce_gtid_consistency=ON
32 log_bin=binlog
33 log_slave_updates=ON
[root@server1 mysql]# pwd
/var/lib/mysql
[root@server1 mysql]# rm -fr *
[root@server1 mysql]# ls
[root@server1 mysql]# systemctl start mysqld
[root@server1 mysql]# grep password /var/log/mysqld.log
[root@server1 mysql]# mysql -p
mysql> alter user root@localhost identified by 'Yan+123kou';
mysql> show databases;
mysql> GRANT REPLICATION SLAVE ON *.* TO repl@'172.25.12.%' IDENTIFIED BY 'Yan+123kou';
mysql> SHOW MASTER STATUS;
[root@server2 ~]# systemctl stop mysqld
[root@server2 ~]# cd /var/lib/mysql
[root@server2 mysql]# ls
[root@server2 mysql]# rm -fr *
[root@server2 mysql]# ls
[root@server2 mysql]# vim /etc/my.cnf
加入:
server-id = 2
gtid_mode=ON
enforce_gtid_consistency=ON
log_slave_updates=ON
log_bin=binlog
[root@server2 mysql]# systemctl start mysqld
[root@server2 mysql]# grep password /var/log/mysqld.log
[root@server2 mysql]# mysql -p
mysql> alter user root@localhost identified by 'Yan+123kou';
mysql> show databases;
mysql> CHANGE MASTER TO MASTER_HOST='172.25.12.1',MASTER_USER='repl',MASTER_PASSWORD='Yan+123kou',MASTER_AUTO_POSITION=1;
mysql> START SLAVE;
mysql> SHOW SLAVE STATUS\G;
[root@server3 ~]# systemctl stop mysqld
[root@server3 ~]# cd /var/lib
[root@server3 lib]# cd mysql
[root@server3 mysql]# ls
[root@server3 mysql]# vim /etc/my.cnf
加入:
server-id=3
gtid_mode=ON
enforce_gtid_consistency=ON
log_slave_updates=ON
log_bin=binlog
[root@server3 mysql]# rm -fr *
[root@server3 mysql]# ls
[root@server3 mysql]# systemctl start mysqld
[root@server3 mysql]# grep password /var/log/mysqld.log
[root@server3 mysql]# mysql -p
mysql> alter user root@localhost identified by 'Yan+123kou';
mysql> show databases;
mysql> CHANGE MASTER TO MASTER_HOST='172.25.12.1',MASTER_USER='repl',MASTER_PASSWORD='Yan+123kou',MASTER_AUTO_POSITION=1;
mysql> START SLAVE;
mysql> SHOW SLAVE STATUS\G;
server1:
mysql> create database redhat;
mysql> use redhat;
mysql> create table usertb (
-> username varchar(10) not null,
-> password varchar(15) not null);
mysql> insert into usertb values ('user1','123');
mysql> select * from usertb;
mysql> select * from redhat.usertb;
mysql> select * from redhat.usertb;
1.server4上安装需要的软件
2.生成ssh密钥,管理节点是不需要输入密码,将生成的公钥和私钥传给数据节点
[root@server4 ~]# ssh-keygen
[root@server4 ~]# ssh-copy-id server1
[root@server4 ~]# ssh-copy-id server2
[root@server4 ~]# ssh-copy-id server3
[root@server4 ~]# scp -r .ssh server1:
[root@server4 ~]# scp -r .ssh server2:
[root@server4 ~]# scp -r .ssh server3:
[root@server4 ~]# ssh server1
[root@server4 ~]# ssh server2
[root@server4 ~]# ssh server3
[root@server4 ~]# ls
MHA-7
[root@server4 ~]# cd MHA-7/
[root@server4 MHA-7]# ls
[root@server4 MHA-7]# scp -r mha4mysql-node-0.58-0.el7.centos.noarch.rpm server1:/root/
[root@server4 MHA-7]# scp -r mha4mysql-node-0.58-0.el7.centos.noarch.rpm server2:/root/
[root@server4 MHA-7]# scp -r mha4mysql-node-0.58-0.el7.centos.noarch.rpm server3:/root/
[root@server1 ~]# yum install -y mha4mysql-node-0.58-0.el7.centos.noarch.rpm
[root@server2 ~]# yum install -y mha4mysql-node-0.58-0.el7.centos.noarch.rpm
[root@server3 ~]# yum install -y mha4mysql-node-0.58-0.el7.centos.noarch.rpm
[root@server4 ~]# mkdir -p /etc/masterha
[root@server4 ~]# cd /etc/masterha/
[root@server4 masterha]# ls
[root@server4 masterha]# vim master.cnf
写入:
[server default]
manager_workdir=/etc/masterha
manager_log=/var/log/masterha.log
master_binlog_dir=/etc/masterha
password=Yan+123kou
user=root
ping_interval=1
remote_workdir=/tmp
repl_password=Yan+123kou
repl_user=repl
ssh_user=root
[server1]
hostname=172.25.12.1
port=3306
[server2]
hostname=172.25.12.2
port=3306
candidate_master=1
check_repl_delay=0
[server3]
hostname=172.25.13.3
port=3306
no_master
(6)管理节点ssh检查管理节点ssh检查
[root@server4 ~]# masterha_check_ssh --conf=/etc/masterha/master.cnf
mysql> grant all on *.* to root@'%' identified by 'Yan+123';
mysql> set global read_only=1;
[root@server4 ~]# masterha_check_repl --conf=/etc/masterha/master.cnf
(9)手动替换master
关闭当前的master节点的mysql服务
[root@server1 ~]# systemctl stop mysqld
[root@server4 ~]# masterha_master_switch --master_state=dead
--conf=/etc/masterha/master.cnf --dead_master_host=172.25.12.1
--dead_master_port=3306 --new_master_host=172.25.12.2 --new_master_port=3306
开启server1的master服务,将他的master改为server2
[root@server1 ~]# systemctl start mysqld
[root@server1 ~]# mysql -p
mysql> CHANGE MASTER TO MASTER_HOST='172.25.12.2',MASTER_USER='repl',MASTER_PASSWORD='ZHOUpeng123.',MASTER_AUTO_POSITION=1;
mysql> start slave;## 打开slave
server1:
mysql> show slave status\G;
server2:查看不出来,因为它已经是当前的,master
mysql> show slave status\G;
server3:
mysql> show slave status\G;
(1)删除故障文件
[root@server4 ~]# cd /etc/masterha/
[root@server4 masterha]# ls
[root@server4 masterha]# rm -fr master.failover.complete
[root@server4 masterha]# ls
masterha_master_switch --conf=/etc/masterha/master.cnf --master_state=alive --
new_master_host=172.25.12.1 --new_master_port=3306 --orig_master_is_new_slave --
running_updates_limit=10000
server1: 查看不到
mysql> mysql> show slave status\G
Empty set (0.00 sec)
server2和server3: master是server1
mysql> mysql> show slave status\G;
(1)server4创建一个检测进程
[root@server4 masterha]# nohup masterha_manager --conf=/etc/masterha/zp.cnf &> /dev/null &
[root@server4 masterha]# ps ax
[root@server1 ~]# systemctl stop mysqld
(3)server4上监控进程停止
(4)server2上查看不到,已经变成新的master
(5)server3上查看到master是server2
(6)server1重新开启master
[root@server1 ~]# systemctl start mysqld
[root@server1 ~]# mysql -p
mysql> CHANGE MASTER TO MASTER_HOST='172.25.12.2',MASTER_USER='repl',MASTER_PASSWORD='Yan+123kou',MASTER_AUTO_POSITION=1;
mysql> start slave;打开slave
全自动实现VIP的漂移
(1)编辑配置文件,加入两行内容
master_ip_failover_script= /usr/local/bin/master_ip_failover
master_ip_online_change_script= /usr/local/bin/master_ip_online_change
(3)给两个脚本加上可执行权限
(4)给server2(当前master)上添加一个vip
(5)server4 手动切换master到server1
[root@server4 bin]# masterha_master_switch --conf=/etc/masterha/master.cnf
--master_state=alive --new_master_host=172.25.12.1 --new_master_port=3306
--orig_master_is_new_slave --running_updates_limit=10000
(6)查看结果
server1可以查看到vip
server2上的vip自动删除
server3查看现在的master是server1
(1)删除故障文件
[root@server4 masterha]# ls
zp.cnf zp.failover.complete
[root@server4 masterha]# rm -rf zp.failover.complete
[root@server4 masterha]# ls
zp.cnf
(2)创建监控master的进程
[root@server4 masterha]# nohup masterha_manager --conf=/etc/masterha/zp.cnf &> /dev/null &
[root@server4 masterha]# ps ax
[root@server1 ~]# systemctl stop mysqld
(4)监控master的进程挂掉
(5)测试
server2可以查看到vip
server3查看到master是server2
注意:每一次切换都会生成一个master.failover.complete文件(简称故障文件),要将这个文件删除,否则会出错
创建一个监控master的进程,这个进程会实时监控master节点的状态,一旦master节点出现故障(宕机)
server4(管理节点)就会自动执行/usr/local/bin下的两个脚本,在正常运行的节点中选择一个最新的来作为新的master节点
同时当前的进程更会挂掉,因为他监控的master已经不再当前集群