前言:构建双节点高可用Mysql服务器,用DRBD个人感觉是比较合适的,只需要两台Server即可,用IP SAN的话先不说SAN的设备,主机也得需要4台,NFS是行不通的。
目标:两台mysql服务器基于drbd构建高可用主从服务器,平时DR1服务器接受请求,DR2基于DRBD数据备份,当DR1出现问题时,DR2接替DR1的工作接受用户请求。
规划:
DR1:172.16.1.16 hostname dr1.laoguang.me
DR2:172.16.1.17 hostname dr2.laoguang.me
VIP:172.16.1.1
环境:RedHat5.8 内核:2.6.18-308.el5 Selinux已经关闭 Yum 配置完好
注:如果没说在哪台机器上配置则默认是dr1
一.配置准备工作,hostname设置,/etc/hosts解析的与对方hostname -n 一致,ssh互信,时间统一
1.1 hostname设置在dr1上演示设置
hostname dr1.laoguang.me
vi /etc/hosts ##添加如下解析
172.16.1.16 dr1.laoguang.me dr1
172.16.1.17 dr2.laoguang.me dr2
1.2 ssh互信设置dr1上演示
ssh-keygen -t rsa -P "" ##回车,生成密钥在/root/.ssh下
ssh-copy-id -i /root/.ssh/id_rsa.pub dr2 ##公钥拷贝到dr2上,再次登录dr2不需要密码
同样dr2也这么设置
1.3 同步时间(如果有NTP就同步NTP的时间)
date -s 20121127;ssh dr2 'date -s 20121127'
二.dr1,dr2上安装DRBD
DRBD分为两部分,一部分是工作内核中的模块部分,一部分是工件在用户空间的管理工具,2.6.33以后的内核中已经集成了DRBD的模块,只安装管理工具即可,旧内核需要为内核打补丁才可以,有爱好者把补丁做成了rpm包名字为kmod-drbd,安装它即可,补丁包一定与内核版本一致。下面安装与软件。
2.1 dr1,dr2安装内核补丁与软件 kmod-drbd83-8.3.8-1.el5.centos.i686.rpm,drbd83-8.3.8-1.el5.centos.i386.rpm
rpm -ivh kmod-drbd83-8.3.8-1.el5.centos.i686.rpm
rpm -ivh drbd83-8.3.8-1.el5.centos.i386.rpm
rpm -ql drbd83 ##查看生成文件
2.2 配置DRBD(注如果没说在哪台机器上配置则默认是dr1)
/etc/drbd.conf 为主配置文件,它把/etc/drbd.d下子配置文件包含进来,通过查看drbd.conf我们可以发现一样例文件/usr/share/doc/drbd83-8.3.8/drbd.conf,用它覆盖这个空的配置文件。
cp /usr/share/doc/drbd83-8.3.8/drbd.conf /etc/
编辑/etc/drbd.d/global_common.conf 这个全局配置文件如下:
global {
usage-count no;
# minor-count dialog-refresh disable-ip-verification
}
common {
protocol C;
handlers {
用默认即可
}
startup {
#wfc-timeout 120;
#degr-wfc-timeout 120;
}
disk {
on-io-error detach; ##IO错误的处理方法
#fencing resource-only;
}
net {
cram-hmac-alg "sha1"; ##指定校验算法,校验是为保证数据完整
shared-secret "laoguang.me"; ##指定校验密码
}
syncer {
rate 1000M; ##指定同步时用多少带宽
}
}
2.3 dr1,drs上创建大小一样的分区,不演示了
dr1上的为/dev/sda5 1G ##注:记的partprobe,不要格式化
dr2上的为/dev/sda5 1G
2.4 为DRBD添加磁盘资源
vim /etc/drbd.d/mysql.res
resource mysql {
on dr1.laoguang.me {
device /dev/drbd0; ##DRBD用的设备
disk /dev/sda5; ##映射的磁盘
address 172.16.1.16:7789; ##drbd启动后监听端口7789
meta-disk internal; ##元数据存放
}
on dr2.laoguang.me {
device /dev/drbd0;
disk /dev/sda5;
address 172.16.1.17:7789;
meta-disk internal;
}
}
2.5 拷贝到时dr2上一份
scp -r /etc/drbd.* dr2:/etc/
2.6 dr1,dr2上初始化drbd资源,并启动服务
drbdadm create-md mysql ##如果没出现successful可能是你没有partprobe哦
service drbd start
drbd-overview ##查看起动状态
0:mysql Connected Secondary/Secondary Inconsistent/Inconsistent C r----
2.7 将其中dr1节点先设置为Primary,让磁盘同步一次
drbdsetup /dev/drbd0 primary �Co
drbd-overview ##查看状态,可知dr2开始同步dr1的数据,等待同步完成
0:mysql SyncSource Primary/Secondary UpToDate/Inconsistent C r----
[==>.................] sync'ed: 15.3% (841880/987896)K delay_probe: 11
2.8 格式化drbd0,挂载使用。注意,由于没有锁管理,所以不要同时挂载使用,一般只有primaty可使用
mke2fs -j -L DRBD /dev/drbd0
mkdir /data/mydata -pv ##dr1,dr2都建立该目录,为以后mysql安装准备
mount /dev/drbd0 /data/mydata
cd /data/mydata ##查看是否成功,建立文件测试能否同步
cp /etc/fstab .
umount /data/mydata
drbdadm secondary mysql ##把自己转换为Secondary
dr2上操作:
drbdadm primary mysql ##dr2切换为Primary
mount /dev/drbd0 /data/mydata ##挂载,并查看是否有数据
ls /data/mydata
到此DRBD设置完毕。一会儿我们会把drbd定义为资源,所以禁止drbd开机启动
chkconfig drbd off
三.dr1,dr2上安装Mysql
primary切换到dr1,挂载drbd0到/data/mydata,开始安装Mysql,本段不再演示,如有需要去看http://laoguang.blog.51cto.com/6013350/1039208
主要更改datadir到 /data/mydata ,另外注意dr1,dr2的mysql用户uid,gid须一致
安装完测试能否启动,如果能,请继续。
停止mysql,卸载drbd,primary切换到dr2,挂载drbd0到/data/mydata,mysql不需要初始化了,拷贝配置文件,启动脚本即可。测试能否启动
不许mysql开机启动
chkconfig mysqld off
四.基于corosync,pacemaker部署高可用集群
4.1 安装covosync,pacemaker及依赖包
ls ##查看当前目录下的所有包,http://clusterlabs.org/rpm/下载适合你平台的包
cluster-glue-1.0.6-1.6.el5.i386.rpm
cluster-glue-libs-1.0.6-1.6.el5.i386.rpm
corosync-1.2.7-1.1.el5.i386.rpm
corosynclib-1.2.7-1.1.el5.i386.rpm
heartbeat-3.0.3-2.3.el5.i386.rpm ##安装heartbeat是因为pacemake会依赖它的某些库
heartbeat-libs-3.0.3-2.3.el5.i386.rpm
libesmtp-1.0.4-5.el5.i386.rpm
pacemaker-1.1.5-1.1.el5.i386.rpm
pacemaker-cts-1.1.5-1.1.el5.i386.rpm
pacemaker-libs-1.1.5-1.1.el5.i386.rpm
perl-TimeDate-1.16-5.el5.noarch.rpm
resource-agents-1.0.4-1.1.el5.i386.rpm
------------------------------centos5.x x86_64bit安装方法----------------------------
rpm -ivh http://dl.fedoraproject.org/pub/epel/5/x86_64/epel-release-5-4.noarch.rpm
wget -O /etc/yum.repos.d/pacemaker.repo http://clusterlabs.org/rpm/epel-5/clusterlabs.repo
yum -y install heartbeat-stonith
yum -y install pacemaker corosync
--------------------------------------------------------------------------------------
安装它们
yum -y --nogpgcheck localinstall *.rpm ##必须在rpm所在目录哦
4.1 修改covosync配置文件
cd /etc/corosync
mv corosync.conf.example corosync.conf
vi corosync.conf
totem {
version: 2
secauth: on ##启用认证,不能让其它主机随意加入集群
threads: 0
interface {
ringnumber: 0
bindnetaddr: 172.16.0.0 ##绑定端口
mcastaddr: 226.94.11.19 ##组播地址,建议修改
mcastport: 5405 ##组播端口
}
}
logging { ##定义日志
fileline: off
to_stderr: no
to_logfile: yes ##日志写入独立file
to_syslog: no ##不用写到syslog中了
logfile: /var/log/cluster/corosync.log ##日志path,需要手动建立
debug: off ##调试
timestamp: on
logger_subsys {
subsys: AMF
debug: off
}
}
amf {
mode: disabled
}
service { ##定义资源管理服务
ver: 0
name: pacemaker ##启动pacemaker
}
aisexec { ##运行corosync的user
user: root
group: root
}
4.2 建立日志目录,建立认证密钥
mkdir /var/log/cluster ##dr2中也建立
corosync-keygen ##生成密钥
##配置文件同步到dr2上一份
scp -p authkey corosync.conf dr2:/etc/corosync/
4.3 dr1,dr2启动corysync,等待一会儿查看状态
service corysync start
crm status ##查看状态,如果显示Online: [ dr2.laoguang.me dr1.laoguang.me ] 则正常
4.4 定义covosync的一些属性,我们没有stonith设备,我们就两个节点,假如一个挂点quorum就不会大于1/2,集群还运行于否
crm ##进入crn命令行,以后管理集群就靠它了
crm(live)# configure ##进入配置状态
crm(live)configure# property no-quorum-policy="ignore" ##定义quorum不足一半时继续运行
crm(live)configure# property stonith-enabled="false" ##禁用stonish,生产环境中应该定义的
crm(live)configure# verify ##校验是否有语法错误
crm(live)configure# commit ##没有错误,提交
crm(live)configure# show ##查看
4.5 定义drbd为主从资源
crm(live)configure# primitive Mysql_DRBD ocf:linbit:drbd \
params drbd_resource=mysql op start timeout=240 op stop timeout=100
##先定义为本地资源,指定资源类型,资源name,指定用的RA,后面的是RA的语法需要
##drbd_resource是指你定义的drbd的名字
crm(live)configure# master Ms_Mysql_DRBD Mysql_DRBD meta \
master-max="1"master-node-max="1"clone-max="2"clone-node-max="1"notify="true"
##master关键字定义主从资源,后面指定资源name,meta 指定额外参选数,master-max指定最多有几个master,
##master-node-max指定一个节点最多运行几个master,clone-max指定有几个clone资源,
##clone-node-max指定一个节点最多运行几个clone资源,notify指当出现故障时是否通知对方
crm(live)configure# verify
crm(live)configure# commit
crm(live)configure# quit
drbd-overview ##查看drbd是不是启动了
4.6 定义Filesystem资源
定义Filesystem挂载
crm(live)configure# primitive MysqlFS ocf:heartbeat:Filesystem params \
device=/dev/drbd0 directory=/data/mydata fstype="ext3" op start timeout=60 \
op stop timeout=60
挂载的drbd的一方必须是primary的主机,所以我们还得定义排列约束,Filesystem必须挂载到drbd的primary上,drbd服务必须先于Filesystem启动
crm(live)configure# colocation MysqlFS_with_Ms_Mysql_master inf: MysqlFS Ms_Mysql_DRBD:Master
crm(live)configure# order MysqlFS_after_Ms_Mysql_DRBD inf: Ms_Mysql_DRBD:promote MysqlFS:start
crm(live)configure# verify
crm(live)configure# commit
crm(live)configure# show 查看CIB库
crm(live)configure# quit
crm_mon ##查看资源运行状况
mount 查看master上drbd0挂载上没有
4.7 定义Mysql资源,定义顺序约束与排列约束
crm(live)configure# primitive Mysql_Server lsb:mysqld
crm(live)configure# order Mysql_Server_after_MysqlFS inf: MysqlFS Mysql_Server
crm(live)configure# colocation Mysql_Server_with_MysqlFS inf: Mysql_Server MysqlFS
crm(live)configure# verify
crm(live)configure# commit
crm(live)configure# quit
crm status
[root@dr1 ~]# crm status
============
Last updated: Wed Nov 28 15:11:26 2012
Stack: openais
Current DC: dr1.laoguang.me - partition with quorum
Version: 1.1.5-1.1.el5-01e86afaaa6d4a8c4836f68df80ababd6ca3902f
2 Nodes configured, 2 expected votes
3 Resources configured.
============
Online: [ dr2.laoguang.me dr1.laoguang.me ]
Master/Slave Set: Ms_Mysql_DRBD [Mysql_DRBD]
Masters: [ dr2.laoguang.me ]
Slaves: [ dr1.laoguang.me ]
MysqlFS (ocf::heartbeat:Filesystem): Started dr2.laoguang.me
Mysql_Server (lsb:mysqld): Started dr2.laoguang.me
4.8 定义一个IP资源并定义顺序、排列约束
crm(live)configure# primitive Mysql_IP ocf:heartbeat:IPaddr params ip=172.16.1.1
crm(live)configure# colocation Mysql_IP_with_Mysql_Server inf: Mysql_IP Mysql_Server
crm(live)configure# order Mysql_IP_after_Mysql_Server inf: Mysql_Server Mysql_IP
crm(live)configure# verify
crm(live)configure# commit
crm(live)configure# quit
crm status
[root@dr1 ~]# crm status
============
Last updated: Wed Nov 28 15:17:03 2012
Stack: openais
Current DC: dr1.laoguang.me - partition with quorum
Version: 1.1.5-1.1.el5-01e86afaaa6d4a8c4836f68df80ababd6ca3902f
2 Nodes configured, 2 expected votes
4 Resources configured.
============
Online: [ dr2.laoguang.me dr1.laoguang.me ]
Master/Slave Set: Ms_Mysql_DRBD [Mysql_DRBD]
Masters: [ dr2.laoguang.me ]
Slaves: [ dr1.laoguang.me ]
MysqlFS (ocf::heartbeat:Filesystem): Started dr2.laoguang.me
Mysql_Server (lsb:mysqld): Started dr2.laoguang.me
Mysql_IP (ocf::heartbeat:IPaddr): Started dr2.laoguang.me
4.9 资源定义完毕,简单的集群构建完毕,测试能否正常转移
由4.8可知Master为dr2,我们在dr2上转移测试
crm node standby
crm status ##查看Master是否变为了dr1
继续测试,休眠dr1虚拟机,看能否转移到时dr2
mysql中建立数据库与表格,standby测试数据是否能同步