前言

高可用集群,High Availability Cluster,简称HA Cluster,是指以减少服务中断时间为目的的服务器集群技术。通过上文可以看出,LVS集群本身并不能实现高可用,比如Director Server不能检测Real Server的健康度,一旦其中一台或全部Real Server宕机,Director Server还会继续转发请求,导致站点无法访问,同样,如果Director Server宕机站点就更不可能正常运转了。本文将讲解如何基于heartbeat v1实现LVS集群高可用。

Heartbeat 

简介

Heartbeat是Linux-HA工程的一个组件,自1999年开始到现在,发布了众多版本,是目前开源Linux-HA项目最成功的一个例子,在行业内得到了广泛的应用。

工作原理

Heartbeat最核心的包括两个部分,心跳监测部分和资源接管部分,心跳监测可以通过网络链路和串口进行,而且支持冗余链路,它们之间相互发送报文来告诉对方自己当前的状态,如果在指定的时间内未收到对方发送的报文,那么就认为对方失效,这时需启动资源接管模块来接管运行在对方主机上的资源或者服务。

基于Heartbeat v1实现LVS集群高可用

实验拓扑

基于heartbeat v1+ldirectord实现LVS集群高可用_第1张图片

实验环境

node1:node1.scholar.com 172.16.10.123 CentOS6.6

node2:node2.scholar.com 172.16.10.124 CentOS6.6

Real Server1:192.168.1.10(VIP)172.16.10.125(RIP) CentOS6.6

Real Server2:192.168.1.10(VIP)172.16.10.126(RIP) CentOS6.6

注意事项

配置高可用集群的前提:(以两节点的heartbeat为例)

①时间必须保持同步

使用ntp服务器

②节点必须名称互相通信

解析节点名称

/etc/host

集群中使用的主机名为`uname -n`表示的主机名

③ping node

仅偶数节点才需要

④ssh密钥认证进行通信

配置过程

时间同步

请确保两个节点时间同步,这里不再详细讲述

解析名配置

[root@node1 ~]# vim /etc/hosts

172.16.10.123   node1.scholar.com node1
172.16.10.124   node2.scholar.com node2

[root@node1 ~]# vim /etc/sysconfig/network
HOSTNAME=node1.scholar.com

[root@node1 ~]# uname -n
node1.scholar.com

#两个节点都需如上操作

ssh密钥配置

[root@node1 ~]# ssh-keygen -t rsa -P ''
[root@node1 ~]# ssh-copy-id -i .ssh/id_rsa.pub root@node2
[root@node2 ~]# ssh-keygen -t rsa -P ''
[root@node2 ~]# ssh-copy-id -i .ssh/id_rsa.pub root@node1
[root@node1 ~]# date; ssh node2 'date'  #测试
Sun Jun  7 17:46:03 CST 2015
Sun Jun  7 17:46:03 CST 2015

安装所需软件包

#解决依赖关系
[root@node1 ~]# yum install perl-TimeDate net-snmp-libs libnet PyXML -y #需epel源支持
[root@node1 ~]# cd heartbeat2
[root@node1 heartbeat2]# ls
heartbeat-2.1.4-12.el6.x86_64.rpm             heartbeat-pils-2.1.4-12.el6.x86_64.rpm
heartbeat-gui-2.1.4-12.el6.x86_64.rpm         heartbeat-stonith-2.1.4-12.el6.x86_64.rpm
heartbeat-ldirectord-2.1.4-12.el6.x86_64.rpm
[root@node1 heartbeat2]# rpm -ivh heartbeat-2.1.4-12.el6.x86_64.rpm heartbeat-pils-2.1.4-12.el6.x86_64.rpm heartbeat-stonith-2.1.4-12.el6.x86_64.rpm
[root@node1 heartbeat2]# yum install heartbeat-ldirectord-2.1.4-12.el6.x86_64.rpm -y

#两个节点都执行以上操作

配置heartbeat

准备配置文件

基于heartbeat v1+ldirectord实现LVS集群高可用_第2张图片

配置算法密钥

[root@node1 ~]# openssl rand -hex 8
4d8fd6cb49d2047b
[root@node1 ~]# vim /etc/ha.d/authkeys

auth 2
2 sha1 4d8fd6cb49d2047b

配置主配置文件

[root@node1 ~]# grep -v "#" /etc/ha.d/ha.cf |grep -v "^$"
logfile	/var/log/ha-log  #日志存放位置
keepalive 2              #指定心跳使用间隔时间
deadtime 30              #指定备用节点接管主节点服务资源超时时间
warntime 10              #指定心跳延迟的时间
initdead 120             #解决网络启动延时
udpport	694              #设置广播通信端口
mcast eth0 225.0.25.1 694 1 0 #定义广播地址
auto_failback on              #定义当主节点恢复后,是否将服务自动切回
node	node1.scholar.com     #主节点
node	node2.scholar.com     #备用节点
ping 172.16.0.1               #仲裁设备

配置资源管理器

[root@node1 ~]# vim /etc/ha.d/haresources 

node1.scholar.com 192.168.1.10/32/eth0/192.168.1.10 ldirectord::/etc/ha.d/ldirectord.cf

将配置文件传给备用节点

wKioL1V0Lq3xOD_fAACQCT4yHWQ820.jpg

配置ldirectord

准备配置文件并配置

[root@node1 ~]# cp /usr/share/doc/heartbeat-ldirectord-2.1.4/ldirectord.cf /etc/ha.d/
[root@node1 ~]# grep -v ^#  /etc/ha.d/ldirectord.cf

checktimeout=3        #探测超时时间
checkinterval=1       #探测间隔时间
autoreload=yes        #修改配置文件,无需重启服务即可重载
quiescent=yes         #real server 宕机后从lvs列表中删除,恢复后自动添加进列表

virtual=192.168.1.10:80     #VIP
	real=172.16.10.125:80 gate    #real server
	real=172.16.10.126:80 gate    #real server
 	fallback=127.0.0.1:80 gate    #如果RS节点都宕机,则启用本地环回口地址
	service=http                  #基于http协议探测
	request=".health.html"        #探测文件
	receive="ok"                  #探测内容,判断RS是否存活
	scheduler=rr                  #调度算法
	#persistent=600
	#netmask=255.255.255.255

将配置文件传给备用节点,并禁止各节点ldirectord开启自启

wKiom1V0OBvBwNFXAACdfjGKbyY687.jpg

准备fallback文件

wKiom1V0OSOxpbinAAC5nE7BN0g870.jpg

RS设置

#两个RS各进行如下配置

配置内核参数

wKiom1V0OxvDgkaeAAE6-04NgWc300.jpg

准备健康度探测文件和站点文件

wKioL1V0Q8jiBI9lAACQeXL5www296.jpg

测试页面

wKioL1V0Q-bSXEvkAABeL0Q43g0048.jpg

启动heartbeat

基于heartbeat v1+ldirectord实现LVS集群高可用_第3张图片

查看资源是否生效

基于heartbeat v1+ldirectord实现LVS集群高可用_第4张图片

高可用测试

基于heartbeat v1+ldirectord实现LVS集群高可用_第5张图片

刷新页面

基于heartbeat v1+ldirectord实现LVS集群高可用_第6张图片

将RS2模拟宕机

#service httpd stop

基于heartbeat v1+ldirectord实现LVS集群高可用_第7张图片

无论怎么刷新都是RS1的页面

接下来我们把RS1也停掉

基于heartbeat v1+ldirectord实现LVS集群高可用_第8张图片

切回fallback页面了

我们将node1停掉,看一下node2是否可以接管资源

[root@node1 ~]# service heartbeat stop


基于heartbeat v1+ldirectord实现LVS集群高可用_第9张图片

资源成功接管,以上访问也不受任何影响,当然如果在次启动node1资源会被再次抢过去,这里就不再演示

基于heartbeat v1 实现LVS高可用至此完成

The end

好了,基于heartbeat v1 实现LVS高可用就说到这里了,整个过程还是挺好玩的,配置过程中遇到问题可留言,下篇将会讲解基于heartbeat v2的高可用集群,有兴趣可以继续关注呦。以上仅为个人学习整理,如有错漏,大神勿喷~~~