Heartbeat

系统环境:

防火墙关闭,

seliux状态为disabled

各服务器之间组做好地址解析

Node3:172.25.44.3

Node4:172.25.44.4

物理真机:172.25.44.250

VIP:172.25.44.100

 

以下内容node3和nod4上都进行配置

 

安装软件

heartbeat-libs-3.0.4-2.el6.x86_64.rpm

heartbeat-3.0.4-2.el6.x86_64.rpm        

ldirectord-3.9.5-3.1.x86_64.rpm

heartbeat-devel-3.0.4-2.el6.x86_64.rpm

rpm -q heartbeat -d             ##查看软件生成的配置文件

 

cd /usr/share/doc/heartbeat/

cp ha.cf haresources authkeys /etc/ha.d

1).

vim /etc/ha.d/ha.cf      ####需要添加或更改的内容,根据具体情况而设定,参数不固定

29 logfile /var/log/ha-log

48 keepalive 2

56 deadtime 30

61 warntime 10

71 initdead 60

76 udpport 738

91 bcast   eth0

157 auto_failback on

211 node    server3.example.com

212 node    server4.example.com

220 ping 172.25.44.250  #已存在的ip地址,非节点地址,

253 respawn hacluster /usr/lib64/heartbeat/ipfail

259 apiauth ipfail gid=haclient uid=hacluster

#########################################

主配置文件(/etc/ha.d/ha.cf):

debugfile /var/log/ha-debug

调试日志文件文件,取默认值

logfile /var/log/ha-log

系统运行日志文件,取默认值

logfacility local0

日志等级,取默认值

keepalive 2

心跳频率,自己设定。1:表示 1 秒;200ms:表示 200 毫秒

deadtime 30

节点死亡时间阀值,就是从节点在过了 30 后还没有收到心跳就认为主节点死亡,自己设定

warntime 10

发出警告时间,自己设定

initdead 120

守护进程首次启动后应该等待 120 秒后再启动主服务器上的资源

udpport 694

心跳信息传递的 udp 端口,使用端口 694 进行 bcast 和 ucast 通信,取默认值

#baud 19200

串口波特率,与 serial 一起使用。

#serial /dev/ttyS0

采用串口来传递心跳信息。

bcast eth1

采用 udp 广播播来通知心跳

#ucast eth1 10.0.0.3采用网卡 eth1 的 udp 单播来通知心跳,eth1 的 IP

#mcast eth0 225.0.0.1 694 1 0

采用 udp 多播播来通知心跳

auto_failback on

当主节点恢复后,是否自动切回

#stonith baytech /etc/ha.d/conf/stonith.baytech

stonith 用来保证共享存储环境中的数据完整性

watchdog /dev/watchdog

watchdog 能让系统在出现故障 1 分钟后重启该机器,这个功能可以帮助服务器在确实停止心

跳后能够重新恢复心跳。 如果使用该特性,修改系统中/etc/modprobe.conf, 添加如下行

options softdog nowayout=0

这样在系统启动的时候,在内核中装入"softdog"内核模块,用来生成实际的设备文件

/dev/watchdog

node station3.example.com

主节点名称,与 uname –n 保持一致。排在第一的默认为主节点,所以不要搞措顺序

node station4.example.com

副节点名称,与 uname –n 保持一致

ping 192.168.0.254

respawn hacluster /usr/lib/heartbeat/ipfail

apiauth ipfail gid=haclient uid=hacluster

默认 heartbeat 并不检测除本身之外的其他任何服务,也不检测网络状况。

所以当网络中断时,并不会进行 Load Balancer 和 Backup 之间的切换。

可以通过 ipfail 插件,设置'ping nodes'来解决这一问题,但不能使用一个集群节点作为ping 的节点。

###########################

2).

vim /etc/ha.d/haresources

server3.example.com IPaddr::172.25.44.100/24/eth0 httpd

虚拟ip是172.25.44.100,启动服务是httpd

########################

资源文件(/etc/ha.d/haresources):

station3.example.com IPaddr::192.168.0.200/24/eth0 ldirectord httpd

这个文件中定义了实现集群所需的各个软件的启动脚本,这些脚本必须放在/etc/init.d 或者/etc/ha.d/resource.d 目录里 IPaddr 的作用是启动 Virutal IP,它是 HeartBeart 自带的一个脚本;ldirectord 的作用是启动 ldirectord 监控程序,它会使 ldirectord.cf 中定义的 lvs 生效,

并监听其健康状;httpd 是 apache 服务的启动脚本.

3).

vim /etc/ha.d/authkeys

linux之heartbeat高可用的简单配置_第1张图片

chmod 600 /etc/ha.d/authkeys

配置完成后将文件传送到node4

#scp ha.cf haresources authkeys 172.25.44.4:/etc/ha.d/

#########认证文件,此文件权限必须是600#######

 

测试:

1..编写测试文件(在node3和node4上编写不同内容方便测试)

 vim /var/www/html/index.html

2.# /etc/init.d/heartbeat start  ###l两边都开启hearbeat服务

Starting High-Availability services: INFO:  Resource is stopped

Done.

#arp -an | grep 172.25.44.100  ##查看vip在哪个节点上运行(在物理真机上执行此命令)

在主节点上查看vip

#ip addr show

3.浏览器访问vip:172.25.44.100,查看网页内容

4.Node3上手动关闭heartbeat服务,查看vip是否跳转到node4上,同时httpd在node4上开启,访问172.25.44.100,若内容与节点node4上测试文件内容一致,测试成功。