环境
OS:Redhat5.4
VirtualBox:3.2.8
HeartBeat:2.1.4
Node 数量:2
源代码安装
Heartbeat 依赖于 libnet 这个软件包,这个软件包没有收录在系统中,需要手工编译安装
下载地址:
http://linux.softpedia.com/get/Programming/Libraries/Libnet-10275.shtml
这是编译安装需要安装的软件包
glib2-devel
python-devel
pam-devel
e2fsprogs-devel
uuid library
bzip2
libxml-devel
guntls-devel
#创建
heartbeat用户和组
# 编译安装 Heartbeat
tar xvjf Heartbeat-STABLE-2-1-STABLE-2.1.4.tar.bz2 -C /usr/local/src/
cd /usr/local/src/Heartbeat-STABLE-2-1-STABLE-2.1.4/
./ConfigureMe configure
make && make install
heartbeat1.X与2.X配置文件的区别
/etc/ha.d/authkeys 该文件在两个版本作用是完全相同的,都必须设置,并且保证每个节点(node)内容一样;
/etc/ha.d/ha.cf 这个是主要配置文件,由其决定v1或v2 style格式
/etc/ha.d/haresources 这是v1的资源配置文件
/var/lib/heartbeat/crm/cib.xml 这是v2的资源配置文件,两者根据ha.cf的设定只能选其一
/etc/ha.d/ha.cf 这个文件是heartbeat的主要配置文件
这是没有注释的行,也就是需要配置的
debugfile /var/log/ha-debug
logfile /var/log/ha-log
logfacility local0
设置系统日志的信息范围为
local0
keepalive 2
设置心跳的检测时间,默认单位为秒
deadtime 30
宣布节点死亡的时间,单位为秒
warntime 10
通过这个来调整判断节点的死亡时间
initdead 120
Heartbeat 启动资源的等待时间,单位为秒
udpport 694
设定用于bcast和ucast通信的端口,默认为 UDP 694
ucast eth1 10.10.10.2
心跳网卡和对方的ip地址
auto_failback on
这个设定会使节点具备优先级。当服务运行于备机上时,
如果主节点已恢复,会自动取回运行在备机上的服务。
node heartbeat-1.site heartbeat-2.site
节点信息
ping 192.168.1.1
指定ping节点,检测网络状态,通常是网关
respawn hacluster /usr/lib/heartbeat/ipfail
设定
Heartbeat 监控的服务,该服务会随着 Heartbeat 服务启动时启动,停止时则一起停止。当出现意外导致该服务停止时,Heartbeat 将自动重启该服务
respawn hacluster /usr/lib/heartbeat/pingd -m 100 -d 5s
Heartbeat Version1.X.X 中用ipfail ,而2.X.X 中用pingd
apiauth ipfail gid=haclient uid=hacluster
客户端
API访问控制。这里指定运行 ipfail 的用户和用户组
apiauth ping gid=haclient uid=hacluster
apiauth pingd gid=haclient uid=hacluster
crm respawn
支持crm管理
群集资源文件
haresource或者cib.xml
haresource格式比较简单,可以直接编辑,但是cib.xml格式比较复杂,最好通过GUI界面或者用工具转换V1文件
这是
V1.X的 httpd资源的一个例子,这个ip是资源的ip,假如资源在node1上,那么网卡会虚拟出一个网卡,而IP 就是这个IP
heartbeat-1 IPaddr::192.168.228.235 httpd mysql
heartbeat是资源的主控节点
如果集群需要实现
Active-Active(互备)状态,则可以再写一行,但托管的应用不能冲突。
cib.xml 文件的编辑方式
1人工编写XML文件;
2使用admintools工具,其已经包含在heartbeat包中;
3使用GUI图形工具配置,也包含在heartbeat-gui包里面;
4使用python脚本转换1.x style的格式配置文件
authkeys配置文件
该文件是集群中各节点相互认证的配置文件,允许使用
crc(明文)、md5、sha1等不同的验证方式,可以使用heartbeat自带的示例来修改
!!!文件的权限必须是
600,
auth 2
1 crc
2 sha1 HI!
3 md5 Hello!
每种验证方式耗费的系统资源也是不一样的,性能安全平衡一下吧
最后还要把
heartbeat添加为系统服务
chkconfig �Cadd heartbeat
chkconfig --level 2354 heartbeat on
在我启动heartbeat的服务的时候,遇到了这样一个错误
- [root@heartbeat-1 ha.d]# /etc/init.d/heartbeat start
- logd is already running
- Starting High-Availability services:
- 2010/10/16_01:43:54 INFO: Resource is stopped
- [FAILED]
- heartbeat[3208]: 2010/10/16_01:43:54 WARN: heartbeat: udp port 1694 reserved for service "rrimwm".
- heartbeat: udpport setting must precede media statementsheartbeat[3208]: 2010/10/16_01:43:54 info: Version 2 support: resppawn
- heartbeat[3208]: 2010/10/16_01:43:54 ERROR: Heartbeat not started: configuration error.
- heartbeat[3208]: 2010/10/16_01:43:54 ERROR: Configuration error, heartbeat not started.
1694是我自己修改的,这个不是大问题,主要是 updport setting must precede media statements heartbeat[3208]
服务总是启动失败,最后查明原因是authkeys文件的问题,2个节点的这个文件不相同,建议这个文件用scp拷贝,手工修改可能会有问题,我就是手工修改的,折腾了半天,��
关于HeartBeat的原理介绍,请参考
http://www.linuxfly.org/