经过了三天的苦心钻研,终于把心跳连接(heartbeat)做成功了,经过测试感觉还不错,今天拿出来和大家分享一下。这其中遇到了不少以前没见过的问题,也遇到了一些高人的指点,呵呵,谢谢大家了!
      集群并不是一个全新的概念,其实早在七十年代计算机厂商和研究机构就开始了对集群系统的研究和开发。由于主要用于科学工程计算,所以这些系统并不为大家所熟知。直到Linux集群的出现,集群的概念才得以广为传播。集群系统主要分为高可用(High Availability)集群,简称 HA 集群。常见的就是2个节点做成的HA集群,有很多通俗的不科学的名称,比如"双机热备", "双机互备", "双机"。 这样做的好处是当服务启动的时候,两台服务器一个作为主,另一个是从。测试机每几秒会ping主机,当发现主机没有回应,就证明主机宕机了,那么从机马上会启动相应的服务,继续进行服务。这样就可以保证服务不间断。
     我的测试环境:3台PC,(具体配置不写了)其中两台机器要配置双网卡,每台机器都使用VMware, 在里面虚拟Linuxas5的操作系统。虚拟机的双网卡设置
双机热备份及高密度集群_第1张图片
具体的拓扑图
双机热备份及高密度集群_第2张图片
具体配置:
    1)先要检查系统中是否有下面软件开发包的支持,包括pkgconfig glib2-devel e2fsprogs和libnet
    2) 我的系统中只缺少libnet,安装libnet,这里使用的是1.1.2.1版本
       tar -zxvf libnet.tar.gz
       cd libnet
       ./configure
       make
       make install
    3) 安装heartbeat
       tar -zxvf heartbeat-2.0.7.tar.gz
       cd heartbeat-2.0.7
       ./ConfigureMe configure
       make
       make install
    4) 当安装好heartbeat后,系统会在/etc/下建立一个ha.d的目录,我们需要把一些文件拷到里面去。
       cp /soft/heartbeat-2.0.7/doc/ha.cf /etc/ha.d
       cp /soft/heartbeat-2.0.7/doc/haresources /etc/ha.d
       cp /soft/heartbeat-2.0.7/doc/authkeys /etc/ha.d
双机热备份及高密度集群_第3张图片
拷完以后的文件

    5) 主要文件的配置
       vi /etc/ha.d/ha.cf
       具体要把下面的选项前的注释去掉
       logfile /var/log/ha-log
       logfacility     local0
       keepalive 2               每2秒钟 测试机发送一个广播
       deadtime 30               30秒内没有反应,立即切换服务
       warntime 10
       initdead 120
       udpport 694
       bcast   eth1              指明心跳连接的接口号
       ucast eth1 192.168.1.20   心跳连接的pc的ip
       auto_failback on
       node    haoyi.com         两个的主机名(最好用uname -n察看)
       node    123.com
       ping 10.1.1.1             测试机的ip  (要写外部的测试IP)
      vi /etc/ha.d/haresources  这个主要是指明资源的来源,是远端挂载
      里面就改一个地方
      haoyi.com  10.1.1.250 Filesystem::10.1.1.220:/share::/var/www/html::nfs httpd
      haoyi.com是主服务器的IP  10.1.1.250是虚拟主机的ip 10.1.1.220:/share是我远程挂载的位置
,我的WEB网页就放在那里  /var/www/html是我的WEB服务的DocumentRoot  httpd我开启的服务
      vi /etc/ha.d/authkeys   这个是安全方面的配置,里面有三种认证方式:crc md5 sha1
      auth 1
      #1 crc
      1 sha1 HI!
      #3 md5 Hello!
     最后要更改文件的权限
      chmod 600 /etc/ha.d/authkeys
     6)做这个实验,两台心跳的服务器的配置要完全一样,所以我用scp远程传到另一个已经安装完成
好libnet 和heartbeat的机器上,同样是放在 /etc/ha.d中,唯一不一样的是这台机器的ha.cf中的ucast
eth1 192.168.1.20 要写上刚才那台机器的ip 也就是192.168.1.10。同样把authkeys的权限也改为600
     7)在我共享硬盘上要做相应的配置
        vi /etc/exports 

        vi /etc/hosts  需要把两台心跳连接的电脑的主机信息写上
双机热备份及高密度集群_第4张图片
       然后开起NFS服务
    
     8)现在开始测试
     首先把两台机器的服务启动,位置在/etc/init.d/heartbeat start
     过几秒钟后我们会发现haoyi.com的主机的网卡信息中出现eth0:0 它的IP是10.1.1.250 就是刚才我
们做的虚拟主机的IP,同时查看挂载情况会发现文件系统已被挂载。同时123.com的主机信息中没有变化 。这就是说现在主服务器已经启动,从服务器在等待。
haoyi.com的主机信息
双机热备份及高密度集群_第5张图片
123.com的主机信息
双机热备份及高密度集群_第6张图片
 
当我们把haoyi.com的heartbeat服务关掉后 过几秒后
 
 我们发现123.com的网卡信息中出现了eth0:0 它的IP10.1.1.250,同时查看挂载情况会发现文件系 统已被挂载,同时hao.com中刚才的信息已经没有了!这就说明现在服务是有刚才的从机器,也就是 123.com来提供的。
123.com的主机信息
双机热备份及高密度集群_第7张图片
这个是haoyi.com主机的信息,已经没有挂载点了
双机热备份及高密度集群_第8张图片
 同时我们把两台服务器的WEB服务都启来,我们这需要访问前段的虚拟主机的IP,也就是10.1.1.250 这样就可以访问到后台的主页了。无论这其中是那台服务器再起作用都无所谓,我们要的是服务不间断就 可以了!
双机热备份及高密度集群_第9张图片