一路磕磕碰碰终于是换了第三份工作,一路做过来,看着自己去年写的博客,发现自己真的成长了一些。上周突然51cto的米米同学说参加大学生博客大赛,51cto见证了我漫漫的成长过程,我想就算不是为了比赛,为了自己,给这个好的平台努力证明一下自己。所有我又来了!

我很喜欢集群,开始的时候就是搞这个RHCS,作为redhat对企业的集群环境的产品,RHCS好用,但是不好做,原因主要是作为RHCS作为付费集群套件一方面是成本高,另一方面RHCS的资料相对于其他开源集群产品相对较少。官方的文档也比较偏向介绍产品本身的好处,特别是在仲裁盘部分,官方建议是直接找厂家咨询。无奈之下我只好用下策,先是虚拟机测试,然后是真机环境测试,一下是整个测试的环境。跟着做一把,肯定会有帮助的啦。

RHCS的介绍这里就不复述了,网络上的材料很多,官方的文档尤其详细,用功的同学可以通读一边,通俗易懂。

1.1、 集群网络规划

主机操作系统rhel5.8。3台DELL R910设备,。网卡eth1与其它2个节点的IPMI口组成Fence域,上联一台交换机sw1,业务口都为eth0上联交换机sw1,因为实验环境有限,没有做网卡bond.

其中DELL的fenceing功能是通过管理口中的ipmi2.0完成的,ipmi可以直接配置ip地址,用户名密码方便远程管理服务器的电源。

节点名

网卡

功能

Ip地址

用户

密码

备注

test001

eth0

业务

192.168.1.101

root

passwd



eth1

管理

192.168.2.101

root

passwd



ipmi

fence

192.168.2.4

root

passwd


test002








eth0

业务

192.168.1.102

root

passwd



eth1

管理

192.168.2.102

root

passwd



ipmi

fence

192.168.2.5

root

passwd


test003








eth0

业务

192.168.1.103

root

passwd



eth1

管理

192.168.2.103

root

passwd



ipmi

fence

192.168.2.6

root

passwd


1.2、 基础配置说明

注意:所有的配置都要在三台节点完成,这里仅做test001的演示test002,test003test001配置方法一致。

1.2.1、 安装rhel5.8操作系统

系统安装过程,按需求安装,这里就不做说明。

1.2.2、 按照上表配置相应的网卡业务ip,管理ip

编辑:/etc/sysconfig/network-scripts/ifcfg-eth0

DEVICE=eth0
IPADDR=192.168.1.101
NETMASK=255.255.255.0
ONBOOT=yes
TYPE=Ethernet
BOOTPROTO=none
USERCTL=no

编辑:/etc/sysconfig/network-scripts/ifcfg-eth3

DEVICE=eth3
IPADDR=192.168.2.101
NETMASK=255.255.255.0
ONBOOT=yes
TYPE=Ethernet
BOOTPROTO=none
USERCTL=no

1.2.3、 Ipmi口的配置

安装ipmi工具

yum install OpenIPMI OpenIPMI-develOpenIPMI-tools OpenIPMI-libs
/etc/init.d/ipmi start
chkconfig ipmi on

进行IPMI的基本网络配置:

以下指令分别配置了IP地址、掩码、网关、允许进入开关。

ipmitool lan set 1 ipaddr 192.168.2.4
ipmitool lan set 1 netmask 255.255.255.0
ipmitool lan set 1 defgw ipaddr 192.168.2.1
ipmitool lan set 1 access on
ipmitool lan print 1 # 检查网络配置结果

开启默认用户、设置默认密码:

ipmitool lan set 1 user
ipmitool lan set 1 password passwd
ipmitool user list 1 # 显示当前用户列表

通过查看用户列表。可以看到当前有两个用户,一个是默认匿名用户,一个是root。而rootuid = 2

所以要设置一下root用户的密码,按照提示输入两次密码:

ipmitool user set password 2

密码设为:passwd

在多台服务器上配置好IPMI后,测试可以ping通设置好的IP地址。

以下为两种检验方法:

ping 192.168.2.4
ipmitool -H 192.168.2.4-U root power status

正常返回结果会是:poweris on

1.2.4、 配置主机名为test001,test002,test003

编辑/etc/sysconfig/network文件

HOSTNAME=test00X

1.2.5、 配置/etc/hosts主机名与ip的映射关系

编辑/etc/hosts 文件

192.168.1.101 test001
192.168.1.102 test002
192.168.1.103 test003
192.168.2.4    ipmi01
192.168.2.5   ipmi02
192.168.2.6   ipmi03
192.168.1.104 vip01
192.168.1.105 vip02

2、 RHCS集群配置(test001

此部分的配置要在所有的节点操作,这里给出节点test001的操作,test002,test003的操作与test001的一样。

2.1、 Yum配置(test001

rhel5.8光盘挂在在/mnt下面

[root@test001 ~]#mount –o loop rhel5.8.iso /mnt

/etc/yum.repos.d/目录下新建rhel.repo文件,

[root@test003 ~]# vim /etc/yum.repos.d/rhel.repo
[rhel]
name=rhel
baseurl=file:///mnt/Server
gpgcheck=0
[storage]
name=storage
baseurl=file:///mnt/ClusterStorage
gpgcheck=0
[cluster]
name=cluster
baseurl=file:///mnt/Cluster
gpgcheck=0

2.2、 RHEL5.8集群软件安装(test001)

2.2.1、 安装clustering

[root@test001 ~]# yum groupinstallClustering
Loaded plugins: katello, product-id,security, subscription-manager
Updating certificate-based repositories.
Unable to read consumer identity
Setting up Group Process
Resolving Dependencies
--> Running transaction check
…………
Installed:
 Cluster_Administration-en-US.noarch 0:5.8-1.el5                              
 cluster-cim.x86_64 0:0.12.1-7.el5                                            
 cluster-snmp.x86_64 0:0.12.1-7.el5                                           
 ipvsadm.x86_64 0:1.24-13.el5                                                
 luci.x86_64 0:0.12.2-51.el5                                                 
 modcluster.x86_64 0:0.12.1-7.el5                                             
 piranha.x86_64 0:0.8.4-24.el5                                               
 rgmanager.x86_64 0:2.0.52-28.el5                                             
 ricci.x86_64 0:0.12.2-51.el5                                                
 system-config-cluster.noarch 0:1.0.57-12                                     
Dependency Installed:
 cman.x86_64 0:2.0.115-96.el5                                                
 net-snmp.x86_64 1:5.3.2.2-17.el5                                             
 oddjob.x86_64 0:0.27-12.el5                                                 
 oddjob-libs.x86_64 0:0.27-12.el5                                             
 openais.x86_64 0:0.80.6-36.el5                                              
 perl-Net-Telnet.noarch 0:3.03-5                                              
 perl-XML-LibXML.x86_64 0:1.58-6                                              
 perl-XML-LibXML-Common.x86_64 0:0.13-8.2.2                                   
 perl-XML-NamespaceSupport.noarch 0:1.09-1.2.1                                
 perl-XML-SAX.noarch 0:0.14-11                                               
 pexpect.noarch 0:2.3-3.el5                                                   
 python-imaging.x86_64 0:1.1.5-7.el5                                          
 python-pycurl.x86_64 0:7.15.5.1-8.el5                                        
 python-suds.noarch 0:0.4.1-2.el5                                             
 tix.x86_64 1:8.4.0-11.fc6                                                   
 tkinter.x86_64 0:2.4.3-46.el5                                               
 tog-pegasus.x86_64 2:2.11.0-3.el5                                            
 tog-pegasus-libs.x86_64 2:2.11.0-3.el5                                       
Complete!

2.2.2、 安装逻辑卷集群包lvm2-cluster

[root@test001 ~]# yum -y installlvm2-cluster
Loaded plugins: katello, product-id,security, subscription-manager
Updating certificate-based repositories.
Unable to read consumer identity
Setting up Install Process
Resolving Dependencies
--> Running transaction check
……
Installing:
 lvm2-cluster    x86_64   2.02.88-7.el5       storage      301 k
Installed:
 lvm2-cluster.x86_64 0:2.02.88-7.el5                                          
Complete!
启动集群功能:
[root@test001 ~]# lvmconf --enable-cluster


注意:保证第二节部分(test001节点)的操作步骤,其他两节点(test002,test003)都做了。

2.2.3、 配置仲裁盘

rhcs仲裁盘一定要用裸设备制作,不能给lvm管理做成逻辑卷,而且这个仲裁盘必须是共享磁盘,可以是san共享存储或其他的共享磁盘才可以,满足这几个条件才能做。在任意节点制作都可以:

2.2.3.1格式化分区

[root@test001 ~]# fdisk /dev/hda
Device contains neither a valid DOSpartition table, nor Sun, SGI or OSF disklabel
Building a new DOS disklabel. Changes willremain in memory only,
until you decide to write them. After that,of course, the previous
content won't be recoverable.
Warning: invalid flag 0x0000 of partitiontable 4 will be corrected by w(rite)
Command (m for help): p
Disk /dev/hda: 2147 MB, 2147483648 bytes
255 heads, 63 sectors/track, 261 cylinders
Units = cylinders of 16065 * 512 = 8225280bytes
  Device Boot      Start         End      Blocks  Id  System
Command (m for help): n
Command action
  e   extended
  p   primary partition (1-4)
p
Partition number (1-4): 1
First cylinder (1-261, default 1):
Using default value 1
Last cylinder or +size or +sizeM or +sizeK(1-261, default 261): +20M
Command (m for help): p
Disk /dev/hda: 2147 MB, 2147483648 bytes
255 heads, 63 sectors/track, 261 cylinders
Units = cylinders of 16065 * 512 = 8225280bytes
  Device Boot      Start         End      Blocks  Id  System
/dev/hda1               1           3       24066  83  Linux
Command (m for help): w
The partition table has been altered!
Calling ioctl() to re-read partition table.
Syncing disks.
[root@test001 ~]# partprobe

2.2.3.2 制作仲裁盘

[root@test001 ~]# mkqdisk -c /dev/hda1 -lqdisk01
mkqdisk v0.6.0
Writing new quorum disk label 'qdisk01' to/dev/hda1.
WARNING: About to destroy all data on/dev/hda1; proceed [N/y] ? y
Initializing status block for node 1...
Initializing status block for node 2...
Initializing status block for node 3...
Initializing status block for node 4...
Initializing status block for node 5...
Initializing status block for node 6...
Initializing status block for node 7...
Initializing status block for node 8...
Initializing status block for node 9...
Initializing status block for node 10...
Initializing status block for node 11...
Initializing status block for node 12...
Initializing status block for node 13...
Initializing status block for node 14...
Initializing status block for node 15...
Initializing status block for node 16...

2.2.3.3 查看仲裁盘状态:

[root@test001 ~]# mkqdisk –L 
mkqdisk v0.6.0
/dev/disk/by-id/ata-QEMU_HARDDISK_QM00001-part1:
/dev/disk/by-path/pci-0000:00:01.1-ide-0:0-part1:
/dev/hda1:
       Magic:                eb7a62c2
       Label:                qdisk01
       Created:              Wed Apr 24 21:03:56 2013
       Host:                 test001
       KernelSector Size:   512
       RecordedSector Size: 512

在剩下的所有节点运行:

[root@test002 ~]# partprobe
[root@test003 ~]# partprobe

3、 新建集群

3.1、 集群工具介绍

rhcs有两种工具可以配置集群,一种是c/s结构的web界面的配置工具,服务端是luci,客户端是ricci默认安装clustering包组的时候都安装了这两个工具。

第二种是system-config-cluster是系统工具,但是在rhel6.0版本之后就没有这个工具了。

3.1.1、 Luci使用配置

第一次使用的时候要配置用户密码,默认的用户是admin:

[root@test001 ~]# luci_admin init
Initializing the luci server
Creating the 'admin' user
Enter password: #密码
Confirm password: #确认密码
Please wait...
The admin password has been successfullyset.
Generating SSL certificates...
The luci server has been successfullyinitialized
You must restart the luci server forchanges to take effect.
Run "service luci restart" to doso
[root@test001 ~]# /etc/init.d/luci restart
Shutting down luci:                                        [  OK  ]
Starting luci: Generating https SSLcertificates...  done
                                                          [  OK  ]
Point your web browser tohttps://test001:8084 to access luci

然后用web游览器登陆https://test001:8084

3.1.2、 System-config-cluster

这个工具在系统工具里面,可以找到。或者直接在命令行下运行:

[root@test001~]#system-config-cluster

RHCS多节点部署应用企业环境_第1张图片


4、 利用system-config-cluser新建集群

点击:createNew configuration

RHCS多节点部署应用企业环境_第2张图片

填入集群名字:test

使用仲裁盘:参数设置:

Miniumscore:修改成1,默认是3.

添加程序:ping–c2 –t2 192.168.1.254 这个254是业务网关!!

Lable:qdisk01这个非常重要,不是乱填的,qdisk01是上面第二节我们建的仲裁盘他的标签是qdisk01,这里推荐用标签。

Score:1,间隔次数:interval:2

确认无误完:OK

RHCS多节点部署应用企业环境_第3张图片

4.1.1、 添加集群节点

选择:clusternodes,输入节点名(这个节点名要与/etc/hosts里面的保持一致)

test001,test002,test003都按这个方法添加进去。

RHCS多节点部署应用企业环境_第4张图片

4.1.2、 添加fence设备:

因为dell服务器的管理口用的是ipmi,采用fence_ipmilan,并且将上面第一节部分配置的ip,用户名,密码(root,root.123)填入即可。把三台dell服务器的ipmi接口都添加进去。

点击:fencedevice ,添加新的fence 设备,在下拉菜单中找到相应的ipmifence设备,将上面第一节部分配置的ip,用户名,密码(root,root.123)填入即可。

4.1.3、 fence设备添加到节点。

选中:clusternodes下面的test001,然后点击在右下角有一个managefencing for this node。出现如下界面:点击:Adda New Fence Level

RHCS多节点部署应用企业环境_第5张图片

现在ipmi01这个impi设备给test001,点击ok。(一个ipmi设备只用给一个节点使用,用完了就不能再给其他节点了

RHCS多节点部署应用企业环境_第6张图片

Test002,test003节点都安装这个方法添加ipmi02,ipmi03fence设备。

4.1.4、 添加失效恢复域

注意:这个域并不是热迁移,是冷恢复(coldrecovery)期间的服务会有一小段时间无法提供服务。


RHCS多节点部署应用企业环境_第7张图片

点击:FaailoverDomains,添加新的失效域。输入与名字(这个域名字可以使用具体应用的名字来取比较方便管理这里做测试就采用fdx的命名方式),点击OK

将所有节点都添加到fd01里面,test001,test002,test003,设置优先级,1的优先级最高,服务迁移的时候是根据这个优先级来判断迁移到具体的哪一台服务器上。将上个选项都打上√。

RHCS多节点部署应用企业环境_第8张图片

注意:失效域看具体业务需求,在rhcs中不是必须的配置,一个域里面可以运行很多服务,也可以一个应用之运行在一个域里面。服务只能在域中的服务器间迁移。

4.1.5、添加resource

4.1.5.1添加vip

RHCS多节点部署应用企业环境_第9张图片

4.1.5.2添加文件系统

RHCS多节点部署应用企业环境_第10张图片

4.1.5.3添加服务启动脚本

RHCS多节点部署应用企业环境_第11张图片

4.1.6、 创建一个应用

点击services,创建一个应用web_server,点击:Adda shared resource to thisService,并将刚才创建的三个资源都添加给它。在右上角选择失效域fd01,然后策略为迁移(relocate),点击关闭。然后保存到/etc/cluster/cluster.conf

RHCS多节点部署应用企业环境_第12张图片

4.1.7、 分发集群配置文件

scp /etc/cluster/cluster.conf  test002:/etc/cluster/
scp /etc/cluster/cluster.conf  test003:/etc/cluster/

4.2、 启动集群

4.2.1、 cman

在所有节点启动cman服务


[root@test001 ~]# /etc/init.d/cman start
Starting cluster:
  Loading modules... done
  Mounting configfs... done
  Starting ccsd... done
  Starting cman... done
   Startingdaemons... done
  Starting fencing... done
                                                          [  OK  ]

4.2.2、 clvm

在所有节点启动clvm

[root@test001 ~]# /etc/init.d/clvmd start
Starting clvmd:
Activating VG(s):   2 logical volume(s) in volume group "vg_hninms"now active
  1logical volume(s) in volume group "test01" now active
                                                          [  OK  ]

4.2.3、 qdisk

在所有节点启动qdiskd

[root@test001 ~]# /etc/init.d/qdiskd  restart

4.2.4、 rgmanager

在所有节点启动

[root@test001 ~]# /etc/init.d/rgmanager  start

5、 测试

查看集群运行情况

[root@test001 ~]# clustat –i 1
Cluster Status for test @ Wed Apr 2421:32:42 2013
Member Status: Quorate 
 Member Name                             ID   Status
 ------ ----                             ---- ------
 test001                                     1 Online,Local, rgmanager
 test002                                     2 Online,rgmanager
 test003                                     3 Online,rgmanager
/dev/disk/by-id/ata-QEMU_HARDDISK_QM0000  0 Online, Quorum Disk
 Service Name                   Owner (Last)                   State        
 ------- ----                   ----- ------                   -----        
 service:web_server             test002                        started

这个集群中有前面添加的web_serser应用,目前是在test002上运行,状态是started,下面查看一下vip是否分配正常,在test002中运行:ip addr

[root@test002 ~]# ip addr
1: lo:  mtu16436 qdisc noqueue
   link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
   inet 127.0.0.1/8 scope host lo
   inet6 ::1/128 scope host
      valid_lft forever preferred_lft forever
2: eth0: mtu 1500 qdisc pfifo_fast qlen 1000
   link/ether 52:54:00:a7:f4:ea brd ff:ff:ff:ff:ff:ff
   inet 192.168.1.102/24 brd 192.168.0.255 scope global eth0
 inet 192.168.1.104/24 scope global secondaryeth0
   inet6 fe80::5054:ff:fea7:f4ea/64 scope link
      valid_lft forever preferred_lft forever
3: sit0:  mtu 1480 qdisc noop
   link/sit 0.0.0.0 brd 0.0.0.0

查看应用的文件系统是否挂在在指定的目录下面:

[root@test002 ~]# df -h
Filesystem            Size  Used Avail Use% Mounted on
/dev/mapper/vg_hninms-lv_root
                       13G  3.8G 7.9G  33% /
/dev/vda1              99M   13M  82M  14% /boot
tmpfs                 390M     0 390M   0% /dev/shm
/dev/mapper/test01-lvtest01
                       97M  5.6M  87M   7% /var/www/html

5.1、 迁移测试

test002中的httpd服务停掉。

[root@test002 ~]# /etc/init.d/httpd stop
Stopping httpd:                                           [  OK  ]

查看test002的日志

###test002

Apr 24 21:44:17 test002clurgmgrd: [4632]:  script:httpd: status of /etc/init.d/httpd failed(returned 3)
Apr 24 21:44:17 test002 clurgmgrd[4632]: status on script "httpd" returned 1 (generic error)
Apr 24 21:44:17 test002 clurgmgrd[4632]: Stopping service service:web_server
Apr 24 21:44:17 test002 avahi-daemon[2297]:Withdrawing address record for 192.168.1.104 on eth0.
Apr 24 21:44:27 test002 clurgmgrd[4632]: Service service:web_server is recovering
Apr 24 21:44:31 test002 clurgmgrd[4632]: Service service:web_server is nowrunning on member 3

查看test003的日志

#########test003

Apr 24 21:37:36 test003 clurgmgrd[3015]:  Member 2 shutting down
Apr 24 21:38:27 test003 clurgmgrd: [3015]: script:httpd: status of /etc/init.d/httpd failed (returned 3)
Apr 24 21:38:27 test003 clurgmgrd[3015]: status on script "httpd" returned 1 (generic error)
Apr 24 21:38:27 test003 clurgmgrd[3015]: Stopping service service:web_server
Apr 24 21:38:27 test003 avahi-daemon[2298]:Withdrawing address record for 192.168.1.104 on eth0.
Apr 24 21:38:37 test003 clurgmgrd[3015]: Service service:web_server is recovering
Apr 24 21:38:37 test003 clurgmgrd[3015]: Recovering failed service service:web_server
Apr 24 21:38:37 test003 kernel: kjournaldstarting.  Commit interval 5 seconds
Apr 24 21:38:37 test003 kernel: EXT3 FS ondm-2, internal journal
Apr 24 21:38:37 test003 kernel: EXT3-fs: mounted filesystem with ordered data mode.
Apr 24 21:38:39 test003 avahi-daemon[2298]: Registering new address record for 192.168.1.104 on eth0.
Apr 24 21:38:40 test003 clurgmgrd[3015]: Service service:web_server started

在查看集群的状态:

服务这时候已经迁移到test003

Apr 24 21:44:31 test003 clurgmgrd[9700]: Service service:web_server started

Cluster Status for test @ Wed Apr 2421:47:08 2013

Member Status: Quorate

Member Name                             ID   Status

------ ----                             ---- ------

test001                                     1 Online,Local, rgmanager

test002                                     2 Online,rgmanager

test003                                     3 Online,rgmanager

/dev/disk/by-id/ata-QEMU_HARDDISK_QM0000    0 Online, Quorum Disk

Service Name                   Owner (Last)                   State        

------- ----                   ----- ------                   -----        

service:web_server             test003                        started      

#####test

5.2、 仲裁盘测试

查看集群状态

[root@test001 ~]# clustat –i1

Cluster Status for test @ Wed Apr 2423:27:24 2013

Member Status: Quorate

Member Name                             ID   Status

------ ----                             ---- ------

test001                                     1 Online,rgmanager

test002                                     2 Online, Local, rgmanager

test003                                     3 Online,rgmanager

/dev/disk/by-id/ata-QEMU_HARDDISK_QM0000    0 Online, Quorum Disk

Service Name                   Owner (Last)                   State        

------- ----                   ----- ------                   -----        

service:ftp_server             test003                        started      

service:web_server             test001                        started      

这里做一下说明:在test001上多了一个应用ftp_server,这个应用添加的方法与web_server的方法是一样的,服务器上安装ftp服务器,将服务器的资源添加给应用即可(文件系统,服务ip,启动脚本)

仲裁盘测试说明:仲裁测试是在虚拟机上完成的,仲裁盘是为了解决小集群应用存活的问题而存在的.在一般没有仲裁盘的集群里面,例如五台节点只要死了超过两台那么该集群就无仲裁,集群就挂起。有仲裁盘的情况下,可以做到五节点死了四个,集群还能活着,只是单台承载所有应用也会很吃力,迁移时间会比较长,具体出现的情况还是没办法完全模拟。

在有运行应用的两个节点test003,test001运行:

iptables -A OUTPUT -d 192.168.0.55 -p icmp -j REJECT

test003,test001的仲裁盘的进程阻断,这样就可以模拟仲裁盘的功能。Qdisk 进程会向业务网关发送ping测试包,阻断测试包就会导致仲裁失败,失败就会导致节点被fence保护起来,然后用dlm锁起,知道将节点重启之后才释放锁,然后将服务迁移到test002.

查看结果:一般情况下,3节点死了2个,集群必死,可是这种情况集群还活着。

[root@test002 ~]# clustat –i 1

Member Status: Quorate

Member Name                             ID   Status

------ ----                             ---- ------

test001                                     1 Online,rgmanager

test002                                     2 Online,Local, rgmanager

test003                                     3 Online,rgmanager

/dev/disk/by-id/ata-QEMU_HARDDISK_QM0000    0 Online, Quorum Disk

Service Name                   Owner (Last)                   State        

------- ----                   ----- ------                   -----        

service:ftp_server             test002                        started      

service:web_server             test002                        started  

然后等待,test001,test003正常重启后,加入集群这时候集群会根据,失效域里面的优先级来重现迁移应用这时候,原来在test002上的web_server,ftp_server都会迁到各自域里面权限最好的服务器上。

[root@test001 ~]# clustat –i 1

Member Status: Quorate

Member Name                             ID   Status

------ ----                             ---- ------

test001                                     1 Online, rgmanager

test002                                     2 Online,Local, rgmanager

test003                                     3 Online,rgmanager

/dev/disk/by-id/ata-QEMU_HARDDISK_QM0000    0 Online, Quorum Disk

Service Name                   Owner (Last)                   State        

------- ----                   ----- ------                   -----        

service:ftp_server             test003                        started      

service:web_server             test001                        started  

到此,测试完毕,大部分的内容都有测试成功,包括服务迁移,单台节点存活利用qdisk来维持集群存活,服务迁移等。此部分内容未采用GFS2来作为集群文件系统进行测试,采用GFS2替换本文中的ext3即可。

如有什么问题,方便留言或者私信给我,我再做进一步的测试,谢谢大家啦!