本文转载修改自http://www.it165.net/admin/html/201404/2654.html
一,GFS2简介
GFS2是一个基于GFS的先进的集群文件系统,能够同步每台主机的集群文件系统的metadata,能够进行文件锁的管理,并且必须要redhat cluster suite支持,GFS2可以grow,进行容量的调整;不过这是在disk动态容量调整的支持下,也就是本文所要实现的CLVM。
实验环境:
192.168.30.119 tgtd.luojianlong.com OS:Centos 6.4 x86_64 管理服务器 iscsi-target-server
192.168.30.115 node1.luojianlong.com OS:Centos 6.4 x86_64 iscsi-initiator
192.168.30.116 node1.luojianlong.com OS:Centos 6.4 x86_64 iscsi-initiator
192.168.30.117 node1.luojianlong.com OS:Centos 6.4 x86_64 iscsi-initiator
原理:
node1,node2,node3分别通过ISCSI-initiator登录并挂载tgtd服务器的存储设备,利用RHCS搭建GFS2高可用集群文件系统,且保证3个节点对存储设备能够同时读写访问。
下面是拓扑图:
二,准备工作
分别设置4台服务器的hosts文件,以便能够解析对应节点,设置管理节点到各集群节点的ssh密钥无密码登录,关闭NetworkManager,设置开机不自动启动。
[root@tgtd ~]
#
cat /etc/hosts
192.168.30.115 node1.luojianlong.com node1
192.168.30.116 node2.luojianlong.com node2
192.168.30.117 node3.luojianlong.com node3
[root@tgtd ~]
# ssh-copy-id -i node1
[root@tgtd ~]
# ssh-copy-id -i node2
[root@tgtd ~]
# for I in {1..3}; do scp /etc/hosts node$I:/etc/; done
关闭各节点的iptables,selinux服务
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'service iptables stop'; done
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'setenforce 0'; done
三、集群安装
RHCS的核心组件为cman和rgmanager,其中cman为基于openais的“集群基础架构层”,rgmanager为资源管理器。RHCS的集群中资源的配置需要修改其主配置文件/etc/cluster/cluster.xml实现,其仅安装在集群中的某一节点上即可,而cman和rgmanager需要分别安装在集群中的每个节点上。这里选择将此三个rpm包分别安装在了集群中的每个节点上
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'yum -y install cman rgmanager'; done
为集群创建配置文件
RHCS的配置文件/etc/cluster/cluster.conf,其在每个节点上都必须有一份,且内容均相同,其默认不存在,因此需要事先创建,ccs_tool命令可以完成此任务。另外,每个集群通过集群ID来标识自身,因此,在创建集群配置文件时需要为其选定一个集群名称,这里假设其为tcluster。此命令需要在集群中的某个节点上执行
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'ccs_tool create tcluster'; done
查看生成的配置文件的内容
[root@node1 cluster]
# cat cluster.conf
#ccs_tool命令用于在线更新CCS的配置文件
为集群添加节点
RHCS集群需要配置好各节点及相关的fence设备后才能启动,因此,这里需要事先将各节点添加进集群配置文件。每个节点在添加进集群时,需要至少为其配置node id(每个节点的id必须惟一),ccs_tool的addnode子命令可以完成节点添加。将前面规划的三个集群节点添加至集群中,可以使用如下命令实现。
[root@node1 ~]
# ccs_tool addnode -n 1 node1.luojianlong.com
[root@node1 ~]
# ccs_tool addnode -n 2 node2.luojianlong.com
[root@node1 ~]
# ccs_tool addnode -n 3 node3.luojianlong.com
查看已经添加完成的节点及相关信息:
[root@node1 ~]
# ccs_tool lsnode
复制配置文件到其他2个节点
[root@node1 ~]
# scp /etc/cluster/cluster.conf node2:/etc/cluster/
[root@node1 ~]
# scp /etc/cluster/cluster.conf node3:/etc/cluster/
启动集群
RHCS集群会等待各节点都启动后方才进入正常工作状态,因此,需要把集群各节点上的cman服务同时启动起来。这分别需要在各节点上执行如下命令
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'service cman start'; done
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'service rgmanager start'; done
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'chkconfig rgmanager on'; done
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'chkconfig cman on'; done
查看集群状态信息
[root@node1 ~]
# clustat
cman_tool的status子命令则以当前节点为视角来显示集群的相关信息
[root@node1 ~]
# cman_tool status
cman_tool的nodes子命令则可以列出集群中每个节点的相关信息
[root@node1 ~]
# cman_tool nodes
cman_tool的services子命令则可以列出集群中每个服务的相关信息
[root@node1 ~]
# cman_tool services
在tgtd server上安装scsi-target-utils
[root@tgtd ~]
# yum -y install scsi-target-utils
[root@tgtd ~]
# cp /etc/tgt/targets.conf /etc/tgt/targets.conf.bak
编辑target配置文件,定义target
[root@tgtd ~]
# vi /etc/tgt/targets.conf
# 添加如下内容
backing-store /dev/sdb
initiator-address 192.168.30.0/24
[root@tgtd ~]
# service tgtd restart
backing-store:指定后端要共享的磁盘编号
initiator-address:授权客户端访问的网络地址
incominguser:设置登录用户的账号密码
启动target并查看
[root@tgtd ~]
# tgtadm -L iscsi -m target -o show
配置3个节点,使用iscsi-initiator登录tgtd服务的存储设备
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'iscsiadm -m discovery -t st -p 192.168.30.119'; done
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'iscsiadm -m node -T iqn.2014-04.com.luojianlong:target1 -p 192.168.30.119:3260 -l'; done
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'fdisk -l /dev/sdb'; done
在其中一个节点上格式化一个分区
[root@node1 ~]
# fdisk /dev/sdb
[root@node1 ~]
# fdisk -l /dev/sdb
配置使用gfs2文件系统
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'yum -y install gfs2-utils'; done
使用gfs2命令工具在之前创建好的/dev/sdb1上创建集群文件系统gfs2,可以使用如下命令
[root@node1 ~]
# mkfs.gfs2 -j 3 -p lock_dlm -t tcluster:sdb1 /dev/sdb1
This will destroy any data on /dev/sdb1.
It appears to contain: Linux GFS2 Filesystem (blocksize 4096, lockproto lock_dlm)
Are you sure you want to proceed? [y/n] y
Device: /dev/sdb1
Blocksize: 4096
Device Size 5.00 GB (1310972 blocks)
Filesystem Size: 5.00 GB (1310970 blocks)
Journals: 3
Resource Groups: 21
Locking Protocol:
"lock_dlm"
Lock Table:
"tcluster:sdb1"
UUID: 478dac97-c25f-5bc8-a719-0d385fea23e3
mkfs.gfs2为gfs2文件系统创建工具,其一般常用的选项有:
-b BlockSize:指定文件系统块大小,最小为512,默认为4096;
-J MegaBytes:指定gfs2日志区域大小,默认为128MB,最小值为8MB;
-j Number:指定创建gfs2文件系统时所创建的日志区域个数,一般需要为每个挂载的客户端指定一个日志区域;
-p LockProtoName:所使用的锁协议名称,通常为lock_dlm或lock_nolock之一;
-t LockTableName:锁表名称,一般来说一个集群文件系统需一个锁表名以便让集群节点在施加文件锁时得悉其所关联到的集群文件系统,锁表名称为clustername:fsname,其中的clustername必须跟集群配置文件中的集群名称保持一致,因此,也仅有此集群内的节点可访问此集群文件系统;此外,同一个集群内,每个文件系统的名称必须惟一。
格式化完成后,重启node1,node2,node3,不然无法挂载刚才创建的GFS2分区
[root@node1 ~]
# mount /dev/sdb1 /mnt/
[root@node1 ~]
# cp /etc/fstab /mnt/
# 在node2,node3上面也同时挂载/dev/sdb1
[root@node2 ~]
# mount /dev/sdb1 /mnt/
[root@node3 ~]
# mount /dev/sdb1 /mnt/
# 在node1上挂载目录中写入数据,检测node2,node3的挂载目录数据情况
[root@node1 mnt]
# echo "hello" >> fstab
[root@node2 mnt]
# tail -f fstab
以上信息发现,node2,node3已经发现数据发生变化。
四,配置使用cLVM(集群逻辑卷)
在RHCS集群节点上安装lvm2-cluster
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'yum -y install lvm2-cluster'; done
在RHCS的各节点上,为lvm启用集群功能
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'lvmconf --enable-cluster'; done
为RHCS各节点启动clvmd服务
[root@tgtd ~]
# for I in {1..3}; do ssh node$I 'service clvmd start'; done
创建物理卷、卷组和逻辑卷,使用管理单机逻辑卷的相关命令即可
[root@node1 ~]
# pvcreate /dev/sdb2
[root@node1 ~]
# pvs
# 此时,在另外的其它节点上也能够看到刚刚创建的物理卷
创建卷组和逻辑卷
[root@node1 ~]
# vgcreate clustervg /dev/sdb2
[root@node1 ~]
# lvcreate -L 2G -n clusterlv clustervg
格式化逻辑卷
[root@node1 ~]
# lvcreate -L 2G -n clusterlv clustervg
[root@node1 ~]
# mkfs.gfs2 -p lock_dlm -j 2 -t tcluster:clusterlv /dev/clustervg/clusterlv
This will destroy any data on /dev/clustervg/clusterlv.
It appears to contain: symbolic link to `../dm-2'
Are you sure you want to proceed? [y/n] y
Device: /dev/clustervg/clusterlv
Blocksize: 4096
Device Size 2.00 GB (524288 blocks)
Filesystem Size: 2.00 GB (524288 blocks)
Journals: 2
Resource Groups: 8
Locking Protocol:
"lock_dlm"
Lock Table:
"tcluster:clusterlv"
UUID: c8fbef88-970d-92c4-7b66-72499406fa9c
挂载逻辑卷
[root@node1 ~]
# mount /dev/clustervg/clusterlv /media/
[root@node2 ~]
# mount /dev/clustervg/clusterlv /media/
[root@node3 ~]
# mount /dev/clustervg/clusterlv /media/
Too many nodes mounting filesystem, no
free
journals
# 发现node3挂载不了,因为刚才创建了2个journal,需要再添加一个
[root@node1 ~]
# gfs2_jadd -j 1 /dev/clustervg/clusterlv
Filesystem: /media
Old Journals 2
New Journals 3
# 然后挂载node3
[root@node3 ~]
# mount /dev/clustervg/clusterlv /media/
[root@node1 ~]
# df -hT
扩展逻辑卷
[root@node1 ~]
# lvextend -L +2G /dev/clustervg/clusterlv
[root@node1 ~]
# gfs2_grow /dev/clustervg/clusterlv
[root@node1 ~]
# df -hT
发现逻辑卷已经被扩展
到此,RHCS,GFS2,ISCSI,clvm实现共享存储配置完毕。