SUSE11_SP1_x64_HA_OCFS2配置指南

 

SLSE11_sp1_HA_OCFS2
1)介绍
Oracle Cluster File System 2 (OCFS2) 是一个通用日记文件系统,自 Linux 2.6 内核以来就已完全集成。OCFS2 可将应用程序二进制文件、数据文件和数据库储存到共享储存设备。群集中的所有节点对文件系统都有并行的读和写权限。用户空间控制守护程序,通过克隆资源进行管理,提供与 HA 堆栈特别是OpenAIS/Corosync 和分布式锁管理器 (DLM) 的集成。
2)安装
OCFS2 内核模块 (ocfs2) 自动安装在 SUSE® Linux Enterprise Server 11 SP1 上的 High Availability Extension 中。要使用 OCFS2,请确保以下包已安装在群集中的每个节点上:ocfs2-tools 和适用于内核的匹配 ocfs2-kmp-* 包。
# rpm -qa | grep ocfs2
ocfs2-tools-1.4.3-0.11.20
ocfs2-kmp-default-1.4_2.6.32.12_0.6-4.10.14
3)配置 OCFS2 服务和 STONITH 资源
在创建 OCFS2 卷之前,必须将以下资源配置为群集中的服务:DLM、O2CB 和STONITH 资源。OCFS2 使用运行于用户空间中的 Pacemaker 提供的群集成员资格服务。因此,DLM 和 O2CB 需要配置为存在于群集中每个节点上的克隆资源。
1、创建DLM和O2CB的clone资源
# crm configure
输入:
primitive dlm ocf:pacemaker:controld \
op monitor interval="60" timeout="60"
primitive o2cb ocf:ocfs2:o2cb \
op monitor interval="60" timeout="60"
dlm 克隆资源会控制分布式锁管理器服务,并确保此服务在群集中的所有节点上都启动。由于基本组具有内部共置和排序功能, o2cb 服务仅在已有一个 dlm 服务副本在运行的节点上启动。
 
输入以下命令以创建基本组和基本克隆:
group base-group dlm o2cb
clone base-clone base-group \
meta interleave="true" target-role="Started"
使用 commit提交更改。
使用命令 mounted.ocfs2检测并列出群集系统上所有的 OCFS2 卷。
2、配置STONITH资源
2.1.概述
在所有节点都可访问共享储存区的环境中,有一个小分区 (1MB) 会格式化为由SBD 使用。配置完相应的守护程序后,它在其余群集堆栈启动之前将在每个节点上都处于联机状态。它在所有其他群集组件都关闭之后才终止,从而确保了群集资源绝不会在没有 SBD 监督的情况下被激活。
此守护程序会自动将分区上的消息槽之一分配给其自身,并持续监视其中有无发送给它自己的消息。收到消息后,守护程序会立即执行请求,如启动关闭电源或重引导循环以进行屏蔽。
此守护程序会持续监视与储存设备的连接性,并在无法连接分区时自行终止。这就保证了它不会从屏蔽消息断开连接。如果群集数据驻留在不同分区中的同一逻辑单元上,这不是额外的故障点:如果与储存区的连接已丢失,工作负载总是要终止的。
额外的保护是通过 watchdog 支持提供的。现代系统支持 hardwarewatchdog,这一功能必须得到软件组件的“支持”或“供给”。软件组件(通常是守护程序)会定期将服务脉冲写入检查包- 如果守护程序停止供给检查包,则硬件会强制执行系统重启动。这可防止出现 SBD 进程本身的故障,如失去响应或由于 IO 错误而卡住。
 
以下步骤是设置基于储存区的保护所必需的:
2.2.创建SBD分区
SBD: split brain detection节点分裂检测器)
要求:
• 环境中必须有所有节点均可到达的共享储存区。
• 此共享储存段不能使用基于主机的 RAID、cLVM2 或 DRBD。
• 但是,建议使用基于储存区的 RAID 和多路径,以提高可靠性。
建议在设备启动时创建一个 1MB 的分区。如果 SBD 设备驻留在多路径组上,则需要调整 SBD 所用的超时,因为 MPIO 的沿路径检测可能导致一些等待时间。msgwait 超时后,将假定此消息已传递到节点。对于多路径,这应是 MPIO检测路径故障并切换到下一个路径所需的时间。可能需要在您的环境中测试此功能。如果节点上运行的 SBD 守护程序未足够快速地更新检查包计时器,则节点会自行终止。watchdog 超时必须短于 msgwait 超时 - 前者是后者的一半是较好的估计值。
环境:
这里我们采用的是基于多路径的 SAN盘/dev/emcpowera,从该盘中划分出二个分区,其中/dev/emcpowera1作为ocfs2磁盘,/dev/emcpowera2作为sbd磁盘。
 
2.2.1. 使用以下命令初始化 SBD 设备:
sbd -d /dev/emcpowera2 create
 
2.2.2. 如果 SBD 设备驻留在多路径组中,请调整 SBD 所用的超时。这可以在初始化 SBD 设备时指定(所有超时的单位都是秒):
/usr/sbin/sbd -d /dev/emcpowera2 -4 20 -1 10 create
-4 选项用于指定 msgwait 超时。 在以上示例中,超时设置为 20 秒。
-1 选项用于指定 watchdog 超时。在以上示例中,超时设置为 10 秒。
 
2.2.3. 使用以下命令检查已写入设备的内容:
sbd -d /dev/emcpowera2 dump
Header version : 2
Number of slots : 255
Sector size : 512
Timeout (watchdog) : 10
Timeout (allocate) : 2
Timeout (loop) : 1
Timeout (msgwait) : 20
2.3.启动 SBD 守护程序
2.3.1. 先停止 OpenAIS:
rcopenais stop
 
2.3.2. 要使 OpenAIS init 脚本启动和停止 SBD,请创建 /etc/sysconfig/sbd 文件并添加以下行:
SBD_DEVICE="/dev/emcpowera2 "
# The next line enables the watchdog support:
SBD_OPTS="-W"
如果无法访问 SBD 设备,守护程序将不能启动和禁止 OpenAIS 启动。
 
注意:
如果 SBD 设备变得从某个节点无法访问,这会导致此节点进入无限的重引导循环。从技术上来看,此行为是正确的,但根据您的具体管理策略,很可能是令人讨厌的。在这种情况下,最好不要在引导时自动启动 OpenAIS。
 
2.3.3. /etc/sysconfig/sbd 复制到所有节点
csync2 -vx
 
2.3.4. 使用以下命令分配节点
sbd -d /dev/emcpowera2 allocate nodename
 
2.3.5. 在继续下一步之前,请通过执行 rcopenais restart 确保所有节点上都启动了 SBD。
# ps -ef | grep sbd
root     9664   1 0 15:43 pts/0 00:00:00 /usr/sbin/sbd -d /dev/emcpowera2 -D -W watch
2.4.测试SBD
2.4.1. 以下命令会将节点槽及其当前消息从 SBD 设备进行转储:
sbd -d /dev/emcpowera2 list
现在,您应该看到此处列出了使用 SBD 启动过的所有群集节点,并且消息槽应显示 clear。
 
2.4.2. 尝试将测试消息发送到节点之一:
sbd -d /dev/emcpowera2 message nodename test
 
2.4.3. 此节点将在系统日志中确认收到了该消息:
Aug 19 14:10:00 nodename sbd: [13412]: info: Received command test from nodename
这就确认了 SBD 确实在节点上正常运行,并已准备好接收消息。
2.5.配置STONITH资源
在节点一上执行:
# crm confiure
输入:
primitive sbd_stonith stonith:external/sbd \
meta target-role="Started" \
op monitor interval="15" timeout="15" start-delay="15" \
params sbd_device="/dev/emcpowera2"
使用命令 commit提交更改。
3、创建OCFS2文件系统
3.1.格式化
只需在一个节点格式化即可。
mkfs.ocfs2 -N 2 /dev/emcpowera1
 
2个节点上创建挂载点:
mkdir /test
3.2.配置资源
在节点一上执行:
# crm confiure
输入:
primitive ocfs2-1 ocf:heartbeat:Filesystem \
params device="/dev/emcpowera1" directory="/test" fstype="ocfs2" \
options="acl" \
op monitor interval="20" timeout="40"
使用命令 commit提交更改。
3.3.将资源加入clone
在节点一上执行:
# crm confiure
edit base-group
修改如下:
group base-group dlm o2cb ocfs2-1
使用命令 commit提交更改。
 
配置完成。集群启动后, 2个节点均会自动挂载/dev/emcpower1到/test上。
 
至此, OCFS2的集群文件系统就搭建完成并能正常使用了。
 
最后附一张图:
 

 

你可能感兴趣的:(集群,SuSE,HA,ocfs2)