1.方案综述
Oracle Fail Safe 是架构在
Microsoft Cluster Server(
MSCS)上的一个
Oracle 产品,为
Oracle 的一些产品(数据库、
Oracle Application Server 等)提供高可用性。提供数据、应用程序在出现故障的情况下,将
Oracle数据库自动转换到另一个激活的系统上,保证系统的高可用性。
2.群集服务器安装核对清单
2.1硬件配置
・ 两台联想万全
T350服务器,每台机器具体配置如下:
CPU
|
两颗
CPU: Xeon 1.8G/512K
|
内存
|
1G
|
硬盘
|
3块硬盘,每块
18G
|
RAID卡
|
单通道
|
网卡
|
每台服务器都有两块
Intel 82550网卡
|
单模组,不需要冗余电源
|
・ 一台
SCSI Ultra 160磁盘柜
2.2软件配置
・
Windows2000中文版
(集群中所有机器上进行安装
)
・
MSCS群集软件
(集群中所有机器上进行安装
)
・
Oracle 8.1.6 或者
Oracle9.0.1.0.1 (集群中所有机器上进行安装
)
・
Oracle FailSafe (集群中所有机器上进行安装
)
・
GAM5.0
2.3 硬件环境
硬件环境配置如下:
这是一个两节点群集,每台服务器有两块网卡,一块作为内部连接,用于服务器之间的心跳线和数据镜像传输;一块连接到外部网上。
3.安装使用指南
3.1 安装 Windows2000(两台及其均安装)
1.
相关参数配置参见下表:
表 1 群集安装实验参数表
|
节点1
|
节点2
|
服务器名
|
NS1
|
NS2
|
公用网络IP1
|
192.168.34.1
|
192.168.34.2
|
公用网络子网掩码
|
255.255.255.0
|
255.255.255.0
|
专用网络IP
|
192.168.33.1
|
192.168.33.2
|
专用网络子网掩码
|
255.255.255.0
|
255.255.255.0
|
集群虚拟IP
|
192.168.34.3
|
集群虚拟名
|
Fscluster
|
FailSafe
数据库虚拟IP
|
192.168.34.3
|
集群虚拟IP子网掩码
|
255.255.255.0
|
2.
ping所有
IP地址以确保连接正确。
3.2 安装GAM5.0磁盘管理软件
1. 在
Windows中添加一个具有
administrator权限的用户
gamroot;
2. 在其中在其中一台机器上安装磁盘管理软件
GAM5.0;
3. 利用
GAM管理工具对磁盘进行划分,此处划分为
E: 、
F:和
G:。
关于
GAM的使用方法详细参见相应文档。
3.3 安装MSCS
打开主服务器,关闭从服务器。在主服务器上安装
MSCS。安装成功后,保证在主服务器开启的情况下,在从服务器上安装
MSCS。
详细安装参见相关文档。
安装成功后测试,保证
MSCS安装成功。
3.4 安装Oracle
在主服务器上安装
Oracle,选择自定义安装,安装过程不创建数据库,安装结束重新启动主服务器;
在从服务器上安装
Oracle,选择自定义安装,安装过程不创建数据库,安装结束重新启动从服务器。
3.5创建数据库
在主服务器上创建要添加到集群中的数据库。注意
Control 文件、
redo log files 和
data files 必须创建在磁盘柜的共享分区上;初始化参数文件也要放在磁盘柜上,如果是
Oracle 9.0.1 .0.1, 选择不生成永久初始化文件,安装结束后,将初始化文件放入共享磁盘柜中,然后在注册表中修改,将
HKEY_LOCAL_MACHINE | SOFTWARE | Oracle| HOME0| ORA_HA1TEST_PFILE,修改为在磁盘柜上的目录,例如
I:\initha1test.ora。
3.6 安装FailSafe
在主服务器上安装
FailSafe3.2,安装完重新启动主服务器;
再在从服务器上安装
FailSafe3.2,安装完重新启动从服务器。
注:在安装完
fail safe 后,
Windows 2000 中的群集管理器中 群集配置 �C〉 资源类型 �C〉 下会出现两个资源类型:
Oracle Database 和
Oracle TNS Listener,两者使用的资源
DLL 都是
FsResOdbs.dll 。
3.7修改hosts文件
在两台机器上修改文件
c:\winnt\system32\drivers\etc\hosts 如下:
192.168.34.1 ns1 (节点
1的外部连接)
192.168.34.2
ns2 (节点
2的外部连接)
192.168.33.1
san1 (节点
1的内部连接
)
192.168.33.2
san2 (节点
2的内部连接
)
192.168.34.3 fscluster(
MSCS Cluster 的别名,也就是虚拟
IP的别名)
192.168.34.4 ha1test (
Oracle 集群使用的
IP 和网络名称)
3.8 集群配置
1、 打开
Oracle Fail Safe Manager
Start
->
Programs
->
OraHome91>
->
Oracle Fail Safe Manager
打开后出现
Add Cluster to Tree 对话框,在该对话框里输入
CLUSTER 名称,会
提示输入在域里有管理权限的用户名和密码;输入后会出现
Verify Cluster 对话
框,对该集群各项资源进行有效性验证;
2、 在每台节点机上检查是否有服务
OracleMSCSServices
,并启动该服务;
3、 在每台节点机上启动集群管理器(
启动 -> 程序 -> 管理工具 -> 集群管理器),在
Cluster Group 检查是否有
Oracle Services for MSCS
这一项;并检查
Resource Types 中是否有
Oracle Database
和
Oracle TNS Listener。
4、 在
Oracle Fail Safe Manager 中的
Groups
菜单里选择
Create;打开
Create Group Wizard
后可以设置
failover 和
failback 策略,并自动打开
Add Resource to Group Wizard
可以向组添加
virtual address(选择
Resources,然后
Add to Group)。
首先选择菜单:
出现界面,输入组名:
点击下一步,选择是否
failback。
点击下一步,选择优先级别:
按完成结束组的创建。
5、 在
Troubleshooting 菜单上选择
Verify Standalone Database 验证
Oracle数据库以及
Oracle Net 配置,该命令确认
Oracle Fail Safe 可以访问数据库,并且
standlone 数据库位于共享分区上;
6、 在
Resources 菜单上选择
Add to Group,然后选择
Oracle Database打开
Add Resource to Group Wizard,该向导用来将
single-instance Oracle database server 配置为基于
MSCS 的高可用性数据库服务器;
选择菜单:
出现界面,选择
OracleDatabase:
出现配置集群界面:
安装成功后,出现如下图提示,则安装成功完成。
安装成功后,关于数据库在注册表中的配置,从服务器上的注册表将会自动和主服务器同步。
注:在
FailSafe 里添加组
grptest 并将数据库群集添加后,在群集管理器里也增加了该组,组包含的内容有:
IP Address 192.168.34.4、
Network Name fscluster、
Disk E:、
F:
OracleOraHome81TNSListenerFslfscluster 和
HA1TEST.mjlab.com(数据库实例名)
3.10测试
1)
手工切换主从机
从主机切换到从机,切换时间为
50秒,应用程序略有停滞感,切换成功后应用恢复正常。
2)
非正常关机
非正常关掉主服务器,可以正常切换,切换时间为
57秒,应用程序略有停滞,切换成功后应用恢复正常。
3)
拔掉主机应用网线
拔掉主机应用网线之后,可以正常切换,切换时间为
50秒,应用程序略有停滞感,切换成功后应用恢复正常。
本文出自 “龙游” 博客,谢绝转载!