由于HAIP导致的数据库无法启动

一、环境

AIX6.1+11.2.0.2GI,双节点

二、问题描述

这是一套新安装的rac,集群的节点1在运行root.sh脚本时报错,并且数据库无法启动。


三、分析过程

由于是root.sh脚本报错,所以需要看下root.sh脚本的运行日志。默认情况下root.sh脚本的运行日志在$GI_HOME的cfgtoollogs目录下,文件名称格式是rootcrs_.log


报错信息如下:

CRS_5017: The resource action "ora.cluster_interconnect.haip start" encountered the following error:

start action for HAIP abort. for details refer to "(:CLSN00107:)" in "/u01/11.2.0/grid/log/infirac1/agent/ohasd/orarootagent_root/orarootagent_root.log"

根据上面的输出可以确定是启动haip时出现了错误,所以需要进一步分析启动haip的代理进程orarootagent_root的日志orarootagent_root.log

在orarootagent_root.log日志中出现了使用网卡的关键信息:

infList 'inf ib0,ip *.*.*.1,sub *.*.*.*'

Error in getting Key SYSTEM.network.haip.group.cluster_interconnect.interface.valid in OCR

Fail to open OLR HAIP subtype SYSTEM.network.haip.group.cluster_interconnect.interface.valid key,rc=4

看来是在启动haip时出现了一些和操作系统相关的错误,因此需要在看一下操作系统层面私网网卡的状态,不过根据网卡的名称来判断infiniband似乎被使用了,在和dba确认之后得到了肯定的答案。

最终确定网卡状态一切正常,问题还是出现在GI层面,经过确认后发现,GI在11.2.0.2版本中,针对AIX平台还不支持infiniband技术。因此暂时只能不使用HAIP,而需要使用初始化参数cluster_interconnects来指定ASM和数据库实例的私网通信IP地址。

注:默认该参数的值为空,使用HAIP来实现ASM和数据库实例间的私网通信。


四、解决方案

使用以下命令修改参数cluster_interconnects之后,数据库可以正常启动了。

alter system set cluster_interconnects='*.*.*.*' scope=spfile sid='****';

你可能感兴趣的:(由于HAIP导致的数据库无法启动)