LINUX+10.2.0.3 RAC删除、增加节点所遇问题记录

最近实施了一次LINUX5.6+10.2.0.3 RAC删除、增加节点的操作,RAC对应的应用程序是ORACLE EBS,对数据库上做了不少个性化配置,特别是环境变量的修改,为实施以及排障带来了许多不便,简单问题的排查也浪费了许多时间。

特别是DBCA增加实例时遇到的错误,花费了不少时间排查,将此过程中所遇到的通用型问题记录下来备查,因为EBS的一些修改造成的问题就不记了。。。


1.删除节点上nodeapps资源时VIP/监听资源不能移除,通过crs_unregister命令移除监听后可以正常移除。

以root用户执行如下命令删除:
[root@racba bin]# ./srvctl remove nodeapps -n racbb
Please confirm that you intend to remove the node-level applications on node racbb (y/[n]) y
PRKO-2112 : Some or all node applications are not removed successfully on node: racbb
[root@racba bin]# crs_stat -t
Name           Type           Target    State     Host        
------------------------------------------------------------
ora....D1.inst application    ONLINE    ONLINE    racba      
ora.PROD.db    application    ONLINE    ONLINE    racba      
ora....SM1.asm application    ONLINE    ONLINE    racba      
ora....BA.lsnr application    ONLINE    ONLINE    racba      
ora.racba.gsd application    ONLINE    ONLINE    racba      
ora.racba.ons application    ONLINE    ONLINE    racba      
ora.racba.vip application    ONLINE    ONLINE    racba      
ora....BB.lsnr application    OFFLINE   OFFLINE               
ora.racbb.vip application    OFFLINE   OFFLINE  
[root@rac1 ~]#

[oracle@racba ~]$ crs_stat |grep lsnr
NAME=ora.racba.LISTENER_racBA.lsnr
NAME=ora.racbb.LISTENER_racBB.lsnr
[oracle@racba ~]$ crs_stat |grep vip
NAME=ora.racba.vip
NAME=ora.racbb.vip

[root@racba bin]# ./crs_unregister  ora.racbb.LISTENER_racBB.lsnr
[root@racba bin]# crs_stat -t
Name           Type           Target    State     Host        
------------------------------------------------------------
ora....D1.inst application    ONLINE    ONLINE    racba      
ora.PROD.db    application    ONLINE    ONLINE    racba      
ora....SM1.asm application    ONLINE    ONLINE    racba      
ora....BA.lsnr application    ONLINE    ONLINE    racba      
ora.racba.gsd application    ONLINE    ONLINE    racba      
ora.racba.ons application    ONLINE    ONLINE    racba      
ora.racba.vip application    ONLINE    ONLINE    racba      
ora.racbb.vip application    OFFLINE   OFFLINE               
[root@racba bin]# ./srvctl remove nodeapps -n racbb
Please confirm that you intend to remove the node-level applications on node racbb (y/[n]) y
PRKO-2112 : Some or all node applications are not removed successfully on node: racbb

验证:
[root@racba bin]# crs_stat -t
Name           Type           Target    State     Host        
------------------------------------------------------------
ora....D1.inst application    ONLINE    ONLINE    racba      
ora.PROD.db    application    ONLINE    ONLINE    racba      
ora....SM1.asm application    ONLINE    ONLINE    racba      
ora....BA.lsnr application    ONLINE    ONLINE    racba      
ora.racba.gsd application    ONLINE    ONLINE    racba      
ora.racba.ons application    ONLINE    ONLINE    racba      
ora.racba.vip application    ONLINE    ONLINE    racba       --输出中已经没有节点2的信息。



2.删除节点上 olsnodes -n -i信息时需要将被删除的节点关机

参考:http://blog.csdn.net/haibusuanyun/article/details/49947083

3.addNode.sh界面执行时,出现有提示warning /bin/tar无执行权限

,经检查日志,发现这些目录下的部分日志或者文件的属组为root用户,忽略此问题。

LINUX+10.2.0.3 RAC删除、增加节点所遇问题记录_第1张图片

[oracle@racba OraInstall2015-11-21_12-53-14AM]$ cat installExcludeFile.lst
/oracle/product/10.2.0/crs/log
/oracle/product/10.2.0/crs/crs/init
/oracle/product/10.2.0/crs/racg/dump
/oracle/product/10.2.0/crs/srvm/log
/oracle/product/10.2.0/crs/cdata
/oracle/product/10.2.0/crs/cfgtoollogs/cfgfw
[oracle@racba install]$ cat install.excl
log
crs/init
racg/dump
srvm/log
cdata

4.10G 10.2.0.1版本VIPCA/SRVCTL的问题,在本次10.2.0.3版本中也遇到:

[root@racba bin]# ./srvctl remove nodeapps -n racbb
/oracle/product/10.2.0/db/jdk/jre/bin/java: error while loading shared libraries: libpthread.so.0: cannot open shared object file: No such file or directory

将vipca/srvctl的LD_ASSUME_KERNEL注释即可
#Remove this workaround when the bug 3937317 is fixed
LD_ASSUME_KERNEL=2.4.19
export LD_ASSUME_KERNEL
改为:
LD_ASSUME_KERNEL=2.4.19
#export LD_ASSUME_KERNEL

5.ADDNODE图形界面进行将近完成时,新添加的节点网卡驱动问题导致网络无法访问,需要重新执行addnode;

此时inventory.xml中已经有此节点信息,通过手动在inventory.xml中删除节点信息未生效。
通过命令:
/oracle/product/10.2.0/db/oui/bin/runInstaller -updateNodeList ORACLE_HOME=$ORACLE_HOME "CLUSTER_NODES=racba"
更新后,可以再次添加。


6.DBCA添加数据库实例时遇到报错:

TNS-04414及TNS-04605错误,经排查原因为数据库SPFILE中指定的local_listener/remote_listener使用的是直接写的IP/端口/服务名这样的连接串,将这些参数临时取消后可以通过。
也有文档说是DBCA会检查listener.ora/sqlnet.ora/tnsnames.ora中内容;这里我也将这些文件内容进行了检查,进行了重命名;   应该是local_listener/remote_listener参数和listener.ora/sqlnet.ora/tnsnames.ora文件都要注意,直接的方式就是暂时不使用这些参数和配置文件。
LINUX+10.2.0.3 RAC删除、增加节点所遇问题记录_第2张图片


7.DBCA添加数据库实例时遇到报错2:

在添加数据库实例到33%时报错,但是弹出的窗口没有可用信息;多次排查,甚至使用了对dbca  trace,也未找到原因。

最终未解决,不再使用DBCA,不知道是BUG还是其它问题,。

转而使用srvctl工具添加数据库实例,使用srvctl添加后,注意要修改SPFILE中对应集群的设置,如instance_number,thread#、undo配置等,以及在数据库中的对应UNDO表空间、REDO LOG FOR THREAD2,ENABLE THREAD2等。

---关于TRACE DBCA的方法,参考Tracing the Database Configuration Assistant (DBCA) (文档 ID 188134.1)。


你可能感兴趣的:(TNS-04605,TNS-04414)