Removing a Node from a 10gR1 RAC Cluster

1. 数据库原来为4个节点,后来维护商用DBCA删除了一个节点后结果老报如下错误,并且ALERT文件增长非常快.

ORA-00313: unable to open log group 4 (Thread# 2) member

ORA-00312: online log group 4 thread 2: '/global/qfs1/oracle_db/eip/redots/db_eip_raw_log211_200m'

ORA-27037: unable to get file status

SVR4 Error: 2: No such file or directory

Additional information: 3


2.

If your database is in archive log mode you may encounter the

       following errors:

       ORA-350

       ORA-312

       This may occur because the DBCA cannot drop the current log, as

       it needs archiving.  This issue is fixed in the 10.1.0.3

       patchset. But previous to this patchset you should click the

       ignore button and when the DBCA completes, manually archive

       the logs for the deleted instance and dropt the log group.

SQL>  alter system archive log all;

SQL>  alter database drop logfile group 2;


GSD总是无法通过init.crs start来启动成功.

 在启动时跟踪crsd.log,报crs-1019错误,这是明显的placement error,并看到节点1上的gsd尝试到节点2上去启动,于是检查参数cluster_database_instances,此值为2,而他们有3个实例。改为3然后重启CRS,一切正常。

3. 一个节点上的LISTENER无法启动

 用crsctl start all的命令时一个节点上的LISTENER无法启动,但单独用crsctl多启动几次却能启动。刚开始的想法可能是CRS的bug,

 于是我手动用lsnrctl start 命令来启动也报错,检查LISTENER.ORA文件内容发现少了一个')',我不得不晕倒。再次证明做DBA

 的细心和稳重胜于一切。

4.说有个节点不能启动,并且改过的参数cluster_database_instances自动变回了2。这真是个笑话,因为肯定是他们的SPFILE很混乱

造成的,因为他们SPFILE是每个节点使用自己的SPFILE而不使用共享的SPFILE,参数cluster_database_instances改为3后重建了每

个节点自己的SPFILE而没有更新共享的SPFILE,但CLUSTER管理软件是使用共享的SPFILE。


你可能感兴趣的:(thread,database,current,because,following)