Oracle 11.2 RAC环境中的CRSD进程


在11.2中,CRSD进程不再是RAC中最关键的进程之一。



如果对10g RAC比较熟悉,应该清楚CRSD进程的重要性,Oracle在操作系统启动后,就是通过启动这个进程然后启动整个CLUSTER以及数据库的。

在11.2的RAC中,Oracle调整了ASM,使得OCR和VOT可以存储在ASM磁盘组中。ASM是CLUSTER所支持的一个组件,而CLUSTER启动所需的OCR和VOT却要放在ASM中,这其实要解决一个先有鸡还是先有蛋的问题。最终Oracle通过OHASD进程的方式解决了这个问题,而整个CLUSTER和ASM的架构也发生了重大的变化,OHASD进程取代了CRSD进程变成了RAC环境中最关键的进程。

而CRSD进程的重要性已经低到难以置信的地步,前两天在一个客户的11.2 RAC环境中发现,即使一个节点的CRSD进程没有启动,仍然可以手工启动数据库,且数据库可以正常访问。

导致的问题原因应该是节点2上访问OCR和VOT所在的磁盘组出现了错误,导致CRSD在多次尝试获取OCR中存储的信息失败后自动退出,从而使得节点2无法正常的启动。不过这时节点2上除了CRSD进程外,其他的CLUSTER进程已经完全启动,ASM实例也可以启动,这时可以手工启动节点2上的数据库。

节点2上ASM的alert有如下的错误信息:

Tue Jan 18 14:09:18 2011

NOTE: client +ASM2:+ASM registered, osid 13113, mbr 0x0

Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13108.trc:

ORA-15180: could not open dynamic library ASM Library - Generic Linux, version 2.0.4 (KABI_V2), error [open]

ERROR: error ORA-15180 caught in ASM I/O path

Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13108.trc:

ORA-15081: failed to submit an I/O operation to a disk

WARNING: failed to online diskgroup resource ora.DATADG.dg (unable to communicate with CRSD/OHASD)

Tue Jan 18 14:09:19 2011

NOTE: [crsd.bin@findb2 (TNS V1-V3) 13121] opening OCR file

Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13130.trc:

ORA-15180: could not open dynamic library ASM Library - Generic Linux, version 2.0.4 (KABI_V2), error [open]

ERROR: error ORA-15180 caught in ASM I/O path

Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13130.trc:

ORA-15081: failed to submit an I/O operation to a disk

Tue Jan 18 14:09:20 2011

WARNING: failed to online diskgroup resource ora.FRADG.dg (unable to communicate with CRSD/OHASD)

Tue Jan 18 14:09:21 2011

NOTE: [crsd.bin@findb2 (TNS V1-V3) 13134] opening OCR file

Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13143.trc:

ORA-15180: could not open dynamic library ASM Library - Generic Linux, version 2.0.4 (KABI_V2), error [open]

ERROR: error ORA-15180 caught in ASM I/O path

Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13143.trc:

ORA-15081: failed to submit an I/O operation to a disk

应该就是这个原因导致ocrd进程报错并退出。数据库可以正常打开,节点2上数据库和监听无法自动启动,vip也存在问题。此外节点2上需要ocr信息的工具都无法使用,比如ocrconfig、ocrcheck以及srvctl等。

当然一般而言,这种问题是无法接受的,这个问题最终通过重建RAC环境解决。不过这个案例也说明了10g和11g中CLUSTER的结构发生了多大的变化。


oracle视频教程请关注:http://u.youku.com/user_video/id_UMzAzMjkxMjE2.html


你可能感兴趣的:(oracle,CRSD进程,RAC环境)