klmy_think

CRS-0184问题解决过程

近日，公司搭建的ORACLE 11G RAC 出现故障，整个故障的排错思路大概持续了一周左右，最终确定了问题原因，现在简介下ORACLE 11G RAC的环境：

jbdb1 IBM P740 AIX 6100-08-02-1316

jbdb2 IBM P740 AIX 6100-08-02-1316

Oracle 11G 11.2.0.3 grid and database

当日，软件人员说无法连接数据库，我就很纳闷，于是就登录到系统，通过查看群集发现整个RAC有异常，正当我查看群集状态时候出现：

hostname:/home/grid$crs_stat -t
CRS-0184: Cannot communicate with the CRS daemon.

通过登录两个节点发现同样的问题，ORACLE Cluster 无法启动crs群集管理，crs无法启动更谈不上什么服务了，数据库无法启动，服务中断。
现在是没有什么办法只有先恢复应用再说，于是手动执行crsctl start cluster -all 结果还是不能启动crs对应的服务，错误依旧。最后进行crs的检测

hostname:/home/grid$crsctl check crs
CRS-4638: Oracle High Availability Services is online
CRS-4535: Cannot communicate with Cluster Ready Services
CRS-4529: Cluster Synchronization Services is online
CRS-4534: Cannot communicate with Event Manager

通过上面可以看到CRS无法通信，并且事件管理也无法通信连接。并且查询crs resource运行状态

节点1：

hostname:/home/grid$crsctl stat resource -t -init
--------------------------------------------------------------------------------
NAME           TARGET  STATE        SERVER                   STATE_DETAILS       
--------------------------------------------------------------------------------
Cluster Resources
--------------------------------------------------------------------------------
ora.asm
      1        ONLINE  OFFLINE                               Instance Shutdown   
ora.cluster_interconnect.haip
      1        ONLINE  ONLINE       jbdb1                                        
ora.crf
      1        ONLINE  ONLINE       jbdb1                                        
ora.crsd
      1        ONLINE  OFFLINE                                                   
ora.cssd
      1        ONLINE  ONLINE       jbdb1                                        
ora.cssdmonitor
      1        ONLINE  ONLINE       jbdb1                                        
ora.ctssd
      1        ONLINE  ONLINE       jbdb1                    OBSERVER            
ora.diskmon
      1        OFFLINE OFFLINE                                                   
ora.drivers.acfs
      1        ONLINE  ONLINE       jbdb1                                        
ora.evmd
      1        ONLINE  INTERMEDIATE jbdb1                                        
ora.gipcd
      1        ONLINE  ONLINE       jbdb1                                        
ora.gpnpd
      1        ONLINE  ONLINE       jbdb1                                        
ora.mdnsd
      1        ONLINE  ONLINE       jbdb1   
  
  hostname:/home/grid$crsctl check crs
CRS-4638: Oracle High Availability Services is online
CRS-4535: Cannot communicate with Cluster Ready Services
CRS-4529: Cluster Synchronization Services is online
CRS-4534: Cannot communicate with Event Manager

节点2
hostname:/home/grid$crsctl stat resource -t -init
--------------------------------------------------------------------------------
NAME           TARGET  STATE        SERVER                   STATE_DETAILS       
--------------------------------------------------------------------------------
Cluster Resources
--------------------------------------------------------------------------------
ora.asm
      1        ONLINE  ONLINE       jbdb2                    Started             
ora.cluster_interconnect.haip
      1        ONLINE  ONLINE       jbdb2                                        
ora.crf
      1        ONLINE  ONLINE       jbdb2                                        
ora.crsd
      1        ONLINE  INTERMEDIATE jbdb2                                        
ora.cssd
      1        ONLINE  ONLINE       jbdb2                                        
ora.cssdmonitor
      1        ONLINE  ONLINE       jbdb2                                        
ora.ctssd
      1        ONLINE  ONLINE       jbdb2                    OBSERVER            
ora.diskmon
      1        OFFLINE OFFLINE                                                   
ora.drivers.acfs
      1        ONLINE  ONLINE       jbdb2                                        
ora.evmd
      1        ONLINE  INTERMEDIATE jbdb2                                        
ora.gipcd
      1        ONLINE  ONLINE       jbdb2                                        
ora.gpnpd
      1        ONLINE  ONLINE       jbdb2                                        
ora.mdnsd
      1        ONLINE  ONLINE       jbdb2             
	  
hostname:/home/grid$crsctl check crs
CRS-4638: Oracle High Availability Services is online
CRS-4535: Cannot communicate with Cluster Ready Services
CRS-4529: Cluster Synchronization Services is online
CRS-4534: Cannot communicate with Event Manager

通过上面信息可知节点1的ora.asm offline，ora.crsd offline 同时也会伴随asm后台无法启动

节点2ora.crsd INTERMEDIATE,在整个排查过程中，尝试过重启两节点，但是重启完毕后，crs的状态还是一样的，数据库不可使用。被迫无奈判断问题，于是大胆关闭一个节点，同时喜剧的时刻发生了，节点2上是应用资源都正常，所有群集资源漂移至节点2上，包括底层的ASM还有数据库instance状态可用。

hostname:/home/grid$crs_stat -t
Name           Type           Target    State     Host        
------------------------------------------------------------
ora.DATA.dg    ora....up.type ONLINE    ONLINE    jbdb2       
ora....BASE.dg ora....up.type ONLINE    ONLINE    jbdb2       
ora....ER.lsnr ora....er.type ONLINE    ONLINE    jbdb2       
ora....N1.lsnr ora....er.type ONLINE    ONLINE    jbdb2       
ora.asm        ora.asm.type   ONLINE    ONLINE    jbdb2       
ora.cvu        ora.cvu.type   ONLINE    ONLINE    jbdb2       
ora.gsd        ora.gsd.type   OFFLINE   OFFLINE               
ora.jbdb.db    ora....se.type ONLINE    ONLINE    jbdb2       
ora.jbdb1.vip  ora....t1.type ONLINE    ONLINE    jbdb2       
ora....SM2.asm application    ONLINE    ONLINE    jbdb2       
ora....B2.lsnr application    ONLINE    ONLINE    jbdb2       
ora.jbdb2.gsd  application    OFFLINE   OFFLINE               
ora.jbdb2.ons  application    ONLINE    ONLINE    jbdb2       
ora.jbdb2.vip  ora....t1.type ONLINE    ONLINE    jbdb2       
ora....network ora....rk.type ONLINE    ONLINE    jbdb2       
ora.oc4j       ora.oc4j.type  ONLINE    ONLINE    jbdb2       
ora.ons        ora.ons.type   ONLINE    ONLINE    jbdb2       
ora....ry.acfs ora....fs.type ONLINE    ONLINE    jbdb2       
ora.scan1.vip  ora....ip.type ONLINE    ONLINE    jbdb2

没有办法后来查看crsd.log日志，在节点1上看到如下日志：

2015-01-11 13:09:49.196: [UiServer][12338] {1:55097:16132} Done for ctx=126cef9b0
2015-01-11 13:09:51.152: [GIPCHALO][2314] gipchaLowerDropMsg: dropping because of sequence timeout, waited 30009, msg 126d68dd8 { len 1160, seq 4382378, type gipchaHdrTypeRecvEstablish (5), lastSeq 0, lastAck 0, minAck 4382377, flags 0x1, srcLuid a0a5bfd0-2d6a5e20, dstLuid 00000000-00000000, msgId 4382376 }, node 126ceeb10 { host 'jbdb2', haName '100e-6e24-76d3-7ed0', srcLuid 2a58b1e0-aa5c4864, dstLuid a0a5bfd0-2d6a5e20 numInf 0, contigSeq 0, lastAck 0, lastValidAck 0, sendSeq [79 : 79], createTime 2789741483, sentRegister 1, localMonitor 0, flags 0x4 }
2015-01-11 13:09:51.898: [GIPCHALO][2314] gipchaLowerProcessNode: no valid interfaces found to node for 2789821594 ms, node 126ceeb10 { host 'jbdb2', haName '100e-6e24-76d3-7ed0', srcLuid 2a58b1e0-aa5c4864, dstLuid a0a5bfd0-2d6a5e20 numInf 0, contigSeq 0, lastAck 0, lastValidAck 0, sendSeq [80 : 80], createTime 2789741483, sentRegister 1, localMonitor 0, flags 0x4 }
2015-01-11 13:09:52.160: [GIPCHALO][2314] gipchaLowerDropMsg: dropping because of sequence timeout, waited 30008, msg 126da6958 { len 1160, seq 4382379, type gipchaHdrTypeRecvEstablish (5), lastSeq 0, lastAck 0, minAck 4382378, flags 0x1, srcLuid a0a5bfd0-2d6a5e20, dstLuid 00000000-00000000, msgId 4382377 }, node 126ceeb10 { host 'jbdb2', haName '100e-6e24-76d3-7ed0', srcLuid 2a58b1e0-aa5c4864, dstLuid a0a5bfd0-2d6a5e20 numInf 0, contigSeq 0, lastAck 0, lastValidAck 0, sendSeq [80 : 80], createTime 2789741483, sentRegister 1, localMonitor 0, flags 0x4 }
2015-01-11 13:09:53.167: [GIPCHALO][2314] gipchaLowerDropMsg: dropping because of sequence timeout, waited 30009, msg 126d6b678 { len 1160, seq 4382380, type gipchaHdrTypeRecvEstablish (5), lastSeq 0, lastAck 0, minAck 4382379, flags 0x1, srcLuid a0a5bfd0-2d6a5e20, dstLuid 00000000-00000000, msgId 4382378 }, node 126ceeb10 { host 'jbdb2', haName '100e-6e24-76d3-7ed0', srcLuid 2a58b1e0-aa5c4864, dstLuid a0a5bfd0-2d6a5e20 numInf 0, contigSeq 0, lastAck 0, lastValidAck 0, sendSeq [81 : 81], createTime 2789741483, sentRegister 1, localMonitor 0, flags 0x4 }
2015-01-11 13:09:54.173: [GIPCHALO][2314] gipchaLowerDropMsg: dropping because of sequence timeout, waited 30007, msg 126da91f8 { len 1160, seq 4382381, type gipchaHdrTypeRecvEstablish (5), lastSeq 0, lastAck 0, minAck 4382380, flags 0x1, srcLuid a0a5bfd0-2d6a5e20, dstLuid 00000000-00000000, msgId 4382379 }, node 126ceeb10 { host 'jbdb2', haName '100e-6e24-76d3-7ed0', srcLuid 2a58b1e0-aa5c4864, dstLuid a0a5bfd0-2d6a5e20 numInf 0, contigSeq 0, lastAck 0, lastValidAck 0, sendSeq [82 : 82], createTime 2789741483, sentRegister 1, localMonitor 0, flags 0x4 }
2015-01-11 13:09:56.188: [GIPCHALO][2314] gipchaLowerDropMsg: dropping because of sequence timeout, waited 30008, msg 126d5cd18 { len 1160, seq 4382383, type gipchaHdrTypeRecvEstablish (5), lastSeq 0, lastAck 0, minAck 4382382, flags 0x1, srcLuid a0a5bfd0-2d6a5e20, dstLuid 00000000-00000000, msgId 4382381 }, node 126ceeb10 { host 'jbdb2', haName '100e-6e24-76d3-7ed0', srcLuid 2a58b1e0-aa5c4864, dstLuid a0a5bfd0-2d6a5e20 numInf 0, contigSeq 0, lastAck 0, lastValidAck 0, sendSeq [84 : 84], createTime 2789741483, sentRegister 1, localMonitor 0, flags 0x4 }

通过上面日志发现“gipchaLowerProcessNode: no valid interfaces found to node for 2789821594 ms”信息，通过字面理解应该是群集心跳出现问题，可以在节点1和节点2上通过ping测试发现没有异常，于是就没有在意，反而把重点放在操作系统层面，就这样一连5天都是这样熬着，在这几天我尝试各种解决办法，操作系统层面，存储多路径、系统补丁、数据库bug均是无效，问题依旧，双节点同时启动RAC不可用，关闭一个节点后所有资源漂移正常，并且crs也正常，在这样一次次尝试我发现，存储层面和系统层面应该没有问题，否则所有资源是不会在一个节点上运行，这样问题应该出现在群集本身。定位问题后，就测试RAC的心跳通信。

ping 192.168.10.254 -t
正在 Ping 192.168.10.254 具有 32 字节的数据:
来自 192.168.10.254 的回复: 字节=32 时间=1ms TTL=255
来自 192.168.10.254 的回复: 字节=32 时间=1ms TTL=255
来自 192.168.10.254 的回复: 字节=32 时间=1ms TTL=255
来自 192.168.10.254 的回复: 字节=32 时间=3ms TTL=255
来自 192.168.10.254 的回复: 字节=32 时间=3ms TTL=255
来自 192.168.10.254 的回复: 字节=32 时间=1ms TTL=255
来自 192.168.10.254 的回复: 字节=32 时间=1ms TTL=255
来自 192.168.10.254 的回复: 字节=32 时间=1ms TTL=255
来自 192.168.10.254 的回复: 字节=32 时间=1ms TTL=255
来自 192.168.10.254 的回复: 字节=32 时间=1ms TTL=255
来自 192.168.10.254 的回复: 字节=32 时间=1ms TTL=255
来自 192.168.10.254 的回复: 字节=32 时间=1ms TTL=255
192.168.10.254 的 Ping 统计信息:
    数据包: 已发送 = 12，已接收 = 8，丢失 =4 (33% 丢失)，
往返行程的估计时间(以毫秒为单位):
    最短 = 1ms，最长 = 3ms，平均 = 1ms

通过上面的测试发现有数据包丢失虽然心跳地址任然通信，会不会RAC通过测定数据包丢失而判断心跳失效，从而发生类似“脑裂”的问题，结合crsd.log中gipchaLowerProcessNode: no valid interfaces found to node for 2789821594 ms”，通过上面信息判断问题出现在RAC心跳上，于是想利用独立交换机接入节点1、2的心跳网卡，通过这个操作，奇迹发送了，节点1、2的crs尽然启动了，群集资源也没有异常，可以查看crsd.log日志如下：

hostname:/grid/app/11.2/grid/log/jbdb2/crsd$tail -n 100 crsd.log
2015-01-15 17:19:06.666: [UiServer][11568] {2:24121:114} Done for ctx=11236f630
2015-01-15 17:19:20.233: [UiServer][11825] CS(11237a810)set Properties ( grid,11238c390)
2015-01-15 17:19:20.244: [UiServer][11568] {2:24121:115} Sending message to PE. ctx= 112004170
2015-01-15 17:19:20.300: [UiServer][11568] {2:24121:115} Done for ctx=112004170
2015-01-15 17:19:42.929: [    AGFW][10026] {2:24121:2} Received the reply to the message: RESOURCE_START[ora.jbdb.db 2 1] ID 4098:323 from the agent /grid/app/11.2/grid/bin/oraagent_oracle
2015-01-15 17:19:42.930: [    AGFW][10026] {2:24121:2} Agfw Proxy Server sending the reply to PE for message:RESOURCE_START[ora.jbdb.db 2 1] ID 4098:881
2015-01-15 17:19:42.932: [    AGFW][10026] {2:24121:2} Received the reply to the message: RESOURCE_START[ora.jbdb.db 2 1] ID 4098:323 from the agent /grid/app/11.2/grid/bin/oraagent_oracle
2015-01-15 17:19:42.933: [    AGFW][10026] {2:24121:2} Agfw Proxy Server sending the last reply to PE for message:RESOURCE_START[ora.jbdb.db 2 1] ID 4098:881
2015-01-15 17:19:42.946: [UiServer][11568] {2:24121:97} Container [ Name: ORDER
        MESSAGE: 
        TextMessage[CRS-5702: Resource 'ora.jbdb.db' is already running on 'jbdb2']
        MSGTYPE: 
        TextMessage[1]
        OBJID: 
        TextMessage[ora.jbdb.db 2 1]
        WAIT: 
        TextMessage[0]
]
2015-01-15 17:19:42.946: [ COMMCRS][11568]clscsendx: (11237cbb0) Connection not active
hostname:/grid/app/11.2/grid/log/jbdb2/crsd$crs_stat -t
Name           Type           Target    State     Host        
------------------------------------------------------------
ora.DATA.dg    ora....up.type ONLINE    ONLINE    jbdb1       
ora....BASE.dg ora....up.type ONLINE    ONLINE    jbdb1       
ora....ER.lsnr ora....er.type ONLINE    ONLINE    jbdb1       
ora....N1.lsnr ora....er.type ONLINE    ONLINE    jbdb1       
ora.asm        ora.asm.type   ONLINE    ONLINE    jbdb1       
ora.cvu        ora.cvu.type   ONLINE    ONLINE    jbdb1       
ora.gsd        ora.gsd.type   OFFLINE   OFFLINE               
ora.jbdb.db    ora....se.type ONLINE    ONLINE    jbdb1       
ora....SM1.asm application    ONLINE    ONLINE    jbdb1       
ora....B1.lsnr application    ONLINE    ONLINE    jbdb1       
ora.jbdb1.gsd  application    OFFLINE   OFFLINE               
ora.jbdb1.ons  application    ONLINE    ONLINE    jbdb1       
ora.jbdb1.vip  ora....t1.type ONLINE    ONLINE    jbdb1       
ora....SM2.asm application    ONLINE    ONLINE    jbdb2       
ora....B2.lsnr application    ONLINE    ONLINE    jbdb2       
ora.jbdb2.gsd  application    OFFLINE   OFFLINE               
ora.jbdb2.ons  application    ONLINE    ONLINE    jbdb2       
ora.jbdb2.vip  ora....t1.type ONLINE    ONLINE    jbdb2       
ora....network ora....rk.type ONLINE    ONLINE    jbdb1       
ora.oc4j       ora.oc4j.type  ONLINE    ONLINE    jbdb1       
ora.ons        ora.ons.type   ONLINE    ONLINE    jbdb1       
ora....ry.acfs ora....fs.type ONLINE    ONLINE    jbdb1       
ora.scan1.vip  ora....ip.type ONLINE    ONLINE    jbdb1 
hostname:/grid/app/11.2/grid/log/jbdb2/crsd$crsctl stat res -t -init
--------------------------------------------------------------------------------
NAME           TARGET  STATE        SERVER                   STATE_DETAILS       
--------------------------------------------------------------------------------
Cluster Resources
--------------------------------------------------------------------------------
ora.asm
      1        ONLINE  ONLINE       jbdb2                    Started             
ora.cluster_interconnect.haip
      1        ONLINE  ONLINE       jbdb2                                        
ora.crf
      1        ONLINE  ONLINE       jbdb2                                        
ora.crsd
      1        ONLINE  ONLINE       jbdb2                                        
ora.cssd
      1        ONLINE  ONLINE       jbdb2                                        
ora.cssdmonitor
      1        ONLINE  ONLINE       jbdb2                                        
ora.ctssd
      1        ONLINE  ONLINE       jbdb2                    OBSERVER            
ora.diskmon
      1        OFFLINE OFFLINE                                                   
ora.drivers.acfs
      1        ONLINE  ONLINE       jbdb2                                        
ora.evmd
      1        ONLINE  ONLINE       jbdb2                                        
ora.gipcd
      1        ONLINE  ONLINE       jbdb2                                        
ora.gpnpd
      1        ONLINE  ONLINE       jbdb2                                        
ora.mdnsd
      1        ONLINE  ONLINE       jbdb2  
hostname:/grid/app/11.2/grid/log/jbdb1/crsd$tail -n 100 crsd.log
2015-01-15 17:19:18.657: [   CRSPE][12082] {2:24121:115} Processing PE command id=157. Description: [Stat Resource : 112df6db0]
2015-01-15 17:19:41.343: [   CRSPE][12082] {2:24121:2} Received reply to action [Start] message ID: 881
2015-01-15 17:19:41.346: [   CRSPE][12082] {2:24121:2} Received reply to action [Start] message ID: 881
2015-01-15 17:19:41.346: [   CRSPE][12082] {2:24121:2} RI [ora.jbdb.db 2 1] new internal state: [STABLE] old value: [STARTING]
2015-01-15 17:19:41.346: [   CRSPE][12082] {2:24121:2} RI [ora.jbdb.db 2 1] new external state [ONLINE] old value: [OFFLINE] on jbdb2 label = [Open] 
2015-01-15 17:19:41.346: [   CRSPE][12082] {2:24121:2} Set State Details to [Open] from [ ] for [ora.jbdb.db 2 1]
2015-01-15 17:19:41.347: [   CRSPE][12082] {2:24121:2} CRS-2676: Start of 'ora.jbdb.db' on 'jbdb2' succeeded
2015-01-15 17:19:41.351: [  CRSRPT][12339] {2:24121:2} Published to EVM CRS_RESOURCE_STATE_CHANGE for ora.jbdb.db
2015-01-15 17:19:41.353: [   CRSPE][12082] {2:24121:97} Re-evaluation of queued op [START of [ora.jbdb.db 2 1] on [jbdb2] : local=0, unplanned=0114e51c50]. found it no longer needed:CRS-5702: Resource 'ora.jbdb.db' is already running on 'jbdb2'
. Finishing the op.
2015-01-15 17:19:41.354: [   CRSPE][12082] {2:24121:97} PE Command [ Start Resource : 11200d6d0 ] has completed
2015-01-15 17:19:41.354: [   CRSPE][12082] {2:24121:97} UI Command [Start Resource : 11200d6d0] is replying to sender. 
2015-01-15 17:19:41.357: [   CRSPE][12082] {2:24121:97} PE Command [ Server Join: Resource Startup {jbdb2 } : 11211a670 ] has completed
2015-01-15 17:19:41.357: [    AGFW][10797] {2:24121:97} Agfw Proxy Server received the message: CMD_COMPLETED[Proxy] ID 20482:930
2015-01-15 17:19:41.358: [    AGFW][10797] {2:24121:97} Agfw Proxy Server replying to the message: CMD_COMPLETED[Proxy] ID 20482:930
2015-01-15 17:19:41.358: [   CRSPE][12082] {2:24121:97} Updated state details for server jbdb2from [AUTOSTARTING RESOURCES] to : []
2015-01-15 17:19:41.358: [  CRSOCR][11054] {2:24121:97} Multi Write Batch processing...
2015-01-15 17:19:41.360: [  CRSRPT][12339] {2:24121:97} Published to EVM CRS_SERVER_STATE_CHANGE for jbdb2
2015-01-15 17:19:41.364: [  CRSOCR][11054] {2:24121:97} Multi Write Batch done.
2015-01-15 17:19:41.364: [   CRSPE][12082] {2:24121:97} Resource Autostart completed for jbdb2
2015-01-15 17:19:41.506: [   CRSPE][12082] {2:24121:116} Processing PE command id=158. Description: [Stat Resource : 1118a75b0]
2015-01-15 17:19:41.841: [   CRSPE][12082] {2:24121:117} Processing PE command id=159. Description: [Stat Resource : 11200c5b0]
2015-01-15 17:19:42.080: [   CRSPE][12082] {2:24121:118} Processing PE command id=160. Description: [Stat Resource : 1118a75b0]
2015-01-15 17:21:40.306: [UiServer][12596] CS(11200c570)set Properties ( root,11200def0)

通过上面的日志和crs的状态，发现群集资源已经恢复，并且资源启动，数据库的状态及实例的状态、ASM等都运行正常，最终通过排查是RAC小型机的心跳网线配线架出现问题，导致心跳丢包，待所有问题解决后，长长舒了口气，终于可以睡个安心觉了。

本文出自 “freedom” 博客，谢绝转载！

你可能感兴趣的:(CRS-0184)

CRS-0184: Cannot communicate with the CRS daemon. honghaibing123 Oracle
刚装好的rac，重启系统之后，发现起不来[grid@rac1~]$crs_stat-tCRS-0184:CannotcommunicatewiththeCRSdaemon.于是去手动启动[grid@rac1~]$sqlplus/assysasmSQL*Plus:Release11.2.0.4.0ProductiononMonMar1713:10:572014Copyright(c)1982,201
CRS-0184: Cannot communicate with the CRS daemon.之存储故障解决办法 king_harry #oracle RAC常见错误 CRS-0184 oracleRAC crs_stat
$crs_stat-tCRS-0184:CannotcommunicatewiththeCRSdaemon.$crsctlcheckcrsCRS-4638:OracleHighAvailabilityServicesisonlineCRS-4535:CannotcommunicatewithClusterReadyServicesCRS-4529:ClusterSynchronizationSer
CRS-0184: Cannot communicate with the CRS daemon.之节点脱离集群问题解决 NealCaffrey_ oracle
1、系统环境：OEL6.5企业版Oracle11.2.0.2RAC+ASM2、报错信息：$crs_stat-tCRS-0184:CannotcommunicatewiththeCRSdaemon.$crsctlcheckhasCRS-4639:CouldnotcontactOracleHighAvailabilityServices3、报错原因查找：在节点1节点查看IP地址，VIP已经不存在$if
Oracle 11g RAC 执行root.sh时遭遇 CRS-0184/PRCR-1070 Leshami -----Oracle RAC相关 -----Oracle故障处理
Oracle11gRAC安装时，在第一个节点执行root.sh时遭遇了CRS-0184/PRCR-1070，Google了很多帖子也没有找到解决办法。呜呜，还是静下心来看日志！！最后的发现原来是一个不经意的小问题，如下面的描述。1、故障现象#安装环境[root@linux1~]#more/etc/issueEnterpriseLinuxEnterpriseLinuxServerrelease5.5
oracle rac 11g 日志占满系统盘导致数据库down掉 674591788 oracle rac archivelog
oracle日志占满系统盘满了导致数据库挂掉并且archivelog日志也满了倒是数据库无法open，无法登陆，幸好还可以到mount状态。解决办法：1.根据报错查看表象：crs服务down掉CRS-0184:CannotcommunicatewiththeCRSdaemon删除/var/tmp/.oracle目录删除oraclealter日志：cd/u01/app/oracle/rdbms/bo
CRS-0184: Cannot communicate with the CRS daemon.----一步步解决（OCR问题） ghostliming cannot comm CRS-0184
刚刚装好的10gRAC，重启一下，等了很久，数据库还是没起来，然后：[oracle@rac1~]$crs_stat-t-v CRS-0184:CannotcommunicatewiththeCRSdaemon.不科学呀，首先习惯性的检查了盘的状况：[root@rac1log]#ll/dev/raw/* crw-rw----1oracledba162,1Nov112:56/dev/raw/raw1
10g crs 启动报错的记录 peiyongbin_ #oracle dbf asm gi rac
10GR2（10.2.0.4）RAC数据库，双机上均配置了crsenable，维护需要重启一台OS，重启进入系统后，手动启动hacmp，稍等片刻，等待并发卷组的挂载和crs的启动。但是在执行./crs_stat-t-v时报错CRS-0184:CannotcommunicatewiththeCRSdaemon使用ps-ef|grep-i/etc/init时发现没有/etc/init.crsrun进程
10g crs 启动报错的记录 ctypyb2002 RAC CRS
10GR2（10.2.0.4）RAC数据库，双机上均配置了crsenable，维护需要重启一台OS，重启进入系统后，手动启动hacmp，稍等片刻，等待并发卷组的挂载和crs的启动。但是在执行./crs_stat-t-v 时报错CRS-0184:CannotcommunicatewiththeCRSdaemon使用ps-ef|grep-i/etc/init时发现没有 /etc/init.crsrun
Oracle RAC CRS-0184 --Cannot communicate with the CRS daemon oracle
Oracle 11gR2 下RAC 安装后，启动CRS. 错误如下： [root@rac1 bin]# ./crsctl check crs CRS-4638: Oracle High Availability Services is online CRS-4535: Cannot communicate with Cluster Ready Services
Oracle RAC CRS-0184 --Cannot communicate with the CRS daemon oracle
Oracle 11gR2 下RAC 安装后，启动CRS. 错误如下： [root@rac1 bin]# ./crsctl check crs CRS-4638: Oracle High Availability Services is online CRS-4535: Cannot communicate with Cluster Ready Services
CRS-0184: Cannot communicate with the CRS daemon im_vincent__
crs_stat-t/crsctlstatusres-tCRS-0184:CannotcommunicatewiththeCRSdaemon.crsctlcheckcrsCRS-4638:OracleHighAvailabilityServicesisonlineCRS-4535:CannotcommunicatewithClusterReadyServicesCRS-4529:ClusterSy
HP-UX web登陆无反应，猜就是数据库出了问题 shushugood
今天清明节的第2天了，接到一个陌生电话，结果是现在项目经理，给我“哭诉”，系统登陆不起了，局方在导数据。因为最近在研究大数据，所以oracle的事情很少碰。这些系统也比较稳定了。1.开始了，收到了登陆方式，立马打开电脑，ssh上去，df-h,察。。。HP-UX ,立马bdf,看看是不是系统log100%》无法记录导致。结果不是2. $crs_stat-t CRS-0184:Cannotcommu
CRS-0184问题解决过程 klmy_think CRS-0184
近日，公司搭建的ORACLE11GRAC出现故障，整个故障的排错思路大概持续了一周左右，最终确定了问题原因，现在简介下ORACLE11GRAC的环境：jbdb1 IBMP740 AIX 6100-08-02-1316jbdb2 IBMP740 AIX 6100-08-02-1316Oracle11G11.2.0.3gridanddatabase 当日，软件人员说无法连接数据库，我就很纳闷
CRS-0184问题解决过程 klmy_think CRS-0184
近日，公司搭建的ORACLE11GRAC出现故障，整个故障的排错思路大概持续了一周左右，最终确定了问题原因，现在简介下ORACLE11GRAC的环境：jbdb1 IBMP740 AIX 6100-08-02-1316jbdb2 IBMP740 AIX 6100-08-02-1316Oracle11G11.2.0.3gridanddatabase 当日，软件人员说无法连接数据库，我就很纳闷
CRS-0184: Cannot communicate with the CRS daemon jian469697232 crs oracle
对于unknown的进程要crs_stop-f加进程名杀掉，后在star1删除机器上的/etc/oracle/scls_scr/rac1/oracle/cssfatal文件如果不删这个文件，运行root.sh脚本时会报错。然后重新运行下$ORA_CRS_HOME/root.sh脚本2有时候开机启不起来可以先杀了这个进程试下/etc/init.d/init.ohasd使用root用户权限执行crsc
CRS-0184: Cannot communicate with the CRS daemon jian469697232 CRS
对于unknown的进程要crs_stop-f加进程名杀掉，后在star1 删除机器上的/etc/oracle/scls_scr/rac1/oracle/cssfatal文件如果不删这个文件，运行root.sh脚本时会报错。然后重新运行下$ORA_CRS_HOME/root.sh脚本2有时候开机启不起来可以先杀了这个进程试下/etc/init.d/init.ohasd 使用root用户权限执行
oracle CRS-0184 无法与crs守护进程对话小健么守护进程 CRS
oracle11graccrs进程重启时报错 1创建rac集群时出现上述错误删除node1机器上的/etc/oracle/scls_scr/rac1/oracle/cssfatal文件运行/u01/app/grid/product/11.2.0/grid/root.sh 2rac运行过程中出现上述错误两个节点crs_stop-all如果有unknown进程需要crs_sto
CRS-0184诊断与启动CRS(原创) czmmiao 启动
CRS-0184错误与CRS初始化bash-2.05$ iduid=101(oracle) gid=101(dba)bash-2.05$ crs_start -allCRS-0184: Cannot communicate with the CRS daemon.检查一下crs进程：$ ps -ef|grep crs root 10469
【ORACLE RAC】crs启动失败 crs_start -all CRS-0184: Cannot communicate with the CRS daemon. u011538954 Daemon crsctl CRS crs_stat CRS-0184
****************************************************************************原文：blog.csdn.net/clark_xu 徐长亮的专栏************************************************************************因为crs_start属于应用层的指令，
11gR2修改主机名导致CRS-0184以及CRS-4000的错误 haiross
11gR2修改主机名导致CRS-0184以及CRS-4000的错误作者:Asher|分类:Oracle|Tag:grid,oracle11g|评论:0 字号：T|T我们通常都说，在部署Oracle数据库服务器前，要规划好主机名、IP地址等基础信息，一经确定，尤其是部署好Oracle数据库之后，就不要轻易修改主机名或者是IP地址等。而且我们也都知道这个理儿，但可是，可但是，在实际工作当中，你难免不会
Oracle 11g RAC 执行root.sh时遭遇 CRS-0184/PRCR-1070 robinson_0612
Oracle11gRAC安装时，在第一个节点执行root.sh时遭遇了CRS-0184/PRCR-1070，Google了很多帖子也没有找到解决办法。呜呜，还是静下心来看日志！！最后的发现原来是一个不经意的小问题，如下面的描述。 1、故障现象#安装环境 [root@linux1~]#more/etc/issue EnterpriseLinuxEnterpriseLinuxServerrelea
解决：CRS-0184: Cannot communicate with the CRS daemon. vast2006 oracle CRS-0184
早上过来，启动rac，节点1出现了CRS-0184的错误； [grid@node1~]$crs_stat-t-vCRS-0184:CannotcommunicatewiththeCRSdaemon.而节点2都是正常的网上找到一个比较简单的方法在/tmp/和/var/tmp下面有个.oracle的目录，删除掉或许能解决问题；登录节点1，在/tmp和/var/tmp目录下面发现了.oracle目录，
Oracle RAC CRS-0184 --Cannot communicate with the CRS daemon xujinyang
Oracle11gR2 下RAC 安装后，启动CRS. 错误如下： [root@rac1bin]#./crsctlcheckcrsCRS-4638:OracleHighAvailabilityServicesisonlineCRS-4535:CannotcommunicatewithClusterReadyServicesCRS-4529:ClusterSynchronizationService
Oracle RAC CRS-0184 --Cannot communicate with the CRS daemon tianlesoftware oracle css 存储 NetWork 2010 Sockets
Oracle11gR2下RAC安装后，启动CRS.错误如下： [root@rac1bin]#./crsctlcheckcrsCRS-4638:OracleHighAvailabilityServicesisonlineCRS-4535:CannotcommunicatewithClusterReadyServicesCRS-4529:ClusterSynchronizationServicesi
Oracle RAC CRS-0184 --Cannot communicate with the CRS daemon ijavagos oracle
Oracle 11gR2 下RAC 安装后，启动CRS. 错误如下： [root@rac1 bin]# ./crsctl check crs CRS-4638: Oracle High Availability Services is online CRS-4535: Cannot communicate with Cluster Ready Services CRS-4529:
CRS-0184: Cannot communicate with the CRS daemon Fangrn oracle UI css Security UP
RAC节点重起有问题，查看crs 状态有如下错误 CRS-0184: Cannot communicate with the CRS daemon 前几天搭建了两节点的一个RAC数据库发现一个问题，当我重起两台主机的时候，有如下的问题: 虚拟IP全跑到其中一个节点上去了 # ifconfig -a en0: flags=5e080863,c0<UP,BROADC
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一