cuizhi4718

记一次RAC Brain Split脑裂分析过程

1.环境介绍：
DB版本：11.2.0.4 64位
OS版本：AIX 6.1 位
2.错误现象
node1 节点1ASM实例日志：
Mon Jan 12 09:08:48 2015
Reconfiguration started (old inc 8, new inc 10)
List of instances:
1 (myinst: 1)
Global Resource Directory frozen
* dead instance detected - domain 1 invalid = TRUE
* dead instance detected - domain 2 invalid = TRUE
Communication channels reestablished
Master broadcasted resource hash value bitmaps
Non-local Process blocks cleaned out
Mon Jan 12 09:08:48 2015
LMS 0: 0 GCS shadows cancelled, 0 closed, 0 Xw survived
Set master node info
Submitted all remote-enqueue requests
Dwn-cvts replayed, VALBLKs dubious
All grantable enqueues granted
Post SMON to start 1st pass IR
Submitted all GCS remote-cache requests
Post SMON to start 1st pass IR
Fix write in gcs resources
Reconfiguration complete
Mon Jan 12 09:08:48 2015
NOTE: SMON starting instance recovery for group DG domain 1 (mounted)
NOTE: F1X0 found on disk 0 au 2 fcn 0.332
NOTE: starting recovery of thread=2 ckpt=10.4585 group=1 (DG)
NOTE: SMON waiting for thread 2 recovery enqueue
NOTE: SMON about to begin recovery lock claims for diskgroup 1 (DG)
NOTE: SMON successfully validated lock domain 1
NOTE: advancing ckpt for group 1 (DG) thread=2 ckpt=10.4585
NOTE: SMON did instance recovery for group DG domain 1
NOTE: SMON starting instance recovery for group VOTE domain 2 (mounted)
NOTE: F1X0 found on disk 0 au 2 fcn 0.0
NOTE: starting recovery of thread=2 ckpt=15.26 group=2 (VOTE)
NOTE: SMON waiting for thread 2 recovery enqueue
NOTE: SMON about to begin recovery lock claims for diskgroup 2 (VOTE)
NOTE: SMON successfully validated lock domain 2
NOTE: advancing ckpt for group 2 (VOTE) thread=2 ckpt=15.26
NOTE: SMON did instance recovery for group VOTE domain 2
Mon Jan 12 09:21:06 2015
Reconfiguration started (old inc 10, new inc 12)
List of instances:
1 2 (myinst: 1)
Global Resource Directory frozen
Communication channels reestablished
Master broadcasted resource hash value bitmaps
Non-local Process blocks cleaned out
Mon Jan 12 09:21:06 2015
LMS 0: 0 GCS shadows cancelled, 0 closed, 0 Xw survived
Set master node info
Submitted all remote-enqueue requests
Dwn-cvts replayed, VALBLKs dubious
All grantable enqueues granted
Submitted all GCS remote-cache requests
Fix write in gcs resources
Reconfiguration complete
Mon Jan 12 09:25:08 2015
Reconfiguration started (old inc 12, new inc 14)
List of instances:
1 (myinst: 1)
Global Resource Directory frozen
Communication channels reestablished
Master broadcasted resource hash value bitmaps
Non-local Process blocks cleaned out
Mon Jan 12 09:25:08 2015
LMS 0: 0 GCS shadows cancelled, 0 closed, 0 Xw survived
Set master node info
Submitted all remote-enqueue requests
Dwn-cvts replayed, VALBLKs dubious
All grantable enqueues granted
Post SMON to start 1st pass IR
Submitted all GCS remote-cache requests
Post SMON to start 1st pass IR
Fix write in gcs resources
Reconfiguration complete
Mon Jan 12 09:51:08 2015
Reconfiguration started (old inc 14, new inc 18)
List of instances:
1 (myinst: 1)
Global Resource Directory frozen
Communication channels reestablished
Master broadcasted resource hash value bitmaps
Non-local Process blocks cleaned out
Mon Jan 12 09:51:08 2015
LMS 0: 0 GCS shadows cancelled, 0 closed, 0 Xw survived
Set master node info
Submitted all remote-enqueue requests
Dwn-cvts replayed, VALBLKs dubious
All grantable enqueues granted
Submitted all GCS remote-cache requests
Fix write in gcs resources
Reconfiguration complete
Mon Jan 12 10:15:52 2015
Reconfiguration started (old inc 18, new inc 20)
List of instances:
1 2 (myinst: 1)
Global Resource Directory frozen
Communication channels reestablished
Master broadcasted resource hash value bitmaps
Non-local Process blocks cleaned out
Mon Jan 12 10:15:53 2015
LMS 0: 0 GCS shadows cancelled, 0 closed, 0 Xw survived
Set master node info
Submitted all remote-enqueue requests
Dwn-cvts replayed, VALBLKs dubious
All grantable enqueues granted
Submitted all GCS remote-cache requests
Fix write in gcs resources
Reconfiguration complete
Mon Jan 12 12:20:06 2015
Warning: VKTM detected a time drift.
Time drifts can result in an unexpected behavior such as time-outs. Please check trace file for more
details.
Mon Jan 12 12:20:26 2015
Reconfiguration started (old inc 20, new inc 22)
List of instances:
1 (myinst: 1)
Global Resource Directory frozen
* dead instance detected - domain 1 invalid = TRUE
* dead instance detected - domain 2 invalid = TRUE
Communication channels reestablished
Master broadcasted resource hash value bitmaps
Non-local Process blocks cleaned out
Mon Jan 12 12:20:26 2015
LMS 0: 0 GCS shadows cancelled, 0 closed, 0 Xw survived
Set master node info
Submitted all remote-enqueue requests
Dwn-cvts replayed, VALBLKs dubious
All grantable enqueues granted
Post SMON to start 1st pass IR
Submitted all GCS remote-cache requests
Post SMON to start 1st pass IR
Fix write in gcs resources
Reconfiguration complete
Mon Jan 12 12:20:26 2015
NOTE: SMON starting instance recovery for group DG domain 1 (mounted)
NOTE: F1X0 found on disk 0 au 2 fcn 0.332
NOTE: starting recovery of thread=2 ckpt=11.4610 group=1 (DG)
NOTE: SMON waiting for thread 2 recovery enqueue
Mon Jan 12 12:32:50 2015
LMS 0: 0 GCS shadows cancelled, 0 closed, 0 Xw survived
Set master node info
Submitted all remote-enqueue requests
Dwn-cvts replayed, VALBLKs dubious
All grantable enqueues granted
Submitted all GCS remote-cache requests
Fix write in gcs resources
Reconfiguration complete
Mon Jan 12 13:44:50 2015
NOTE: No asm libraries found in the system
MEMORY_TARGET defaulting to 1128267776.
* instance_number obtained from CSS = 1, checking for the existence of node 0...
* node 0 does not exist. instance_number = 1
Starting ORACLE instance (normal)
LICENSE_MAX_SESSION = 0
LICENSE_SESSIONS_WARNING = 0
Initial number of CPU is 32
Number of processor cores in the system is 8
Private Interface 'en0' configured from GPnP for use as a private interconnect.
[name='en0', type=1, ip=169.254.189.151, mac=00-90-fa-52-21-be, net=169.254.0.0/16,
mask=255.255.0.0, use=haip:cluster_interconnect/62]
Public Interface 'en2' configured from GPnP for use as a public interface.
[name='en2', type=1, ip=192.168.0.12, mac=00-90-fa-52-22-3c, net=192.168.0.0/24,
mask=255.255.255.0, use=public/1]
CELL communication is configured to use 0 interface(s):
CELL IP affinity details:
NUMA status: non-NUMA system
cellaffinity.ora status: N/A
CELL communication will use 1 IP group(s):
Grp 0:
Picked latch-free SCN scheme 3
Using LOG_ARCHIVE_DEST_1 parameter default value as /u01/app/oracle/grid/asm/dbs/arch
Autotune of undo retention is turned on.c

说明：主节点node1的asm日志中显示，asm实例分别在Mon Jan 12 09:08:48 2015
，Mon Jan 12 09:21:06 2015，Mon Jan 12 09:25:08 2015，Mon Jan 12 09:51:08 2015，Mon Jan 12 10:15:52 2015，Mon Jan 12 12:20:26 2015多次进行reconfiguration，也就是asm实例不断的重启，出现脑裂现象，且en0为private网卡，IP地址为169.254.189.151，en2 为public网卡，IP地址为192.168.0.12。

3.分析过程
node2 节点2ASM实例日志
Mon Jan 12 09:09:29 2015
NOTE: client exited [4719298]
Mon Jan 12 09:09:29 2015
NOTE: ASMB process exiting, either shutdown is in progress
NOTE: or foreground connected to ASMB was killed.
Mon Jan 12 09:09:29 2015
PMON (ospid: 3867214): terminating the instance due to error 471
Mon Jan 12 09:51:49 2015
Shutting down instance (abort)
License high water mark = 2
USER (ospid: 2425590): terminating the instance
Instance terminated by USER, pid = 2425590
Mon Jan 12 09:51:50 2015
Instance shutdown complete
Mon Jan 12 10:16:27 2015
NOTE: No asm libraries found in the system
MEMORY_TARGET defaulting to 1128267776.
* instance_number obtained from CSS = 2, checking for the existence of node 0...
* node 0 does not exist. instance_number = 2
Starting ORACLE instance (normal)
LICENSE_MAX_SESSION = 0
LICENSE_SESSIONS_WARNING = 0
Mon Jan 12 12:21:07 2015
NOTE: client exited [2098012]
Mon Jan 12 12:21:07 2015
NOTE: ASMB process exiting, either shutdown is in progress
NOTE: or foreground connected to ASMB was killed.
Mon Jan 12 12:21:09 2015
PMON (ospid: 2818726): terminating the instance due to error 481
Instance terminated by PMON, pid = 2818726
Mon Jan 12 12:33:30 2015
NOTE: No asm libraries found in the system
MEMORY_TARGET defaulting to 1128267776.
* instance_number obtained from CSS = 2, checking for the existence of node 0...
* node 0 does not exist. instance_number = 2
Starting ORACLE instance (normal)
LICENSE_MAX_SESSION = 0
LICENSE_SESSIONS_WARNING = 0
Initial number of CPU is 32
Number of processor cores in the system is 8
Mon Jan 12 12:38:19 2015
NOTE: client jzhprd2:jzhprd registered, osid 3146138, mbr 0x1
Mon Jan 12 12:38:51 2015
ALTER SYSTEM SET local_listener=' (DESCRIPTION=(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)(HOST=192.168.0.13)(PORT=1521))))' SCOPE=MEMORY SID='+ASM2';
Mon Jan 12 13:01:34 2015
NOTE: ASMB process exiting, either shutdown is in progress
NOTE: or foreground connected to ASMB was killed.
Mon Jan 12 13:01:34 2015
NOTE: client exited [4915336]
NOTE: force a map free for map id 2
Mon Jan 12 13:01:36 2015
PMON (ospid: 3212222): terminating the instance due to error 481
Instance terminated by PMON, pid = 3212222
Mon Jan 12 13:46:02 2015
NOTE: No asm libraries found in the system
MEMORY_TARGET defaulting to 1128267776.
* instance_number obtained from CSS = 2, checking for the existence of node 0...
* node 0 does not exist. instance_number = 2
Starting ORACLE instance (normal)
LICENSE_MAX_SESSION = 0
LICENSE_SESSIONS_WARNING = 0
Initial number of CPU is 32
Number of processor cores in the system is 8
说明：标红字体显示节点JZH2中ASMB进程在9:9:29s时开始出现异常，ASM异常需要检查CRS、CSS相关日志。

node 2 节点2CRSD日志

2015-01-12 09:09:30.742: [ CSSCLNT][1]clssscConnect: gipc request failed with 13 (1a)

CSS失败了（CSS，cluster synchronization services集群同步服务-涉及netwok hearbeat，disk heartbeat两种机制）

2015-01-12 09:09:30.742: [ CSSCLNT][1]clsssInitNative: connect to (ADDRESS=(PROTOCOL=ipc)(KEY=OCSSD_LL_node2_)) failed, rc 13

2015-01-12 09:09:30.745: [ CRSRTI][1] CSS is not ready. Received status 3
CSS not ready

2015-01-12 09:09:30.745: [ CRSMAIN][1] First attempt: init CSS context failed. Error = 3

[ clsdmt][515]Listening to (ADDRESS=(PROTOCOL=ipc)(KEY=jzh2DBG_CRSD))

第一次偿试，失败了

2015-01-12 09:09:30.812: [ clsdmt][515]PID for the Process [4522624], connkey 1

2015-01-12 09:09:30.812: [ clsdmt][515]Creating PID [4522624] file for home /u01/app/oracle/grid/asm host jzh2 bin crs to /u01/app/oracle/grid/asm/crs/init/

2015-01-12 09:09:30.812: [ clsdmt][515]Writing PID [4522624] to the file [/u01/app/oracle/grid/asm/crs/init/jzh2.pid]

2015-01-12 09:09:31.863: [ CRSMAIN][1] CRS Daemon Starting--> CRS staring（crsd服务没有问题，一会验证）

说明：以上说明CRS服务没有问题，在09：09：30s时CSS集群同步服务出现异常，集群同步服务涉及到disk heartbeat（磁盘心跳）network heartbear(网络心跳)，也就是说网络与磁盘心跳有问题, 接下来看一下jzh1 ocssd.log记录node1 jzh1在2015-01-12 09:09:30干什么？。

node1 节点1 CSSD日志：
2015-01-12 09:09:00.934: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes

2015-01-12 09:09:00.934: [ CSSD][3862]clssnmSendingThread: sent 4 status msgs to all nodes

2015-01-12 09:09:04.946: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes

2015-01-12 09:09:04.946: [ CSSD][3862]clssnmSendingThread: sent 4 status msgs to all nodes

2015-01-12 09:09:08.980: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes

2015-01-12 09:09:08.980: [ CSSD][3862]clssnmSendingThread: sent 4 status msgs to all nodes

2015-01-12 09:09:12.994: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes

2015-01-12 09:09:12.994: [ CSSD][3862]clssnmSendingThread: sent 4 status msgs to all nodes

2015-01-12 09:09:16.758: [ CSSD][2577]clssnmSetupReadLease: status 1

2015-01-12 09:09:16.762: [ CSSD][2577]clssnmCompleteGMReq: Completed request type 17 with status 1

2015-01-12 09:09:16.762: [ CSSD][2577]clssgmDoneQEle: re-queueing req 110617b30 status 1

2015-01-12 09:09:16.763: [ CSSD][1029]clssgmCheckReqNMCompletion: Completing request type 17 for proc (111b38850), operation status 1, client status 0

2015-01-12 09:09:17.009: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes

2015-01-12 09:09:17.009: [ CSSD][3862]clssnmSendingThread: sent 4 status msgs to all nodes

2015-01-12 09:09:21.028: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes

2015-01-12 09:09:21.028: [ CSSD][3862]clssnmSendingThread: sent 4 status msgs to all nodes

2015-01-12 09:09:25.349: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes

2015-01-12 09:09:25.349: [ CSSD][3862]clssnmSendingThread: sent 3 status msgs to all nodes

2015-01-12 09:09:29.355: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes

2015-01-12 09:09:29.355: [ CSSD][3862]clssnmSendingThread: sent 4 status msgs to all nodes

2015-01-12 09:09:33.362: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes

2015-01-12 09:09:33.362: [ CSSD][3862]clssnmSendingThread: sent 4 status msgs to all nodes

2015-01-12 09:09:37.366: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes

2015-01-12 09:09:37.366: [ CSSD][3862]clssnmSendingThread: sent 4 status msgs to all nodes

2015-01-12 09:09:41.377: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes

2015-01-12 09:09:41.377: [ CSSD][3862]clssnmSendingThread: sent 4 status msgs to all nodes

2015-01-12 09:09:45.394: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes

2015-01-12 09:09:45.394: [ CSSD][3862]clssnmSendingThread: sent 4 status msgs to all nodes

2015-01-12 09:09:49.371: [ CSSD][1029]clssgmQueueGrockEvent: groupName(DAALL_DB_jzh-cluster) count(2) master(0) event(6), incarn 6, mbrc 1, to member 0, events 0x8, state 0x0

2015-01-12 09:09:49.371: [ CSSD][1029]clssgmQueueGrockEvent: groupName(DAALL_DB_jzh-cluster) count(2) master(0) event(6), incarn 6, mbrc 1, to member 1, events 0x8, state 0x0

说明：可以看到node1的CSSD进程send status messagesto all nondes，为什么要send？在RAC启动后(在node1的ASM日志中可以看到在09:08:48s时reconfiguration了)，各个node要将自己的信息写入ocr与vote中，然后 master收集这些信息发送给所有node，告诉所有的node，谁是master，有几个node，在votedisk中记录node相关信息，然后进行投票，到这里，我们可以看到整个集群中有两个member，分别是member 0(jzh1)和member 1（jzh2），也就是说CRSD进程没有问题(已验证)，还说明什么？其他node可以将自己的信息写入vote，就是说disk heatbeat没什么问题(一会验证)。

接着往下看：
2015-01-12 09:17:02.539: [ CSSD][4376]clssscSelect: cookie accept request 110991628

2015-01-12 09:17:02.539: [ CSSD][4376]clssnmeventhndlr: gipcAssociate endp 1d2198b in container 73 type of conn gipcha

2015-01-12 09:17:02.540: [ CSSD][4376]clssnmConnSetNames: hostname jzh2 privname 10.10.0.20 con 1d2198b-->连接jzh2 ，private IP为10.10.0.20(记得在jzh1的asm日志中显示private IP为169.254.189.151)

2015-01-12 09:17:02.540: [ CSSD][4376]clssnmSetNodeProperties: properties node 2 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17-->jzh2 属性

2015-01-12 09:17:02.540: [ CSSD][4376]clssnmConnComplete: node node2 softver 11.2.0.4.0-->node2的software版本

2015-01-12 09:17:02.540: [ CSSD][4376]clssnmCompleteConnProtocol: Incoming connect from node 2 (node2) ninf endp 0, probendp 0, endp 1d2198b

2015-01-12 09:17:02.540: [ CSSD][4376]clssnmSendConnAck: connected to node 2, jzh2, con (1d2198b), state 0

2015-01-12 09:17:02.540: [ CSSD][4376]clssnmCompleteConnProtocol: node jzh2, 2, uniqueness 1421024974, msg uniqueness 1421024974, endp 1d2198b probendp 0 endp 1d2198b

2015-01-12 09:17:03.044: [ CSSD][4376]clssnmHandleJoin: node 2 JOINING, state 0->1 ninfendp 1d2198b

2015-01-12 09:17:03.354: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes

2015-01-12 09:17:03.355: [ CSSD][3862]clssnmSendingThread: sent 4 status msgs to all nodes

2015-01-12 09:17:03.360: [ CSSD][2577]clssnmvReadDskHeartbeat: Reading DHBs to get the latest info for node(2/jzh2), LATSvalid(0), nodeInfoDHB uniqueness(1420692326)àread disk heartbeat

2015-01-12 09:17:03.360: [ CSSD][2577]clssnmvDHBValidateNcopy: Setting LATS valid due to uniqueness change for node(jzh2) number(2), nodeInfoDHB(1420692326), readInfo(1421024974)

2015-01-12 09:17:03.360: [ CSSD][2577]clssnmvDHBValidateNcopy: Saving DHB uniqueness for node jzh2, number 2 latestInfo(1421024974), readInfo(1421024974), nodeInfoDHB(1420692326)à保存jzh2的disk heartbeat信息

2015-01-12 09:17:03.754: [ CSSD][4119]clssnmDoSyncUpdate: Initiating sync 315891915

2015-01-12 09:17:03.754: [ CSSD][4119]clssscCompareSwapEventValue: changed NMReconfigInProgress val 1, from -1, changes 20

2015-01-12 09:17:03.754: [ CSSD][4119]clssnmDoSyncUpdate: local disk timeout set to 200000 ms, remote disk timeout set to 200000-->设置disk heartbeat(磁盘心跳设置200s，11g默认200s)

2015-01-12 09:17:03.754: [ CSSD][4119]clssnmDoSyncUpdate: new values for local disk timeout and remote disk timeout will take effect when the sync is completed-->本地与远程disk heartbeat生效

2015-01-12 09:17:03.754: [ CSSD][4119]clssnmDoSyncUpdate: Starting cluster reconfig with incarnation 315891915

2015-01-12 09:17:03.754: [ CSSD][4119]clssnmSetupAckWait: Ack message type (11)

2015-01-12 09:17:03.754: [ CSSD][4119]clssnmSetupAckWait: node(1) is ALIVE-->node 1 是alive活的

2015-01-12 09:17:03.754: [ CSSD][4119]clssnmSetupAckWait: node(2) is ALIVE--> node 2 是alive活的

说明： node1 jzh1觉得jzh 1,jzh2 都是活的，注意：这里还是 disk heartbeat ，再一次验证 disk heatbeat 没什么问题。

接着往下看：

2015-01-12 09:24:20.392: [ CSSD][3862]clssnmSendingThread: sent 4 status msgs to all nodes

2015-01-12 09:24:23.578: [ CSSD][3605]clssnmPollingThread: node jzh2 (2) at 50% heartbeat fatal, removal in 14.647 seconds-->node1 cssd进程检查jzh2了，到了50%失败，14.647s(记住这个时间)要移除jzh2，上面说disk hearbeat没有问题，这里为什么会报错？

2015-01-12 09:24:23.578: [ CSSD][3605]clssnmPollingThread: node jzh2 (2) is impending reconfig, flag 2294796, misstime 15353-->misstime 15.353s (记住这个时间)+ 14.647s=30s

2015-01-12 09:24:23.578: [ CSSD][3605]clssnmPollingThread: local diskTimeout set to 27000 ms, remote disk timeout set to 27000, impending reconfig status(1)-->disk timeout被设置成27s了，不是200s吗？

2015-01-12 09:24:23.578: [ CSSD][2577]clssnmvDHBValidateNcopy: node 2, jzh2, has a disk HB, but no network HB, DHB has rcfg 315891916, wrtcnt, 19771770, LATS 706581505, lastSeqNo 19771331, uniqueness 1421024974, timestamp 1421025905/706212683à原来node2 jzh2的disk heartbeat可以检测到，所以不需要200s了，DHB has rcfg，再次验证heartbeat 没有问题，but no network HB，难道network heartbeat有问题？

2015-01-12 09:24:23.618: [ CSSD][2063]clssnmvDiskPing: Writing with status 0x3, timestamp 1421025863/706581544

2015-01-12 09:24:24.082: [ CSSD][2577]clssnmvDHBValidateNcopy: node 2, jzh2, has a disk HB, but no network HB, DHB has rcfg 315891916, wrtcnt, 19771771, LATS 706582008, lastSeqNo 19771770, uniqueness 1421024974, timestamp 1421025905/706213190

2015-01-12 09:24:24.119: [ CSSD][2063]clssnmvDiskPing: Writing with status 0x3, timestamp 1421025864/706582045-->disk ping错误了。

2015-01-12 09:24:24.398: [ CSSD][3862]clssnmSendingThread: sending status msg to all nodes-->node1 要告诉大家什么呢？

2015-01-12 09:24:39.805: [ CSSD][4119]clssnmNeedConfReq: No configuration to change

2015-01-12 09:24:39.805: [ CSSD][4119]clssnmDoSyncUpdate: Terminating node 2, jzh2, misstime(31566) state(5)-->要终止node2 jzh2了，misstime为31.566s，记得上面时间是15.353+14.647=30s，这是oracle网络心跳默认最大阀值30s

2015-01-12 09:24:39.805: [ CSSD][4119]clssnmDoSyncUpdate: Wait for 0 vote ack(s)-->要更新votedisk，要投票了

2015-01-12 09:24:39.805: [ CSSD][4119]clssnmCheckDskInfo: Checking disk info...

2015-01-12 09:24:39.805: [ CSSD][4119]clssnmCheckSplit: Node 2, jzh2, is alive, DHB (1421025918, 706226248) more than disk timeout of 27000 after the last

NHB (1421025890, 706197520)-->再次验证disk heartbeat没有问题

2015-01-12 09:24:39.805: [ CSSD][4119]clssnmCheckDskInfo: My cohort: 1

2015-01-12 09:24:39.805: [ CSSD][4119](:CSSNM00007:)clssnmrRemoveNode: Evicting node 2, jzh2, from the cluster in incarnation 315891916, node birth incarnation 315891915, death incarnation 315891916, stateflags 0x234000 uniqueness value 1421024974—>node1 要驱逐node2 jzh2了

2015-01-12 09:24:39.806: [ default][4119]kgzf_gen_node_reid2: generated reid cid=41daa0e19d0a6f84ff29b9f37a2f1a38,icin=315891908,nmn=2,lnid=315891915,gid=0,gin=0,gmn=0,umemid=0,opid=0,opsn=0,lvl=node hdr=0xfece0100

2015-01-12 09:24:39.806: [ CSSD][4119]clssnmrFenceSage: Fenced node jzh2, number 2, with EXADATA, handle 0

2015-01-12 09:24:39.806: [ CSSD][4119]clssnmSendShutdown: req to node 2, kill time 706597731-->node1要将 node2 shutdown kill

2015-01-12 09:24:39.806: [ CSSD][4119]clssnmsendmsg: not connected to node 2-->连不上node2

2015-01-12 09:24:39.806: [ CSSD][4119]clssnmSendShutdown: Send to node 2 failed-->为了保证数据一致，要将node2 shutdown,但是shutown 失败

2015-01-12 09:24:39.806: [ CSSD][4119]clssnmWaitOnEvictions: Start-->开始驱逐。

2015-01-12 09:25:07.095: [ CSSD][4376]clssnmUpdateNodeState: node jzh1, number 1, current state 3, proposed state 3, current unique 1420396557, proposed u

nique 1420396557, prevConuni 0, birth 315891909

2015-01-12 09:25:07.095: [ CSSD][4376]clssnmUpdateNodeState: node jzh2, number 2, current state 5, proposed state 0, current unique 1421024974, proposed u

nique 1421024974, prevConuni 1421024974, birth 315891915

2015-01-12 09:25:07.095: [ CSSD][4376]clssnmDeactivateNode: node 2, state 5

2015-01-12 09:25:07.095: [ CSSD][4376]clssnmDeactivateNode: node 2 (jzh2) left cluster-->node2 jzh2离开了cluster

2015-01-12 10:11:27.825: [ CSSD][4119]clssnmWaitForAcks: Ack message type(11), ackCount(2)

2015-01-12 10:11:27.825: [ CSSD][4376]clssnmHandleSync: Node jzh1, number 1, is EXADATA fence capable

2015-01-12 10:11:27.825: [ CSSD][4376]clssscUpdateEventValue: NMReconfigInProgress val 1, changes 33

2015-01-12 10:11:27.825: [ CSSD][4376]clssnmHandleSync: local disk timeout set to 200000 ms, remote disk timeout set to 200000-->本地和远程disk timeout设置为200s

2015-01-12 10:11:27.825: [ CSSD][4376]clssnmHandleSync: initleader 1 newleader 1-->node1 是leader了，也就是master node

说明： 根据以上分析，磁盘心跳没有问题，问题出现在网络心跳。
node 2节点2CSSD日志

2015-01-12 09:25:19.224: [ CSSD][1]clssgmSuspendAllGrocks: done

2015-01-12 09:25:19.224: [ CSSD][1]clssgmCompareSwapEventValue: changed CmInfo State val 2, from 5, changes 13

2015-01-12 09:25:19.224: [ CSSD][1]clssgmUpdateEventValue: ConnectedNodes val 315891915, changes 5

2015-01-12 09:25:19.224: [ CSSD][1]clssgmCleanupNodeContexts(): cleaning up nodes, rcfg(315891915)

2015-01-12 09:25:19.224: [ CSSD][1]clssgmCleanupNodeContexts(): successful cleanup of nodes rcfg(315891915)

2015-01-12 09:25:19.224: [ CSSD][1]clssgmStartNMMon: completed node cleanup

2015-01-12 09:25:19.224: [ CSSD][4119]clssnmSendSync: syncSeqNo(315891916), indicating EXADATA fence initialization complete

2015-01-12 09:25:19.224: [ CSSD][4119]List of nodes that have ACKed my sync: 2

2015-01-12 09:25:19.224: [ CSSD][4119]clssnmWaitForAcks: done, syncseq(315891916), msg type(11)

2015-01-12 09:25:19.224: [ CSSD][4119]clssnmSetMinMaxVersion:node2 product/protocol (11.2/1.4)

2015-01-12 09:25:19.224: [ CSSD][4119]clssnmSetMinMaxVersion: properties common to all nodes: 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17

2015-01-12 09:25:19.224: [ CSSD][4119]clssnmSetMinMaxVersion: min product/protocol (11.2/1.4)

2015-01-12 09:25:19.224: [ CSSD][4119]clssnmSetMinMaxVersion: max product/protocol (11.2/1.4)

2015-01-12 09:25:19.224: [ CSSD][4119]clssnmNeedConfReq: No configuration to change

2015-01-12 09:25:19.224: [ CSSD][4119]clssnmDoSyncUpdate: Terminating node 1, jzh1, misstime(30000) state(5)-->node2 jzh2与node1同步，misstime 30s（网络心跳阀值），要终止node1。

2015-01-12 09:25:19.224: [ CSSD][4119]clssnmDoSyncUpdate: Wait for 0 vote ack(s)-->等待投票。

2015-01-12 09:25:19.224: [ CSSD][4119]clssnmCheckDskInfo: Checking disk info...

2015-01-12 09:25:19.224: [ CSSD][4119]clssnmCheckSplit: Node 1, jzh1, is alive, DHB (1421025877, 706595081) more than disk timeout of 27000 after the last

NHB (1421025847, 706565177)-->node1 jzh1 disk heartbeat没有问题

2015-01-12 09:25:19.224: [ CSSD][4119]clssnmCheckDskInfo: My cohort: 2-->本地编号

2015-01-12 09:25:19.224: [ CSSD][4119]clssnmCheckDskInfo: Surviving cohort: 1-->node1 jzh1活着

2015-01-12 09:25:19.224: [ CSSD][4119](:CSSNM00008:)clssnmCheckDskInfo: Aborting local node to avoid splitbrain. Cohort of 1 nodes with leader 2, jzh2, is smaller than cohort of 1 nodes led by node 1, jzh1, based on map type 2à终止本地节点node 2 jzh2,node1 jzh1为leader。

2015-01-12 09:25:19.224: [ CSSD][4119]###################################

2015-01-12 09:25:19.224: [ CSSD][4119]clssscExit: CSSD aborting from thread clssnmRcfgMgrThread-->CSSD在调用clssnmRcfgMgrThread时终止

说明： node2 在与 node1 同步时出现 misstime 超时，将终止 local node 。

至此可以判断RAC出现brain split是由于节点心跳网络通信异常导致RAC 出现脑裂！

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/10271187/viewspace-1407451/，如需转载，请注明出处，否则将追究法律责任。

转载于:http://blog.itpub.net/10271187/viewspace-1407451/

你可能感兴趣的:(记一次RAC Brain Split脑裂分析过程)

AI浪潮下的数据保卫战：SSL证书为何成为企业刚需？ ssl证书
随着人工智能（AI）技术的迅猛发展，数据已成为企业最核心的资产之一。无论是训练AI模型、优化算法，还是提供个性化服务，数据的安全性和隐私保护都至关重要。然而，AI的广泛应用也带来了前所未有的安全挑战，尤其是在数据传输和存储过程中，如何防止数据泄露、篡改和窃取成为企业必须面对的问题。在这样的背景下，SSL证书作为网络安全的基础设施，正逐渐成为企业的“刚需”。1.AI时代的数据安全挑战数据量激增：AI
访问网站显示不安全怎么办？ ssl证书https
当您在访问网站时遇到浏览器提示“不安全”的警告，这通常意味着该网站的安全连接存在问题。这种警告可能出现在多种情况下，比如网站使用的是HTTP而非HTTPS协议、SSL证书过期或配置不当等。为什么会出现“不安全”提示？未启用HTTPS：如果一个网站只使用HTTP协议，那么它发送和接收的数据都是明文形式的，这就意味着任何人都可以在数据传输过程中截获并读取这些信息。相比之下，HTTPS通过SSL/TLS
如何在androidstudio开发环境中查看sqlite数据库（按新版本Android Studio Giraffe提供详细步骤和操作说明，附截图，代码）鹿溪IT工作室提供 LuXi_foryou Android studio的常见教程数据库 sqlite android studio
在AndroidStudio中查看SQLite数据库是开发过程中非常常见的需求。以下是详细步骤，适用于新版本的AndroidStudio（如AndroidStudioGiraffe或更高版本）。步骤1：确保使用Room或SQLiteOpenHelper在Android开发中，通常使用以下两种方式操作SQLite数据库：SQLiteOpenHelper：传统方式，手动管理数据库。Room：Googl
【2025软考高级架构师】重点笔记部分——3、系统规划、分析与设计 Richard Chijq 2025年软考系统架构师笔记系统架构
目录一.系统规划1.1项目的提出与选择1.2可行性研究与效益分析1.3方案的制订和改进1.4新旧系统分析和比较二.系统分析与设计2.1定义问题与归结模型2.2需求2.2.1需求工程2.2.2需求分析2.3系统设计(软件设计)2.4结构化分析与设计2.4.1分析步骤2.4.2分析工具2.4.3结构化设计2.4.4数据流图、流程图2.5面向对象分析与设计2.5.1基本概念2.5.2UML(统一建模语言
【人工智能】随机森林的智慧：集成学习的理论与实践蒙娜丽宁人工智能人工智能随机森林集成学习
随机森林（RandomForest）是一种强大的集成学习算法，通过构建多棵决策树并结合投票或平均预测提升模型性能。本文深入探讨了随机森林的理论基础，包括决策树的构建、Bagging方法和特征随机选择机制，并通过LaTeX公式推导其偏差-方差分解和误差分析。接着，我们详细描述了随机森林的算法流程，分析其在分类和回归任务中的适用性。文章还通过实验对比随机森林与单一决策树及其他算法（如SVM）的性能，探
SpringBoot统一功能处理——统一异常处理棕豆兔＆ spring boot spring java
目录一、异常简单使用二、@ControllerAdvice源码分析一、异常简单使用统一异常处理使用的是@ControllerAdvice+@ExceptionHandler来实现的，@ControllerAdvice表示控制器通知类，@ExceptionHandler是异常处理器，两个结合表示当出现异常的时候执行某个通知，也就是执行某个方法事件。importcom.example.demo.mod
MongoDB 集群模式简单了解黑风风网络运维 NoSQL mongodb 数据库
MongoDB集群模式简单了解在现代应用架构中，数据库的扩展性和高可用性至关重要，而MongoDB作为NoSQL数据库的佼佼者，提供了多种集群模式来应对不同场景的需求。这篇文章将深入探讨MongoDB的主要集群模式，并分析它们的适用场景和优缺点。1.MongoDB的三大集群模式MongoDB主要提供以下三种集群模式，每种模式都有其独特的应用场景和优势：副本集（ReplicaSet）——高可用性与数
RocketMQ的Consumer源码分析 foolishboy_w 后台技术 rocketmq java-rocketmq rocketmq java
RocketMQ的Consumer源码分析文章目录RocketMQ的Consumer源码分析Consumer的Rebalance流程Consumer的消息拉取流程Consumer的Offset管理这一节我们分析RocketMQ的Consumer的启动流程以及消息处理过程。下图是RocketMQ启动流程、Rebalance、以及消息拉取处理的较为完整的流程图。##Consumer的启动流程Consu
深度学习在SSVEP信号分类中的应用分析自由的晚风深度学习分类人工智能
目录前言1.SSVEP信号分类的处理流程2.模型输入和数据预处理3.模型结构设计3.1卷积神经网络（CNN）3.2长短期记忆网络（LSTM）4.训练方法与激活函数5.性能评估与挑战6.未来方向前言随着脑机接口（BCI）技术的发展，SSVEP（稳态视觉诱发电位）因其高信息传输速率和短训练时间而成为最受欢迎的BCI范式之一。近年来，深度学习方法在SSVEP信号分类中取得了显著的成果。本文通过对31个深
UML面向对象建模与设计——笔记（二）忧愁的awe uml 面向对象
UML面向对象建模与设计（第二版）笔记——第二部分：分析与设计开发过程1系统构思2分析3系统设计4类设计5实现6测试7培训8部署9开发生命周期系统构思1阐释概念2准备问题陈述系统分析1领域分析1创建领域类模型2分析领域状态模型3领域交互模型2应用分析1应用交互模型2应用类模型3应用状态模型系统设计类设计1填补空白区2实现用例3设计算法1选择算法2选择数据结构3定义内部类的操作4把操作分配给个类4向
振荡器简单介绍行然梦实毕业设计论文阅读制造能源笔记课程设计
前言提醒：文章内容为方便作者自己后日复习与查阅而进行的书写与发布，其中引用内容都会使用链接表明出处（如有侵权问题，请及时联系）。其中内容多为一次书写，缺少检查与订正，如有问题或其他拓展及意见建议，欢迎评论区讨论交流。文章目录前言1.简谐振子2.有阻尼的简谐振子3.LC电路（无阻尼）4.RLC电路（有阻尼）总结：振荡器是一种能够将能量在两种形式之间相互转换的设备或系统，从而产生周期性运动或信号。以下
【2025深夜随笔】简单认识一下Android Studio LuXi_foryou Android studio的常见教程 android studio android ide
【2025深夜随笔】AndroidStudio全生命周期开发指南：从安装到项目实战简单解析一、AndroidStudio核心认知1.1官方定位与生态价值AndroidStudio（简称AS）是谷歌官方推出的安卓开发IDE（集成开发环境），集代码编写、调试、性能分析、模拟器管理、APK打包于一体。其核心优势包括：官方支持：与AndroidSDK深度集成，优先适配新系统（如Android15）智能化工
UE从蓝图节点跳转到C++源码右弦GISer CesiumForUnreal UE GIS Cesium
文章目录1.实现目标2.实现过程3.参考资料1.实现目标在使用UE进行蓝图开发的过程中，有时候想查看蓝图节点的C++源代码，常见的方法有通过蓝图节点的名称去UE的源码里进行全文搜索，或者通过下载调试符号来实现点击蓝图节点查看C++源码的效果，本文使用下载调试符号来实现。2.实现过程（1）打开EpicGamesLauncher启动器，点击当前安装引擎版本的选项标签，如下图：（2）勾选输入调试用符号，
k-Shape：高效准确的聚类方法优化算法侠Swarm-Opti 信号处理故障诊断聚类机器学习人工智能 matlab 数据挖掘
引言时间数据在许多学科中的扩散和无处不在，已经对时间序列的分析和挖掘产生了极大的兴趣。聚类是最流行的数据挖掘方法之一，不仅因为它的探索性，而且作为其他技术的预处理步骤或子程序。常用的有-means聚类算法。本文介绍了一种新的时间序列聚类算法k-Shape。k-Shape依赖于一个可扩展的迭代优化过程，它创建同质和良好分离的集群。作为距离度量，k-Shape使用标准化的交叉相关。基于距离度量的性质，
spring核心：IOC和AOP详解 sc重新启程 spring java 后端
引言Spring是众多开源java项⽬中的⼀员，基于分层的javaEE应⽤⼀站式轻量级开源框架，目的是简化企业应用程序的开发，主要核⼼是IOC（控制反转/依赖注⼊）与AOP（⾯向切⾯）两⼤技术，实现项⽬在开发过程中的轻松解耦，提⾼项⽬的开发效率。在项⽬中引⼊Spring可以降低组件之间的耦合度，实现软件各层之间的解耦。SpringIOCIOC，InversionofControl，控制反转，指将对
数据分析面试全攻略：业务分析能力篇代码CC 数据分析（包括各种面试题）面试数据分析面试 python sql
前言：业务分析能力考察重点在数据分析岗位面试中，业务分析能力是区分初级与中高级候选人的核心要素。本篇将从指标设计、异常分析、用户增长三大模块，解析业务分析能力提升路径。一、指标设计：用数据定义业务价值1.1用户留存分析体系留存率计算模型定义公式：次日留存率=第2天活跃用户数/首日新增用户数×100%7日留存率=第8天活跃用户数/首日新增用户数×100%SQL计算模板：WITHfirst_login
基于文本特征的微博谣言检测机器懒得学习人工智能大数据图像处理计算机视觉
随着社交媒体的普及，微博等平台成为了信息传播的重要渠道。然而，虚假信息和谣言的传播也带来了严重的社会问题。因此，自动化的谣言检测技术变得尤为重要。本文将介绍如何基于文本特征，使用深度学习模型（如LSTM、CNN）和传统机器学习模型（如SVM）来实现微博谣言检测，并对这些模型的性能进行比较。完整项目地址：基于文本特征的微博谣言检测1.项目概述本项目旨在通过分析微博文本内容，自动检测其中的谣言。系统通
doris：分析 S3/HDFS 上的文件向阳1218 大数据 doris
通过TableValueFunction功能，Doris可以直接将对象存储或HDFS上的文件作为Table进行查询分析。并且支持自动的列类型推断。提示使用方式更多使用方式可参阅TableValueFunction文档：S3：支持S3兼容的对象存储上的文件分析。HDFS：支持HDFS上的文件分析。这里我们通过S3TableValueFunction举例说明如何进行文件分析。自动推断文件列类型>DES
华为与思科路由器静态路由配置 wespten 网络协议栈网络设备 5G 物联网网络工具开发华为
一、静态路由简介静态路由路由项（routingentry）由手动配置，而非动态决定。与动态路由不同，静态路由是固定的，不会改变，即使网络状况已经改变或是重新被组态。一般来说，静态路由是由网络管理员逐项加入路由表。优点：使用静态路由的另一个好处为网络安全保密性高。动态路由因为需要路由器之间频繁地交换各自的路由表，而对路由表的分析可以揭示网络的拓扑结构和网络地址等信息。因此，网络出于安全方面的考虑也可
R语言对高频交易订单流进行建模分析 4 oxuzhenyi 实验楼课程机器学习 R
一、实验介绍--订单流模型拟合1.1实验知识点指数核hawkes过程拟合正反馈强度分析订单量影响分析1.2实验环境R3.4.1Rstudio二、订单流模型拟合在上节中我们对订单流数据做了一些统计分析，对交易的一些特征有了一些粗浅的理解，在本节中我们要做的是利用实际数据来拟合hawkes过程，看一看真实数据的订单流动力学中有什么特征。首先我们仍是选出交易时间内的数据：library(tidyvers
R语言对高频交易订单流进行建模分析 3 oxuzhenyi 实验楼课程机器学习 R
一、实验介绍--订单流数据描述分析1.1实验知识点订单流数据表示订单间隔分析订单信息率平稳性研究订单流动性研究限价单相对价格分析1.2实验环境R3.4.1Rstudio二、订单流数据描述分析2.1订单流数据表示当我们在金融市场上做交易时，可以看到一个委托单簿，上面陈列着买价和卖价以及它们对应的量，举个例子，比特币市场的订单簿：可以看到红色代表的是卖价，或者说是ask,而绿色代表的是买价，或者说是b
Pika 技术浅析（二）：文本编码爱研究的小牛 AIGC—视频 AIGC—预处理 AIGC—自然语言处理人工智能算法 AIGC 深度学习数据预处理
在Pika的视频生成过程中，文本编码是至关重要的一步，它将用户输入的自然语言文本转换为机器可以理解的向量表示。这一步骤不仅影响生成视频的质量，还决定了视频与文本描述的匹配度。1.基本原理1.1文本编码的目的文本编码的目的是将自然语言文本转换为机器可以理解的向量表示。这些向量需要捕捉文本的语义信息和语法结构，以便在后续的视频生成过程中，模型能够根据这些向量生成与文本描述高度匹配的视频内容。1.2Tr
SQL Server 性能优化最佳实践 Morris只会敲命令性能优化
引言在数据驱动的业务场景中，SQLServer作为企业级关系型数据库的核心，其性能直接影响业务系统的吞吐量和响应速度。无论是应对高并发交易、复杂分析查询，还是处理海量数据写入，性能瓶颈往往隐藏在索引设计、查询逻辑、锁竞争或资源配置中。本文将深入剖析SQLServer性能优化的关键技术，从诊断工具使用到实战调优策略，提供一套完整的优化闭环方案。一、性能分析：定位瓶颈的科学方法1.1内置监控工具实战1
如何使用订单流分析工具（下）松鼠Quant 量化研究量化交易期货交易期货订单流
如何使用订单流分析工具（下）本文讲解如何使用订单流工具，POC，堆积带，失衡，订单分布，参数调整和设置。
基于机器学习的恶意软件检测系统的详细设计与实现源码空间站11 机器学习人工智能课程设计 python 网络安全信息安全恶意软件检测
以下是一个基于机器学习的恶意软件检测系统的详细设计与实现，适合作为课程作业或项目开发。我们将实现一个通过机器学习模型分析恶意软件特征来检测文件是否为恶意软件的系统。总体思路数据准备：选择现有的恶意软件数据集（如Kaggle的恶意软件数据集）或构造模拟数据集。数据集中包含文件的特征（如二进制特征、字符串特征、API调用特征等）和标签（"恶意"或"正常"）。特征提取：提取文件的静态特征（如文件大小、字
MATLAB控制函数测试要点剖析蚂蚁质量其他 matlab 深度学习
一、功能准确性检验基础功能核验针对常用控制函数，像用于传递函数建模的tf、构建状态空间模型的ss，以及开展阶跃响应分析的step等，必须确认其能精准执行基础操作。以tf函数为例，在输入分子与分母系数后，理应生成准确无误的传递函数模型；而运用step函数时，则应能够精准计算并绘制出系统的阶跃响应曲线，如实反映系统对阶跃输入的动态响应过程。复杂功能测试对于高级控制函数，例如线性二次调节器lqr、模型预
Python匿名函数：从入门到精通 - 全面掌握Python函数的高级特性老大白菜 python 开发语言
匿名函数（lambda函数）是Python中一个强大而简洁的特性，它允许我们创建小型的、一次性使用的函数，而无需使用def关键字定义正式的函数。本文将深入探讨lambda函数的使用方法和最佳实践。一、什么是匿名函数？匿名函数是一种可以在一行代码中定义的小型函数，它具有以下特点：使用lambda关键字创建可以接受任意数量的参数只能包含一个表达式自动返回表达式的值没有显式的return语句1.1基本语
UE4 C++与蓝图的继承问题时空观察者9号 ue4 c++开发语言
C++写了一个类MyChar，并派生了一个蓝图子类BP_MyCharacter。//FilloutyourcopyrightnoticeintheDescriptionpageofProjectSettings.#pragmaonce#include"CoreMinimal.h"#include"GameFramework/Character.h"#include"MyCharacter.gene
吞没形态：K线图中的经典反转信号解析 EagleTrader 金融
在近期分享中，我们主要讲述了几种基本面分析方式，而今天咱们切换到技术面分析方面，来说说K线。K线形态分析因其直观性和有效性而受到广泛欢迎。它不仅能展示价格的波动，还能揭示市场情绪的变化和潜在的趋势反转。在本文中，EagleTrader将重点介绍K线中的吞没形态，包括看涨吞没和看跌吞没，以及它们的实际应用方式。什么是吞没形态吞没形态是一种由两根K线组成的K线反转信号，它表明当前趋势可能即将发生转变。
基于深度学习的恶意软件检测系统：设计与实现机器懒得学习深度学习人工智能
引言随着信息技术的飞速发展，恶意软件（如病毒、木马、勒索软件等）对全球网络安全构成了严重威胁。传统的恶意软件检测方法（如特征码匹配、行为分析等）在面对新型恶意软件变种时往往力不从心。近年来，深度学习技术在模式识别和分类任务中取得了显著成效，为恶意软件检测领域带来了新的机遇。本文将详细介绍一个基于深度学习的恶意软件检测系统的开发过程，该系统利用长短期记忆网络（LSTM）对Windows可执行程序的A
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&