Enmotech

守得云开见月明:一次ASM存储高可用故障解决过程分析

关注我们获得更多内容

作者 | 姜劲松，云和恩墨专家支持部Oracle技术专家，Oracle OCP，MySQL OCP，RHCE等认证专家。长期服务移动运营商行业客户，精通 oracle 性能优化，故障诊断，特殊恢复领域。23年IT从业经验、资深数据库及系统软硬件集成专家。

百万级用户规模营销账务系统研发及实施运维经验，主持过11省千万级电力营销业务系统运维主管工作；设计实施过10多个阿里云平台新能源SAAS系统。历任开发工程师、项目经理、技术经理、项目总监、运维主管、云平台架构师等职位。

前言

Oracle ASM 全称为Automated Storage Management，即自动存储管理，它是自 Oracle10g 这个版本 Oracle 推出的新功能。这是 Oracle 提供的一个卷管理器，用于替代操作操作系统所提供的 LVM，它不仅支持单实例配置，也支持RAC这样的多实例配置。

给 Oracle 数据库管理员带来极大的方便，ASM 可以自动管理磁盘组，并提供数据冗余和优化。 ASM提供了丰富的管理和容灾手段，通过适当的配置，可以实现高效的数据库层面的存储容灾功能。

本案例通过某客户项目现场1次ASM存储容灾无法实现预期目标的问题分析解决过程，和大家共同探讨对于非预期问题的解决之道。

01问题简述

背景说明：

1、Oracle12.2RAC+ASM Normal Redendancy 模式，数据库存储采用双存储冗余架构，规避单存储故障导致服务中断及数据丢失；

2、 ASM DiskGroup 设计2个 Failgroup(FG)，1个FG磁盘全部存储在1#存储；1个FG全部磁盘存储在2#存储中；

3、期望任意存储故障或断电，数据库实例不受影响，数据不丢失，故障存储上线后数据自动同步。

在实际高可用测试中，拔掉1个存储，发现如下现象：

1.CRS集群不受影响，ocr/votedisk自动Failover;

2.DB Controlfile/Redolog发生I/O错误，导致LWGR/CKPT等核心进程长时间阻塞后，Oracle主动重启DB实例(1个或2个实例)后，数据库恢复正常；

3.数据库数据正常，故障存储Online后自动同步正常。

02测试过程

1) 第一类测试

1、存储完成拔线：16:56:05

2、实例16:57:37-16:57:39 挂掉

ASM日志：

2018-08-01T16:57:41.712885+08:00

NOTE: ASM client node11:node1:node1-rac disconnected unexpectedly

DB:

2018-08-01T16:57:45.214182+08:00

Instance terminated by USER, pid = 10158

2018-08-01T16:57:36.704927+08:00

Errors in file /oracle/diag/rdbms/node1/node11/trace/node11_ckpt_10158.trc:

ORA-00206: error in writing (block 3, # blocks 1) of control file

ORA-00202: control file: '+DG_DATA_FAB/NODE1/CONTROLFILE/current.265.981318275'

ORA-15081: failed to submit an I/O operation to a disk

ORA-15081: failed to submit an I/O operation to a disk

ORA-15064: communication failure with ASM instance

2018-08-01T16:57:36.705340+08:00

Errors in file /oracle/diag/rdbms/node1/node11/trace/node11_ckpt_10158.trc:

ORA-00221: error on write to control file

ORA-00206: error in writing (block 3, # blocks 1) of control file

ORA-00202: control file: '+DG_DATA_FAB/NODE1/CONTROLFILE/current.265.981318275'

ORA-15081: failed to submit an I/O operation to a disk

ORA-15081: failed to submit an I/O operation to a disk

ORA-15064: communication failure with ASM instance

Oracle CKPT 进程因为控制文件 IO 错误阻塞，导致主动重启 instance，每次测试都在超时70s之后开始Terminate instance。

怀疑是ASM实例offline disk时间过慢，希望调高CKPT阻塞时间阀值解决问题，但是没有找到对应的参数。

既然是controlfile存在此问题，是不是因为DATA磁盘比较多，导致offline检测时间长呢？

尝试将controlfile转移到磁盘较少的REDO DG，仍然在controfile这里报错：

systemstatedump文件：

----- Beginning of Customized Incident Dump(s) -----

Process CKPT (ospid: 4693) is waiting for event 'control file sequential read'.

Process O009 (ospid: 5080) is the blocker of the wait chain.

===[ Wait Chain ]===

CKPT (ospid: 4693) waits for event 'control file sequential read'.

LGWR (ospid: 4691) waits for event 'KSV master wait'.

O009 (ospid: 5080) waits for event 'ASM file metadata operation'.

node1_lgwr_4691.trc

----- END DDE Actions Dump (total 0 csec) -----

ORA-15080: synchronous I/O operation failed to write block 1031 of disk 4 in disk group DG_REDO_MOD

ORA-27063: number of bytes read/written is incorrect

HPUX-ia64 Error: 11: Resource temporarily unavailable

Additional information: 4294967295

Additional information: 1024

NOTE: process _lgwr_node1 (4691) initiating offline of disk 4.4042263303 (DG_REDO_MOD_0004) with mask 0x7e in group 3 (DG_REDO_MO

D) with client assisting

2) 第二类测试

尝试对 controlfile 进行 multiplex:

1、每个存储分配1个10GB LUN给服务器；

2、基于每个LUN创建1个DG，controlfile multiplex到这2个DG中。

重新开始模拟1个存储故障测试，发现仍然会发生控制文件无法读写，重启实例！

在Oracle文档发现只能采用ASM FG来实现高可用，因为任何控制文件都需要在线，否则将直接导致实例中止！

https://docs.oracle.com/cd/B28359_01/server.111/b28310/control002.htm#ADMIN11284

Multiplex Control Files on Different Disks

Every Oracle Database should have at least two control files, each stored on a different physical disk. If a control file is damaged due to a disk failure, the associated instance must be shut down. Once the disk drive is repaired, the damaged control file can be restored using the intact copy of the control file from the other disk and the instance can be restarted. In this case, no media recovery is required.

The behavior of multiplexed control files is this:

The database writes to all filenames listed for the initialization parameter CONTROL_FILES in the database initialization parameter file.

The database reads only the first file listed in the CONTROL_FILES parameter during database operation.

If any of the control files become unavailable during database operation, the instance becomes inoperable and should be aborted.

Note:

Oracle strongly recommends that your database has a minimum of two control files and that they are located on separate physical disks.

所以这种 multiplex 方法对 controlfile 的高可用无效！

3) 第三类测试

将controlfile存储在一个RPT存储中，避免因为controlfile同步导致的阻塞。

发现有时测试能够成功，但是有时会在REDO LOG读写时报错导致DB重启！

4) 第四类测试

创建2个独立的DG,指向2个不同存储，REDO GROUP的2个member multiplex到2个DG中。

测试failover成功，ASM实例会将故障DG dismount,数据库完全不受影响！

根据以上的测试过程，发现如下现象：

1、 ASM Failgroup对数据库文件处理完全没有问题，可以实现Failover

2、 ControlFile/RedoLogfile在Normal DG做offline时，异常长时间阻塞并主动重启DB实例，重启后运行正常，数据完整性不受影响！

反复多次测试，问题均随机出现，因此高度怀疑为Oracle BUG，在MOS上发现1个类似『链接：Bug 23179662 - ASM B-slave Process Blocking Fatal background Process like LGWR producing ORA-29771 (文档 ID 23179662.8)』,但是MOS说明 20180417PSU 已经 fixed 此 BUG, Wordaround 行为就是重启实例。

在连续1周无法解决问题的情况，采用了如下临时的解决方案：

（1）controlfile迁移到第三个存储;

（2）Redo通过Oracle multiplex功能将2个member存储到不同存储。

但是这样一来，控制文件又造成了单点故障风险，难道这个问题没有办法解决吗？

既然理论和实战存在差异，那肯定是有原因的，我开始了新的探索及分析，不放过任何一个可疑点：

03再次梳理

重新将controlfile及redologs迁移到Normal Diskgroup中，测试中发现数据库实例存在正常、1节点重启、2节点重启等多种情况，故障现象不规律！

我反复测试，细致梳理了关键事件的时间点信息，示例如下：

ALERT LOG ：

--------------
Filename=alert_p4moddb1.log

2018-08-16T14:56:00.272280+08:00

WARNING: Read Failed. group:2 disk:4 AU:1053 offset:2605056 size:16384

path:/dev/rdisk/MES1_p4_moddb_redo02

incarnation:0xf7e12348 synchronous result:'I/O error'

subsys:System krq:0x9ffffffffd1c0608 bufp:0x9ffffffffd007000 osderr1:0x69c0 osderr2:0x0

IO elapsed time: 0 usec Time waited on I/O: 0 usec

WARNING: failed to read mirror side 1 of virtual extent 7 logical extent 0 of file 260 in group [2.3551108175] from disk MES1_REDO02 allocation unit 1053 reason error; if possible, will try another mirror side

NOTE: successfully read mirror side 2 of virtual extent 7 logical extent 1 of file 260 in group [2.3551108175] from disk RPT_REDO01 allocation unit 1052 -->检测到I/O error,但是能成功读取mirror数据

……

2018-08-16T14:56:13.489201+08:00. -->大量IO操作错误

Errors in file /oracle/diag/rdbms/p4moddb/p4moddb1/trace/p4moddb1_lgwr_13680.trc:

ORA-15080: synchronous I/O operation failed to write block 1383 of disk 4 in disk group DG_REDO_MOD

ORA-27063: number of bytes read/written is incorrect

HPUX-ia64 Error: 11: Resource temporarily unavailable

Additional information: 4294967295

Additional information: 1024

WARNING: failed to write mirror side 1 of virtual extent 0 logical extent 0 of file 257 in group 2 on disk 4 allocation unit 277

2018-08-16T14:56:31.050369+08:00

……

ERROR: cannot read disk header of disk MES1_REDO02 (4:4158726984)

2018-08-16T14:56:34.418045+08:00

NOTE: ospid 13682 initiating cluster wide offline of disk 5 in group 2

2018-08-16T14:56:34.418576+08:00

NOTE: process _rms0_p4moddb1 (13666) initiating offline of disk 4.4158726984 (MES1_REDO02) with mask 0x7e in group 2 (DG_REDO_MOD) with client assisting

2018-08-16T14:56:34.446660+08:00

……

NOTE: disk 4 (MES1_REDO02) in group 2 (DG_REDO_MOD) is offline for reads

2018-08-16T14:56:49.513068+08:00

CKPT (ospid: 13682) waits for event 'control file parallel write' for 78 secs.

Errors in file /oracle/diag/rdbms/p4moddb/p4moddb1/trace/p4moddb1_lmhb_13668.trc (incident=3529892):

ORA-29771: process MARK (OSID 13751) blocks CKPT (OSID 13682) for more than 70 seconds

Incident details in: /oracle/diag/rdbms/p4moddb/p4moddb1/incident/incdir_3529892/p4moddb1_lmhb_13668_i3529892.trc

2018-08-16T14:56:51.744467+08:00

MARK (ospid: 13751) is blocking CKPT (ospid: 13682) in a wait

LMHB (ospid: 13668) kills MARK (ospid: 13751). -->LMHB检测到核心后台进程阻塞70s以上，并开始尝试kill

Please check LMHB trace file for more detail.

2018-08-16T14:56:54.755778+08:00

ERROR: failed to mark AU as stale [4294967279]

WARNING: failed to mark stale some of AUs corresponding to the mirrors of virtual extent 0 of file 260 in group 2

WARNING: group 2 file 260 vxn 0 block 3 write I/O failed

2018-08-16T14:56:54.756850+08:00

Errors in file /oracle/diag/rdbms/p4moddb/p4moddb1/trace/p4moddb1_ckpt_13682.trc:

ORA-00206: error in writing (block 3, # blocks 1) of control file

ORA-00202: control file: '+DG_REDO_MOD/p4moddb.ctl01'

ORA-15081: failed to submit an I/O operation to a disk

ORA-15081: failed to submit an I/O operation to a disk

2018-08-16T14:56:54.757193+08:00

Errors in file /oracle/diag/rdbms/p4moddb/p4moddb1/trace/p4moddb1_ckpt_13682.trc:

ORA-00221: error on write to control file

ORA-00206: error in writing (block 3, # blocks 1) of control file

ORA-00202: control file: '+DG_REDO_MOD/p4moddb.ctl01'

ORA-15081: failed to submit an I/O operation to a disk

ORA-15081: failed to submit an I/O operation to a disk

Errors in file /oracle/diag/rdbms/p4moddb/p4moddb1/trace/p4moddb1_ckpt_13682.trc (incident=3529948):

ORA-221 [] [] [] [] [] [] [] [] [] [] [] []

Incident details in: /oracle/diag/rdbms/p4moddb/p4moddb1/incident/incdir_3529948/p4moddb1_ckpt_13682_i3529948.trc

2018-08-16T14:56:56.478631+08:00

USER (ospid: 13682): terminating the instance due to error 221. --à因为控制文件IO错误导致实例被重启！

2018-08-16T14:56:56.502831+08:00

System state dump requested by (instance=1, osid=3891780 (CKPT)), summary=[abnormal instance termination].

System State dumped to trace file /oracle/diag/rdbms/p4moddb/p4moddb1/trace/p4moddb1_diag_13633_20180816145656.trc

alert_+ASM1.log ：

2018-08-16T14:56:04.957199+08:00 -->差不多和DB同时检测到IO错误

WARNING: Write Failed. group:1 disk:1 AU:1 offset:4190208 size:4096

path:/dev/rdisk/MES1_p4_moddb_ocrvote

incarnation:0xf0996d00 asynchronous result:'I/O error'

subsys:System krq:0x9ffffffffd285710 bufp:0x9ffffffffd299000 osderr1:0x69b7 osderr2:0x0

IO elapsed time: 0 usec Time waited on I/O: 0 usec

……

2018-08-16T14:56:34.400892+08:00

WARNING: Disk 4 (MES1_REDO02) in group 2 mode 0x7f is now being offlined

……

ORA-27072: File I/O error

HPUX-ia64 Error: 11: Resource temporarily unavailable

Additional information: 4

Additional information: 8188

Additional information: 4294967295

GMON checking disk modes for group 2 at 2460 for pid 49, osid 13802

2018-08-16T14:56:35.056049+08:00

NOTE: checking PST for grp 2 done.

2018-08-16T14:56:35.056382+08:00

Errors in file /grid/crs_base/diag/asm/+asm/+ASM1/trace/+ASM1_gmon_18741.trc:

ORA-27072: File I/O error

HPUX-ia64 Error: 11: Resource temporarily unavailable

Additional information: 4

Additional information: 8188

Additional information: 4294967295

ORA-27072: File I/O error

HPUX-ia64 Error: 11: Resource temporarily unavailable

Additional information: 4

Additional information: 8188

Additional information: 4294967295

ORA-27072: File I/O error

HPUX-ia64 Error: 11: Resource temporarily unavailable

Additional information: 4

Additional information: 8188

Additional information: 4294967295

2018-08-16T14:56:35.056592+08:00

GMON checking disk modes for group 2 at 2461 for pid 19, osid 18728

NOTE: initiating PST update: grp 2 (DG_REDO_MOD), dsk = 4/0xf0996e2a, mask = 0x6a, op = clear mandatory

GMON checking disk modes for group 1 at 2462 for pid 57, osid 24043

2018-08-16T14:56:35.057277+08:00

NOTE: checking PST for grp 2 done.

NOTE: initiating PST update: grp 2 (DG_REDO_MOD), dsk = 4/0xf0996e2a, mask = 0x6a, op = clear mandatory

2018-08-16T14:56:35.059431+08:00

NOTE: checking PST for grp 1 done.

2018-08-16T14:56:35.059697+08:00

NOTE: sending set offline flag message (3413962691) to 1 disk(s) in group 1

2018-08-16T14:56:35.059796+08:00

GMON checking disk modes for group 4 at 2463 for pid 59, osid 24045

2018-08-16T14:56:36.205496+08:00

NOTE: Attempting voting file refresh on diskgroup DG_CRS_MOD

WARNING: Read Failed. group:1 disk:1 AU:0 offset:0 size:4096

path:/dev/rdisk/MES1_p4_moddb_ocrvote

incarnation:0xf0996d00 asynchronous result:'I/O error'

subsys:System krq:0x9ffffffffd4a4068 bufp:0x9ffffffffcf91000 osderr1:0x534b4950 osderr2:0x0

IO elapsed time: 0 usec Time waited on I/O: 0 usec

NOTE: Refresh completed on diskgroup DG_CRS_MOD. Found 3 voting file(s).

NOTE: Voting file relocation is required in diskgroup DG_CRS_MOD

NOTE: Attempting voting file relocation on diskgroup DG_CRS_MOD

WARNING: Read Failed. group:1 disk:1 AU:0 offset:0 size:4096

path:/dev/rdisk/MES1_p4_moddb_ocrvote

incarnation:0xf0996d00 asynchronous result:'I/O error'

subsys:System krq:0x9ffffffffd4a4068 bufp:0x9ffffffffcf84000 osderr1:0x534b4950 osderr2:0x0

IO elapsed time: 0 usec Time waited on I/O: 0 usec

NOTE: Successful voting file relocation on diskgroup DG_CRS_MOD

2018-08-16T14:56:52.061661+08:00
System state dump requested by (instance=1, osid=3906536), summary=[SYSTEMSTATE_GLOBAL: global system state dump request (kjdgdss_g)].
System State dumped to trace file /grid/crs_base/diag/asm/+asm/+ASM1/trace/+ASM1_diag_18708_20180816145652.trc
2018-08-16T14:56:55.250804+08:00
WARNING: Read Failed. group:2 disk:4 AU:0 offset:0 size:4096
2018-08-16T14:56:55.250889+08:00
WARNING: Read Failed. group:2 disk:4 AU:7 offset:245760 size:4096
2018-08-16T14:56:55.251279+08:00
path:/dev/rdisk/MES1_p4_moddb_redo02
2018-08-16T14:56:55.251590+08:00
incarnation:0xf0996e2a synchronous result:'I/O error'
subsys:System krq:0x9ffffffffd4b2f80 bufp:0x9ffffffffd407000 osderr1:0x69b7 osderr2:0x0
2018-08-16T14:56:55.251753+08:00
path:/dev/rdisk/MES1_p4_moddb_redo02
IO elapsed time: 0 usec Time waited on I/O: 0 usec
2018-08-16T14:56:55.252112+08:00
incarnation:0xf0996e2a synchronous result:'I/O error'
subsys:System krq:0x9ffffffffd225ec0 bufp:0x9ffffffffcc0f000 osderr1:0x69c0 osderr2:0x0
IO elapsed time: 0 usec Time waited on I/O: 0 usec
WARNING: cache failed reading from group=2(DG_REDO_MOD) fn=8 blk=60 count=1 from disk=4 (MES1_REDO02) mirror=0 kfkist=0x20 status=0x07 osderr=0x69c0 file=kfc.c line=12986
WARNING: cache succeeded reading from group=2(DG_REDO_MOD) fn=8 blk=60 count=1 from disk=3 (MES2_REDO01) mirror=1 kfkist=0x20 status=0x01 osderr=0x0 file=kfc.c line=13031
2018-08-16T14:56:55.274598+08:00
SUCCESS: extent 0 of file 8 group 2 - all online mirror sides found readable, no repair required ---> 所有online mirror side是完好的

通过记录每次的存储断开时间点、日志报错时间点及ASM offline disks时间点，反复比较分析后，发现每次重启实例时的规律如下：

(1)关掉存储后，数据库在60s左右后开始报IO错误；

(2)在OS查看全部多路径正常关闭，但是diskinfo查看磁盘会卡死，经测试确认是Oracle asm instance锁住的；

(3)数据库在第一次IO报错后，每次需要100s左右完成disk offline及DG PST refresh，然后OS层面diskinfo能正常发现asm disk不可访问。如果关闭asm instance，OS层面30s报多路径失效，60s diskinfo报asm disk设备报不可访问！

(3)db实例单开的情况下，会在关掉多路径130s左右完成disk offline正常运行；db实例2个节点全开，70s左右1个数据库日志LMHB报CKPT/LGWR阻塞超时的错误并且时间持续增加，期间有controlfile parallel write阻塞及IO 错误，有时会强制重启1个或2个实例，有时候却能正常！

(4)如果手工offline disks，数据库能快速完成操作，不受任何影响！

存在疑问：

1、OS在断开存储后60s就会返回多路径失效及磁盘无法访问，但是ASM实例后台为什么一直锁盘，具体是在做哪些工作？

2、目前看问题都是在检测到IO错误100s后发生，能否控制ASM在收到OS 磁盘无法访问后，快速将asm disk offline，而不是反复报IO错误？

3、如果手工offline存储对应的磁盘，ASM会迅速反应并更新DG状态，但是故障时日志却在不断发出offline请求，为什么无法快速完成呢？

结合上述分析得到的规律及测试数据，我做了多方尝试并深入思考：

（1）结合DB报出的70s超时警告，试图找到数据库的隐含参数调高后台进程HUNG住的检测阀值，多次尝试发现这个是硬限制，没有合适的参数控制；

（2）结合上述现象，问题都出现在数据库检测到IO失败到offline disks的这段时间中，IO报错的时间点和多路径失效是吻合的，预期行为应该是数据库发现多路径失败，快速offline失败的磁盘并且使用Mirror side！但是实际的情况是数据库反复对故障设备进行IO尝试，最后导致实例异常重启。这个要么是数据库判断逻辑失误，要么是存储故障时的返回信息有误？

（3）结合手工offline disks非常迅速，没有延迟时间，因此重点怀疑存储端的响应异常问题？

04初露曙光

由于怀疑是存储端问题，我询问了HP工程师是否在存储多路径方面有相关的参数？HP工程师回复有多路径超时设置默认120s，并且无法调整。

无奈我自行搜索HP多路径说明文档，终于发现2个可疑的相关参数：

1、esd_secs

attribute determines the timeout of I/O operations to block devices. By default esdisk sets esd_secs to 30 seconds for all devices bound to it.

2、path_fail_secs:

Timeout in seconds before declaring a lunpath offline when the device no longer responds to I/O requests sent through this I/O path. The default value is 120 seconds.

简单来说，esd_secs是磁盘块设备的IO超时时间，path_fail_secs是LUN的IO超时时间，超过上述时间后多路径软件会把对应的设备或者路径置为offline。直接基于主机多路径设备的测试结果也证明了这种行为。

由于ASM DG使用的LUN裸设备，所以我修改了path_fail_secs参数，从120s减少为30s，修改后的确发现数据库检查到IO错误的的确从60s左右缩短到了30s左右。但是发现在IO错误后，ASM instance并没有直接offline disks，而是在不断的Retry并报出IO错误，直到大约130s才能成功offline故障磁盘，故障现象仍然不规律出现，问题仍然没有彻底解决！

我陷于苦思冥想中……

05柳暗花明

反复的测试和分析都将问题的疑点指向了多路径，但是翻遍官方手册没有新的收获。那么是否还有其他的控制机制造成了这种非预期行为呢？

无奈之下直接去主机man scsimgr翻阅对应参数，又发现1个可疑的参数：

3、transient_secs

Seconds to wait after a LUN has gone OFFLINE before failing I/Os,default 120s

transient_secs 说明配置的在 LUN OFFLINE 后、failing I/O前的一段静默期，这个值默认是120s，如果把这个时间加上，ASM instance每次的offline操作时间就可以解释了，如果这个静默期多路径是不对IO请求响应的，将会直接导致ASM instance无法判断IO是否成功，导致了核心数据库文件(controlfile/redolog)的IO提交错误及核心后台进程的阻塞超时。

通过减低主机服务器path_fail_secs、transient_secs：

scsimgr save_attr -N /escsi/esdisk -a path_fail_secs=30 -a transient_secs=10

反复测试ASM实例在检测到IO错误了，会迅速offline所以故障磁盘，快速恢复了IO正常，证明了上述分析结论！

问题到此迎刃而解！

06总结

问题虽然解决了，但是有些疑问需要反思和解答：

1、 OS在断开存储后30s就会返回多路径失效及磁盘无法访问，ASM后台为什么一直锁盘，具体是在做哪些工作？

多路径进入静默等待期，IO锁定无反应，导致ASM实例反复Retry直到静默超时(120s)

2、问题都是在检测到IO错误100s后发生，能否控制ASM实例在收到OS 磁盘无法访问后，快速将asm disk offline，而不是反复报IO错误？

数据库层面无法控制，因为多路径没有返回失败信息

3、为什么故障现象不稳定？

这个推测很可能是故障时的IO行为不同导致：

1) 如果故障时没有核心的controlfile/redofile的写入，或者IO写入没有发生断裂，那么在多路径静默期超时后，系统是能够恢复正常的；

2) 否则由于静默期IO锁定，Oracle无法判断IO一致性，从而超时导致实例重启！

3) 至于为什么重启后就正常就比较好解释了，因为实例重启需要的时间是大于120s的，重启后静默期已经过去了，disks成功offline了，自然就没有问题了。

4) 修改默认多路径参数是否有其他不利影响？

多路径的这些参数的默认值原因是用于容忍短时间存储IO抖动，避免系统异常的。但是在我们的项目场景中，由于Oracle数据库的IO完整性要求，导致了故障的产生。对于双存储系统来说，一旦存储IO故障时，快速Failover到另外1个存储才是最好的选择！

本问题能够得以解决的主要原因：

1、 坚定的决心：前期测试一度将注意力转移到Oracle BUG，在MOS没有收获后，通过变通方法解决，但是没有完全解决控制文件高可用的问题。基于为客户负责的原则，迫使我背水一战，开始细致分析规律，这才有了明确的问题定位方向；

2、 多方资源整合及信息沟通：在连续几天无法解决问题时，我一方面主动寻求了公司专家、Oracle SR的帮助，虽然没有最终解决本问题，但是排除了一些问题分析方向可能并借鉴了一些思路；一方面和客户负责人主动沟通，发现这个问题并不是个例，之前他们类似系统在AIX/HPUX/LINUX及Veritas文件系统的11g/12c版本RAC均未能解决此问题，这让我进一步意识到Oralce BUG的可能性较小，基础平台支撑的问题更可能是关键！

3、 “精诚所至金石为开”：技术探索的路上不能遇到困难绕道走！在没有HP工程师支持，Oracle SR也没有有效回复的情况下，通过细致深入的分析、不厌其烦的反复测试数十次，促成了问题的最终解决；

4、在问题发生过程中，充分利用网络资源并分析整合，HP多路径使用文档让我开始有了解决问题的思路和信心，后续进而通过man帮助找到了解决问题的关键！

5、通过案例梳理了RAC、ASM的整体工作流程和原理，这些基础知识的掌握才能在复杂的故障现象和日志中找到规律并快速寻找到解决方案。

原创：姜劲松。

投稿：有投稿意向技术人请在公众号对话框留言。

转载：意向文章下方留言。

更多精彩请关注 “数据和云” 公众号。

招聘专栏

Oracle 售前工程师（广州、深圳、上海、武汉、北京、石家庄）

Oracle 高级工程师（上海、深圳、北京、成都、昆明、贵州、西宁）

MySQL 技术经理（上海、南京、成都）

MySQL 工程师（上海、杭州）

超高待遇：丰厚的年终奖，五险一金，高额学习基金，团建旅游，法定节假日，福利假期等。

推荐他人成功入职有好礼（iPhone X）相送。

投递简历至邮箱：[email protected]

资源下载

关注公众号：数据和云（OraNews）回复关键字获取

2018DTCC , 数据库大会PPT

2017DTC，2017 DTC 大会 PPT

DBALIFE ，“DBA 的一天”海报

DBA04 ，DBA 手记4 电子书

122ARCH ，Oracle 12.2体系结构图

2017OOW ，Oracle OpenWorld 资料

PRELECTION ，大讲堂讲师课程资料

近期文章

仅仅使用AWR做报告? 性能优化还未入门

实战课堂：一则CPU 100%的故障分析

杨廷琨:如何编写高效SQL(含PPT)

一份高达555页的技术PPT会是什么样子？

大象起舞：用PostgreSQL解海盗分金问题

ProxySQL！像C罗一样的强大

高手过招:用SQL解决环环相扣刑侦推理问题

你可能感兴趣的:(守得云开见月明:一次ASM存储高可用故障解决过程分析)

MySQL(118)如何使用SSL进行加密连接？
使用SSL进行加密连接可以有效地保护数据在传输过程中的安全性，防止数据被窃取或篡改。下面我们将详细介绍如何在Java应用中使用SSL与MySQL数据库建立加密连接。一.准备工作在开始之前，请确保你已经安装了MySQL，并且有Java开发环境（如JDK和Maven）。二.生成SSL证书生成自签名证书：你可以使用OpenSSL工具来生成自签名证书。以下是生成CA证书、服务器证书和客户端证书的步骤。#生
JIEJIE.NET：.NET代码混淆终极实战指南墨夶 C#学习资料 .net windows
第一章：JIEJIE.NET核心架构解析1.1IL代码分析引擎//IL指令分析器核心逻辑publicclassILAnalyzer{publicvoidAnalyzeMethod(MethodBodymethodBody){//提取控制流图varcontrolFlowGraph=BuildControlFlowGraph(methodBody);//识别敏感结构varsensitiveStruct
Redis集群部署指南：高可用与分布式实践东窗西篱梦 redis 分布式数据库
目录1.原理与理论2.背景与目的3.详细部署步骤（手动操作）步骤1：安装Redis5.0.4步骤2：配置Redis服务步骤3：修改关键配置步骤4：启动所有节点步骤5：构建集群步骤6：验证集群状态4.常见问题与解决方案节点无法加入集群集群槽位未完全分配主从切换失败客户端重定向错误5.总结与心得1.原理与理论Redis集群通过分片（Sharding）实现数据分布式存储，核心机制包括：槽位分配（Slot
如何在YashanDB中实现灵活的数据建模？数据库
随着信息技术的不断发展，数据量的快速增长使得数据建模成为数据库设计中的一个核心问题。尤其是在面对复杂的业务需求时，合理的数据模型能够有效支撑数据的存储、查询和管理。在这样的背景下，如何在YashanDB中实现灵活的数据建模，成为开发者和数据库管理员亟需解决的技术挑战。核心技术点分析支持多种存储结构YashanDB提供了多种存储结构的支持，包括行存（HEAP）、B树存储（BTREE）以及列存储（MC
如何制定YashanDB数据库的维护与管理计划数据库
数据库在现代应用程序中扮演着至关重要的角色。然而，随着数据量的不断增加和复杂性的加剧，数据库的性能瓶颈、数据一致性问题、存储的高可用性等正成为技术管理者面临的共同挑战。为了确保数据库的高效运营，制定一份全面的数据库维护与管理计划是必要的。本文旨在帮助技术团队理清YashanDB的维护与管理步骤，为提升数据库的可用性和性能提供指导，目标读者包括DBA、系统管理员和IT管理人员。了解YashanDB架
缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级的理解
一：缓存雪崩我们可以简单的理解为：由于原有缓存失效，新缓存未到期间(例如：我们设置缓存时采用了相同的过期时间，在同一时刻出现大面积的缓存过期)，所有原本应该访问缓存的请求都去查询数据库了，而对数据库CPU和内存造成巨大压力，严重的会造成数据库宕机。从而形成一系列连锁反应，造成整个系统崩溃。解决办法：大多数系统设计者考虑用加锁（最多的解决方案）或者队列的方式保证来保证不会有大量的线程对数据库一次性进
量化开发（系列第3篇）： C++在高性能量化交易中的核心应用与技术栈深度解析 Natsume1710 c++开发语言性能优化 python
本文为《量化开发》系列第3篇参考GitHub项目：Awesome-QuantDev-Learn前言在量化交易领域，Python以其开发效率高、生态系统丰富等优势，成为策略研究、数据分析及中低频交易的首选语言。在本系列前两篇文章中，我们详细探讨了Python在量化入门与策略回测中的实践。然而，当进入对延迟要求极为严苛的高频交易（High-FrequencyTrading,HFT）领域时，Python
MySQL实现任意级子目录的主要方案以及区别
常见的实现方案及区别1.邻接表（AdjacencyList）方案描述：每条记录存储一个节点的父节点ID。表结构大致：idINTPRIMARYKEY,nameVARCHAR(...),parent_idINT--指向父节点的ID，根节点为NULL或0优点：结构简单，直观，容易维护。插入、删除单条节点简单。缺点：查询整个树或任意节点的所有子孙节点比较复杂，需递归多次查询（MySQL8.0之前不支持递归
什么是TCP的三次握手秋恬意 tcp/ip 网络网络协议
TCP（传输控制协议）的三次握手是一个用于在两个网络通信的计算机之间建立连接的过程。这个过程确保了双方都有能力接收和发送数据，并且初始化双方的序列号。以下是三次握手的详细步骤：第一次握手（SYN）：客户端发送一个带有SYN（同步序列编号）标志的TCP段到服务器，这个SYN报文段包含一个初始序列号（ISN）。客户端进入SYN-SENT状态，等待服务器的确认。第二次握手（SYN-ACK）：服务器收到客
Python量化策略与回测框架实战：从“纸上谈兵”到“真金白银”的第一步（系列第2篇） Natsume1710 python 开发语言 github
作者：GitHub项目地址Awesome-QuantDev-Learn本文为量化开发学习路线系列第2篇，欢迎收藏与关注。引言：为什么选择Python作为量化入门的起点？在上一篇文章中，我们详细讲解了量化开发的基本框架与开发者思维的转变路径。那么，具体要如何开始第一步实践呢？答案是：从Python入门。Python以其快速原型开发能力、丰富的数据分析工具包，以及良好的社区生态，已经成为全球范围内量化
android ppsspp 存档位置,小鸡模拟器游戏存档在哪个文件夹泠川 android ppsspp 存档位置
小鸡模拟器软件中玩家可以通过存档将游戏数据进行保存，许多玩家不知道游戏中的存档文件夹位置在哪里，接下来小编就给大家分享一下游戏存档位置。小鸡模拟器游戏存档在哪个文件夹1、安卓手机安卓手机中小鸡模拟器的游戏目录存放的位置在/emulated/0/Games/游戏平台文件夹/，根据游戏类型分别将相应的游戏安装到相应的文件夹里面，街机类游戏的存储位置在FBA/MAME/MAMEPlus。2、ios手机苹
Unreal Engine开发者的助手：nFringeSetup1.16+config插件介绍
本文还有配套的精品资源，点击获取简介：UnrealEngine是游戏开发中广受欢迎的引擎，其强大的图形渲染和开发工具得到开发者的青睐。nFringeSetup1.16+config插件专为UnrealEngine与VisualStudio2008的集成而设计，简化了UDK和Unreal项目的构建与管理。该插件提供了无缝的开发环境，优化了代码编辑、调试和构建过程。它还通过Config_.rar文件提
构建安全隔离的数据共享通道：NFS、CSI 与动态卷调度实践观熵 Docker 安全 docker 容器存储
构建安全隔离的数据共享通道：NFS、CSI与动态卷调度实践关键词：容器存储、安全隔离、NFS、CSI插件、动态卷调度、跨节点挂载、PVC策略、Kubernetes卷权限摘要：在容器化应用中，跨Pod、跨节点的数据共享是典型需求场景，NFS与CSI（ContainerStorageInterface）成为主流实现路径。但共享存储往往伴随权限泄露、数据冲突、状态污染等风险。本文从NFS与CSI的原理出
鬼泣：蓄力动作总结 qq_42863961 鬼泣虚幻
能帮到你的话，就给个赞吧文章目录蓄力攻击蓄力动作——按下触发攻击动作——长按后触发计时方式硬件缺点：必须要触发一次start优点：系统计时计时缺点：每帧计时，计算大优点：方便长按和松开多次触发解决方案trigger：按输入键判断是否松开completed：升龙斩蓄力动作——由按下时触发攻击动作——长按后触发下劈斩下劈斩的攻击动作有两种触发方式由蓄力动作的动画通知触发由硬件触发空中攻击仅需在做动作前
如果内部使用的开发者账号被封了，之前安装的应用还能用吗？咕噜签名分发冰淇淋 ios
如果内部使用的开发者账号被封了，之前安装的应用是否还能继续使用，这是一个涉及开发者账号管理、应用分发以及苹果开发者协议等多个方面的问题。以下是对这一问题的详细分析：一、开发者账号被封禁的影响当苹果开发者账号被封禁时，该账号下的所有应用都会受到直接影响。具体来说，由于账号被封禁，其对应的签名验证会失效，这意味着账号名下的应用也将随之失效。这一失效状态不仅限于新应用的分发和更新，同样适用于已经安装在用
ipa文件怎么去除包体内的插件在线签名工具步骤？咕噜签名分发冰淇淋 ios
ipa文件去除包体内的插件并通过在线签名工具签名的过程，可以归纳为以下几个步骤。请注意，在进行以下操作前，确保你拥有合法的苹果开发者账号和必要的证书，以及备份好原始的ipa文件，以防操作失误导致数据丢失。一、准备工具和材料1.ipa文件：这是你需要处理的应用安装包。2.解压工具：电脑上需要安装合适的解压工具，如Xcode的命令行工具，或者第三方解压缩工具如WinRAR、7-Zip等。这些工具将帮助
如果内部使用的开发者账号被封了，之前安装的应用还能用吗？咕噜签名分发冰淇淋 ios
如果内部使用的开发者账号被封了，之前安装的应用是否还能正常使用，这是一个涉及多个方面的问题。以下是对此问题的详细分析：一、开发者账号被封的影响当内部使用的开发者账号被封禁时，首先会触发一系列连锁反应。苹果开发者团队通常会通过预留的邮箱向账号持有人发送封禁通知，但由于各种原因，开发者可能会错过这封邮件。封禁后，开发者将无法再登录开发者管理平台，也无法访问Apple开发者平台的相关资源，包括技术支持、
xbox one controller DSLogic 逻辑分析仪截包 aerror xbox stm32 嵌入式硬件
为什么不用bushound？为什么不用wireshare+usbpcap?那是因为xboxonecontroller和xbox360controllerggs一样，是很特殊的。它一样也是使用了很独立的desc和configuration，甚至没有HIDdesc,和xbox360的controller一样也没有report…一插上xboxonecontroller会产生三个设备，使用bushound
Xbox One 控制器转换为 macOS HID 设备的工作原理分析 aerror xbox macos
XboxOne控制器转换为macOSHID设备的工作原理分析源代码在https://github.com/guilhermearaujo/xboxonecontrollerenabler.git这个工程的核心功能是将XboxOne控制器（macOS原生不支持的设备）转换为macOS可识别的HID设备。这里通过分析代码，详细解释其工作原理、设备描述和报告描述符的实现。整体架构该项目由三个主要部分组成
基于JAVA的酒店管理系统的设计与实现代论文网课招代理前端 javascript 开发语言网络数据库
目录绪论3第一章课题研究途径与意义51.1本课题研究途径51.2本课题研究意义6第二章酒店管理系统分析72.1背景介绍72.2现实需求分析81)酒店首页介绍模块92)顾客注册登录模块93)信息查询模块104)预订管理模块105)管理员登录模块106)超级管理员登录模块107)房间信息模块102.3系统环境需求101)系统采用Windows操作系统下MyEclipse开发平台开发；102)程序设计语
iOS 出海 App 安全加固指南：无源码环境下的 IPA 加固与防破解方法
随着越来越多国内开发团队将iOSApp推向海外市场，如何在交付和分发环节保护应用安全成为出海过程中的重要议题。尤其是App进入多个海外应用商店或通过第三方渠道发行时，容易被当地黑产或竞争对手进行逆向分析，从而暴露内部API、核心业务流程等敏感信息。然而，很多出海App项目采用外包或快速孵化模式，交付阶段常常只拿到ipa成品文件而非完整源码。此时，如何在不改动源码的情况下对成品ipa完成安全加固，成
Charles中文版抓包工具：提升网络请求调试与API性能的高效工具
在当今的软件开发过程中，调试网络请求和优化API性能是保证应用顺畅运行和提高用户体验的关键。对于开发者来说，能够高效捕捉和分析HTTP/HTTPS请求的工具是必不可少的。Charles抓包工具作为一款广受欢迎的网络调试工具，提供了强大的功能来帮助开发者分析网络流量、优化API性能并提高开发效率。本文将深入探讨如何利用Charles中文版抓包工具加速网络请求调试、提升API性能，并通过有效的功能实现
查看mysql表_mysql怎么查看表碃凡瑶查看mysql表
mysql中查看表的方法：1、查看当前数据库中的表SHOWTABLES;2、查看表结构showcolumnsfrom表名;show命令可以提供关于数据库、表、列，或关于服务器的状态信息。常用show命令：#显示二进制文件以及文件大小(需要开启二进制日志记录功能)SHOW{BINARY|MASTER}LOGS#显示二进制文件的执行过程SHOWBINLOGEVENTS[IN'log_name'][FR
JVM垃圾回收机制深度解析真实的菜 jvm jvm
️JVM垃圾回收机制深度解析文章目录️JVM垃圾回收机制深度解析垃圾判定算法引用计数法可达性分析算法垃圾回收算法️标记-清除算法复制算法标记-整理算法️分代收集算法️常见垃圾收集器Serial收集器⚡ParNew收集器Parallel收集器CMS收集器G1收集器⚡垃圾回收调优常用JVM调优参数️调优工具使用：JConsole、VisualVMJConsoleVisualVM实战案例分析案例一：内存
JVM系列五：字节码与执行引擎深度解析
JVM系列五：字节码与执行引擎深度解析文章目录JVM系列五：字节码与执行引擎深度解析引言⚡五、字节码与执行引擎字节码文件结构字节码文件组成部分解析️Class文件结构详解实例分析字节码指令集介绍指令分类常用指令详解字节码示例分析⚙️执行引擎工作原理解释执行与即时编译（JIT）解释执行⚡即时编译（JIT）热点代码探测探测方法计数器详解示例代码️分层编译技术编译层级️分层编译配置性能对比️实战案例案例
面向对象与面向过程程序设计语言：核心概念、对比分析与应用指南咸鱼_要_翻身 C++C Python 开发语言
目录一、面向过程程序设计语言(ProceduralProgramming)1、基本概念2、主要特点3、代表语言4、典型示例(C语言)5、优势6、局限性二、面向对象程序设计语言(Object-OrientedProgramming)1、基本概念2、四大核心特性3、代表语言4、典型示例(Java)5、优势6、局限性三、主要区别对比四、实际应用选择建议五、现代语言趋势一、面向过程程序设计语言(Proce
Elasticsearch 启动失败？从日志分析到最终解决（磁盘空间不足案例） Leaton Lee elasticsearch 大数据搜索引擎
问题背景最近在本地运行一个SpringBoot项目时，突然遇到Elasticsearch(ES)连接超时的问题：org.springframework.beans.factory.UnsatisfiedDependencyException:Errorcreatingbeanwithname'awardController':Unsatisfieddependencyexpressedthroug
Elasticsearch：基本概念、索引结构与优缺点分析 Leaton Lee elasticsearch 大数据搜索引擎
一、Elasticsearch基本概念Elasticsearch是一个基于Lucene构建的开源、分布式、RESTful搜索引擎，专为云计算环境设计，能够实现近乎实时的数据搜索和分析功能。核心概念解析文档(Document)Elasticsearch中的基本数据单元，使用JSON格式表示每个文档有唯一ID和类型示例：一条产品信息、一篇博客文章或一个客户记录索引(Index)文档的集合，类似于关系数
详解Binlog 和 Redo Log的区别和底层逻辑
引言：为什么你的数据库会“分身术”？想象这样一个场景：你的Java应用突然崩溃，重启后发现数据丢失了一半。这时，你会想起数据库的“时光机”——Binlog，或者它的“安全网”——RedoLog？Binlog（BinaryLog）Binlog是MySQL数据库中的一种日志文件，用于记录所有对数据库执行的数据修改操作（如INSERT、UPDATE、DELETE等）。它以二进制的形式存储，主要用于数据复
李工ROBOT架构之硬件驱动或数据存储的详细代码
我将提供基于.NET8.0-windows7.0的半导体可靠性测试机上位机系统的硬件驱动和数据存储模块的详细代码实现。代码将与之前的UI框架（WPF、Prism、MVVM、MaterialDesignThemes、LiveCharts2）无缝集成，涵盖硬件驱动的抽象接口、不同协议（串口、TCP/UDP、Modbus）支持，以及数据存储的CSV、SQLite和MySQL实现。以下内容包含详细的代码示
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情