恩墨科技为某企业SAP数据库提供紧急援助服务

近日凌晨,被朋友的一个电话吵醒,是一个紧急的故障处理,客户的业务遍及全国,是24x7的业务系统。
由于硬件的故障导致了数据库无法启动,全国的几个重要城市已经排起了长龙。

揉揉惺忪的睡眼,赶往了客户现场,由于业务极其重要,客户已经准备容灾系统及全备份恢复。

这是一个 SAP的ERP系统,经过检查是由于SAP的备份工具在执行热备份时出现了硬件故障,导致数据库不一致需要恢复,又由于其他厂商进行了不适当的恢复尝试,使得数据库必须进行不完全恢复。

在告警日志文件中,注意到这样的提示:
Sat Sep  3 01:19:58 2009
ARC0: Cannot archive online log based on backup controlfile
Sat Sep  3 01:19:58 2009
ARC1: Cannot archive online log based on backup controlfile
Sat Sep  3 01:20:58 2009
ARC0: Cannot archive online log based on backup controlfile

这是在启动尝试中,使用了备份的控制文件进行恢复,当前的日志无法归档.

最后极其幸运的是,客户的redo日志做了镜像,保存有完好的日志,通过这些日志得以将不完全恢复推进到日志的终点,没有数据损失:
Sat Sep  3 01:22:30 2009
Media Recovery Log /oracle/ora92/log011.dbf
Incomplete recovery applied all redo ever generated.
Recovery completed through change 789009345
Media Recovery Complete

最近已经遇到了多次SAP备份失败导致的故障,有的甚至要求从数月之前的归档开始恢复,导致客户的业务遭受影响和损失。
这和SAP打包的备份工具有关,这个工具采用热备方式进行,而且没有失败检测和报警机制,很多客户在失败后也无法得知,当发现时也已经为时过晚。

所以,通过适当的服务和第三方支持, 了解自己的数据库,使数据库不再是一个黑匣子,是非常非常重要的

你可能感兴趣的:(职场,SAP,休闲,恩墨,应急容灾)