服务器数据恢复故障

北京某公司的一台服务器,上层数据类型为Oracle数据库,由于服务器意外断电,导致数据库报错,报错内容为“system01.dbf需要更多的恢复来保持一致性”。由于客户的数据库并没有备份,仅有一些断断续续的归档日志,现在只能通过数据恢复手段来修复Oracle数据库。

数据恢复常规流程

  1. 检测数据库故障情况;
  2. 尝试挂起并修复数据库
  3. 解析数据库文件
  4. 导出并验证恢复的数据库文件

    检测服务器及数据库情况

    首先利用dbv命令检测数据文件是否是完整的。见下图所示:
    服务器断电Oracle数据库修复数据过程_第1张图片
    通过上面的截图我们可以看到,我们检测的文件数据块中有40页的数据是检测失败的状态。另外有29页的索引数据也是失败状态。除此以外其他文件均为正常状态。

    挂起并修复数据库

    北亚数据恢复工程师在数据恢复专用服务器上搭建了一组Windows server 2008 x86环境,并安装了和客户原服务器上相同的数据库环境,尝试将数据库挂起来,查看数据库的报错情况,请见下图所示;
    服务器断电Oracle数据库修复数据过程_第2张图片

根据数据库的报错情况,北亚数据恢复工程师采取了借助在线日志恢复数据的方法,使用recover database命令。
Oracle数据库断电导致数据丢失数据恢复案例
服务器断电Oracle数据库修复数据过程_第3张图片

经过一系列的修复发现,由于归档日志不连续,恢复数据库所需时间段的归档日志缺失,只能使用cancel参数进行不完全数据恢复。
服务器断电Oracle数据库修复数据过程_第4张图片
数据恢复工程师再次执行恢复命令,打开数据库,查询实例状态有无报错。经过查询,仍有部分数据报错,报错内容为“ora_00600”
Oracle数据库断电导致数据丢失数据恢复案例
服务器断电Oracle数据库修复数据过程_第5张图片

通过上图截图内容可见,这类数据库内部错误是无法通过命令进行修复的,北亚数据恢复中心工程师借助expdp/exp工具尝试对数据库进行导出,但这两个工具导出数据库时依然有报错,数据库已经不可能进行修复。

解析数据库文件获取数据

使用北亚自主研发的一款dbf解析工具,获取到客户数据库内的数据。如下图所示:
服务器断电Oracle数据库修复数据过程_第6张图片
北亚数据恢复中心工程师获取到数据库数据后在数据恢复专用服务器内搭建数据库环境,创建数据库、用户、分配表空间等。将解析出来的数据库数据迁移到新数据库中。使用toad for oracle工具验证数据。见下图所示;
服务器断电Oracle数据库修复数据过程_第7张图片

导出数据库数据并验证

数据恢复工程师再次使用exp工具将数据库导出,导出命令:
exp system/abc  file=C:\test\dump\zxfg.dmp log=C:\test\dump\zxfg.log owner=zxfg
本次导出正常,没有任何报错。经客户验证,Oracle数据库完整,本次数据恢复圆满成功。
服务器断电Oracle数据库修复数据过程_第8张图片