介质故障

介质故障是最重的故障类型,原因是它通常需要DBA 的干预。

与介质有关的问题的常见类型:

  包含某一数据库文件的磁盘驱动器出现磁头损坏。

  对实现正常数据库操作所需的文件进行读写操作时存在物理问题。

  文件被意外删除。

那怎么样来解决介质恢复呢?

通过备份

备份恢复策略定义:

DBA 要考虑的问题不管你选择什么样的备份策略 ,一定要获得相应管理层的认同是很重要的。

比如你这个数据没有备份,一定要告诉领导 。

数据库1T,备份需要多少T?

在选择备份策略时,应考虑以下一些问题:

  根据对系统可用性的期望,管理层是否权衡了所选备份策略的利弊?

  是否有专门的资源来确保成功实施备份和恢复策略?

  是否已明确了解进行备份和准备恢复的步骤的重要性?

  管理层要考虑成本投入和风险比.

从业务影响考虑:

管理层必须量化停机时间及数据损失的代价,

并将其与减少停机时间及尽量减少数据损失所需的成本进行比较。

MTTR:数据库的可用性是DBA 要考虑的一个主要问题。

出现故障后,DBA 应努力缩短平均恢复时间(MTTR)。

此策略可确保数据库的不可用时间尽可能地最短。

通过预测可能发生的故障的类型并采取有效的恢复策略,DBA 可以最终达到缩短MTTR 的目的。

MTBF:保护数据库以防止出现各种类型的故障也是DBA 的一个重要任务。

要做到这一点,DBA 必须延长平均故障间隔时间(MTBF)。

DBA 必须了解Oracle 数据库各文件结构的重要性,并对数据库进行相应配置,比如镜像控制文件和日志文件,这样才不会经常发生故障。

DBA 和相应的管理层都应定期对备份和恢复策略的有效性进行检查,这一点至关重要。

从操作需求考虑:

  7×24 小时操作

ORACLE提供了很多高可用性方案,比如RAC、ADG。

在网络层需要做冗余,比如双线路、双交换机、双网卡、双负载均衡器等

应用服务器做冗余

硬件物理级做冗余,如RAID1,RAID5, RAID01,RAID10等

备份恢复技术考虑:

  资源:硬件、软件、人力和时间

  操作系统文件的物理镜像

  数据库中各对象的逻辑镜像

  数据库配置

  事务处理量,这将影响需要备份的频率

技术要求:

  你有多少数据?

  你的计算机的能力及容量是否足以支持备份?

  数据是否易于重新创建?比如索引

  你是否可以将数据从纯数据文件重新加载到数据库?

  数据库配置是否能支持从不同类型故障中复原?

从灾难恢复考虑:

  自然灾害

你的数据可能非常重要,以至于你必须确保甚至在系统完全瘫痪的情况下也能够复原。

自然灾害和其它问题可能影响你的数据的可用性,因此在创建灾难恢复计划时应考虑这些问题。

在选择备份和恢复策略时,应考虑以下一些问题:

  在发生以下严重灾难时,你的业务会受到什么样的影响:

水灾、火灾、地震或飓风

存储硬件或软件故障

  备份是否存储在其它地方?如磁带,磁盘,CDROM,闪存等

  容灾考虑的是同楼、同区、同城、跨城、跨国

  容灾考虑网络带宽,或者其它灾备传输途径,比如人工快递

测试备份

DBA 可以通过制定计划定期测试备份的有效性,来确保他们的策略可以缩短MTTR 并延长MTBF。有效的恢复取决于有效的备份。

你可能感兴趣的:(介质故障)