继上一篇文章《千万不要死于无知》之后,身边的朋友的身边又有了新的情况。这次的损失无法计量,而这一切的一切又和无知有着不解之缘。

          一日朋友打电话过来,一台服务器的Raid卡坏掉了,硬盘数据无法读取……

          那是一台很老很老的服务器,因为机房电力环境非常之好所以一年重起、关机次数平均下来都不到2次,更不要说可用性之类的指标,不知道要到小数点后面多少位……

         非常偶然的一次重起,自检到Raid卡的时候卡住了,询问客服,被告知Raid卡损坏……

         于是朋友便把硬盘插到闲置的拥有同样接口的服务器上……无法读取

         拿到数据恢复服务商,插到他们的专业设备上……无法读取,被告知需要拆盘

         于是乎和他们签了协议,拆盘……无法恢复……

         ……

        写到这里,非常惋惜,也更是气愤……早干嘛呢?备份呢……追究责任已经为时已晚了,而写着篇文章不是为了责备谁,而是告诉后人不要犯同样的错误。

       作为用于重要数据存放的服务器或者存储,我们更要倍加爱护,信息化程度越高这种疏忽所酿成的祸会越大。不要去想你拥有怎样的医师,业务无论他的医术有多么高深,如果你总是想指望他们,那就死定了……因为他们自己也会丢失数据,也会犯错误,必须要以防为主。就好比我们要懂得保健,而不是懂得看医生。

        数据备份很简单,但是如何用有限的资源实现最大化的容灾呢?

        1、备份要全面而不繁冗

               这没有一个绝对的说法,而对应用的熟悉程度很大程度上决定了你有效备份内容的体积。比如说Linux下的Oracle9i备份,最开始是备份Oracle9i的整个安装目录;在了解Oracle9i的结构后发现只需备份控制文件、数据文件等变动内容即可;而在打开了归档模式之后,开始进行增量备份……

               备份的体积决定了备份的速度和对资源的占用,这点我们不能说做到最好,但要努力做的更好。

        2、备份要有特定的目的

                 这个是自己总结出的经验,就是关于什么样的备份放到什么样的介质上。

                 远程存储、磁带、刻录光盘、本地网络、本地主机,这些备份介质都有它的优缺点。从速度上是依次递增,而从容量上却是依次递减。如何平衡容量和时间呢?远程存储是为了防止自然灾害导致的数据损毁,而磁带、光盘(移动硬盘)等也可以通过邮寄的方式放置远程。本地网络可能是最常用的备份方式,因为其在空间、时间上的灵活性都很大。本地主机的备份仅仅是为了应付一般的业务错误,试想如果硬件、系统挂了,本地备份能起什么作用呢?在我假设的环境中,本地备份都是为了快速恢复或是作为其它备份的中转。因为本地备份的速度是其它方式无法比拟的。

         3、备份要有规范的管理

                这个是任何备份活动都不可忽略的部分。小到签字笔写下的几个字,大到一个复杂的备份管理系统,就好比去医院化×××液。如果样本上不做标记你觉得化验结果可信吗?

                在软件开发的代码、文档管理中这些东西更需要注意,本来通过调整能够解决的问题如果使用了错误的备份版本进行了恢复,结果会更糟糕……

         ……

 

        突然想到这里就突然写到这里,和朋友们共勉。如果人都能长生不老就不必考虑接班人,如果机器设备软件都不会出问题我们也不必去备份……