前言:
数据中心运行突发故障(如:天灾不可避免的灾难)是无法预测的,计算机里的数据就像扫雷游戏一样,十面埋伏充满雷区,随时都有可能Game Over,容灾备份就是数据安全的最后防线,但是你可以避免由数据中心发生故障而丢失数据引发的数据丢失的局面,下面,本文将介绍“容灾和备份的区别”以及一些尽可能减少发生运行故障失败机会,并加强企业的数据备份环境的简单要点。
什么是容灾?
上世纪70年是容灾的起源期,80到90年代是容灾的快速发展期,90年代到2000年是容灾的膨胀期,从2010年开始互联网时代对业务连续的要求更高,IT进入了云的时代,容灾成为了一种服务。
容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。
容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。
容灾的分类:
从其对系统的保护程度来分,可以将容灾系统分为:数据容灾和应用容灾,数据容灾就是指建立一个异地的数据系统,该系统是本地关键应用数据的一个实时复制。
应用容灾是在数据容灾的基础上,在异地建立一套完整的与本地生产系统相当的备份应用系统(可以是互为备份),在灾难情况下,远程系统迅速接管业务运行,数据容灾是抗御灾难的保障,而应用容灾则是容灾系统建设的目标。
容灾和备份有什么连系?
容灾备份实际上是两个概念,容灾是为了在遭遇灾害时能保证信息系统能正常运行,帮助企业实现业务连续性的目标,备份是为了应对灾难来临时造成的数据丢失问题。在容灾备份一体化产品出现之前,容灾系统与备份系统是独立的。容灾备份产品的最终目标是帮助企业应对人为误操作、软件错误、病毒入侵等"软"性灾害以及硬件故障、自然灾害等“硬”性灾害。
容灾和备份的区别
一般意义上,备份指的是数据备份或系统备份,容灾指的是不在同一机房的数据备份或应用系统备份。备份采用备份软件技术实现,而容灾通过复制或镜像软件实现,两者的根本区别在于:
(1)容灾主要针对火灾、地震等重大自然灾害,因此备份中心与主中心间必须保证一定的安全距离;数据备份在同一数据中心进行。
(2)容灾系统不仅保护数据,更重要的目的在于保证业务的连续性;而数据备份系统只保护数据的安全性。
(3)容灾保证数据的完整性;备份则只能恢复出备份时间点以前的数据。
(4)容灾是在线过程;备份是离线过程。
(5)容灾系统中,两地的数据是实时一致的;备份的数据则具有一定的时效性。
(6)故障情况下,容灾系统的切换时间是几秒钟至几分钟;而备份系统的恢复时间可能几小时到几十小时。
容灾的分类:
(1)数据级
数据级容灾是最基础的手段,指通过建立异地容灾中心,做数据的远程备份,在灾难发生之后要确保原有的数据不会丢失或者遭到破坏,但在数据级容灾这个级别,发生灾难时应用是会中断的。可以简单的把这种容灾方式理解成一个远程的数据备份中心,就是建立一个数据的备份系统或者一个容灾系统,比如数据库、文件等等。
优点:费用比较低,构建实施相对简单
缺点:数据级容灾的恢复时间比较长
(2)应用级
应用级容灾是在数据级容灾的基础之上,在备份站点同样构建一套相同的应用系统,通过同步或异步复制技术,这样可以保证关键应用在允许的时间范围内恢复运行,尽可能减少灾难带来的损失,让用户基本感受不到灾难的发生。应用级容灾就是建立一个应用的备份系统,比如一套OA系统正在运行,在另一个地方建立一套同样的OA系统。
优点:提供的服务是完整、可靠、安全的,确保业务的连续性
缺点:费用较高,需要更多软件的实现
(3)业务级
业务级容灾是全业务的灾备,除了必要的IT相关技术,还要求具备全部的基础设施。
优点:保障业务的连续性
缺点:费用很高,还需要场所费用的投入,实施难度大。
备份等级:
容灾备份是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。根据容灾系统对灾难的抵抗程度,可分为数据容灾和应用容灾。数据容灾是指建立一个异地的数据系统,该系统是对本地系统关键应用数据实时复制。当出现灾难时,可由异地系统迅速接替本地系统而保证业务的连续性。应用容灾比数据容灾层次更高,即在异地建立一套完整的、与本地数据系统相当的备份应用系统(可以同本地应用系统互为备份,也可与本地应用系统共同工作)。
在灾难出现后,远程应用系统迅速接管或承担本地应用系统的业务运行,设计一个容灾备份系统,需要考虑多方面的因素,如备份/恢复数据量大小、应用数据中心和备援数据中心之间的距离和数据传输方式、灾难发生时所要求的恢复速度、备援中心的管理及投入资金等,根据这些因素和不同的应用场合,通常可将容灾备份分为四个等级。
第0级:没有备援中心
这一级容灾备份,实际上没有灾难恢复能力,它只在本地进行数据备份,并且被备份的数据只在本地保存,没有送往异地。
第1级:本地磁带备份,异地保存
在本地将关键数据备份,然后送到异地保存。灾难发生后,按预定数据恢复程序恢复系统和数据。这种方案成本低、易于配置。但当数据量增大时,存在存储介质难管理的问题,并且当灾难发生时存在大量数据难以及时恢复的问题。为了解决此问题,灾难发生时,先恢复关键数据,后恢复非关键数据。
第2级:热备份站点备份
在异地建立一个热备份点,通过网络进行数据备份。也就是通过网络以同步或异步方式,把主站点的数据备份到备份站点,备份站点一般只备份数据,不承担业务。当出现灾难时,备份站点接替主站点的业务,从而维护业务运行的连续性。
第3级:活动备援中心
在相隔较远的地方分别建立两个数据中心,它们都处于工作状态,并进行相互数据备份。当某个数据中心发生灾难时,另一个数据中心接替其工作任务。这种级别的备份根据实际要求和投入资金的多少,又可分为两种:
(1)两个数据中心之间只限于关键数据的相互备份;
(2)两个数据中心之间互为镜像,即零数据丢失等。零数据丢失是目前要求最高的一种容灾备份方式,它要求不管什么灾难发生,系统都能保证数据的安全。所以,它需要配置复杂的管理软件和专用的硬件设备,需要投资相对而言是最大的,但恢复速度也是最快的。
改善备份性能的五大要点
要点1:监控程序
在备份过程中,监控本身并不会导致发生故障运行失败,但其确实可以使得当某一个故障失败发生时更难以被发现。随着IT世界的范畴变得越来越广阔,备份系统必须进行改变,以查看和管理多个备份服务器。现在,大多数系统并不是设计用于同时监控多台服务器的,而如果一个问题出现,整个拆解过程会变得相当繁琐和困难。
解决方案:
我们所需要的是一款具有自动化功能的监控系统,该系统将能够汇编数据,并以图形方式提供用户界面,提供对于整个环境的一个全面的视图。同时对于个别服务器和客户端也应该是可视化的。为了进一步简化操作,该系统还必须能够监控在某一特定的业务中使用多供应商的备份。
要点2:不要错过通知警报
虽然对于一般性的沟通问题而言,将电子邮件通知警报发送到适当的管理员通常是一个可靠的方式,但情况并不总是保持不变的。随着时间的推移,服务器,应用程序,备份设备和人员安置情况总是在变化的,因此,经常核实并确保警报能够在第一时间通知到恰当的工作人员来进行处理是非常有必要的。
解决方案:
实时警报是一款很好的解决方案。这种类型的警告可通过电子邮件、SNMP集成整合和SMS短信将警报发送给不同的人员,精确定位适当的人员来接收信息,并快速、高效地进行沟通。
要点3:注意命令行操作系统错误
虽然管理员可能更倾向于采用命令行界面来完成一项工作,但这很容易出错!原因是由于在使用该方法时,不同管理者之间的备份缺乏一致性。最佳的做法应该是通过及时更新来加强编纂,但这种情况并不经常发生,致使错误发生屡见不鲜。
解决方案:
一款用户界面允许GUI操作的备份功能必须添加到IT部门的备份系统。这样就减少了人为错误的机会,提高了当前操作的可重复性。
要点4:对于报告和规划重视不足
由于企业的备份专业人员能够将主要精力集中在系统所发送的警报报告方面,但务必要记住的是,这些信息只提供了管理备份环境中的难题的一部分。很多时候,备份管理人员会错过某些特定部门和程序所发来的许多其他重要的报告。
当备份服务器开始托管传输的警报和监视数据时,问题很快就会随之而来。一般情况下,主备份服务器上的数据只保存很短的时间,可能导致其不能够再被访问,从而使得理解和防止下一次故障失败的任务变得几乎不可能。
解决方案:
遵循我所推荐的最佳实践方案,谨慎的做法是从初级的和分布式备份服务器编译数据到单个数据库,这将有助于保持日常数据备份的平稳运行。通过这种方式,可以进行数据分析,并在您的部门根据具体需求采用各种报告。
要点5:配置错误
虽然IT部门非常精通备份和恢复系统,但有时也可能出错。配置错误便是一个例子;这种情况经常发生,因为数据和服务器环境被扩大。下面是一些常见的问题:
恢复日志的规模大小不准确:这样的恢复日志可能会导致信息丢失。这种特殊的领域,必须手动扩大并重新启动,以避免灾难的发生。
从磁盘到磁带不匹配:当使用小的磁盘池时,可能存在新的数据不被接受、推迟备份、并导致错过了备份窗口的机会。只有一个线程可以从一个磁盘池写入到磁带设备,并且如果磁带不能处理数据必须从磁盘被写入的速度,磁盘池将不能够备份数据。
同时备份的过载:备份系统的最大客户端数很容易被超过,更不要说错过了备份窗口。这个问题可能会在数据环境增长和添加备份客户端时发生。
解决方案:
不管错误情况时怎样的,许多IT专业人士使用的都是更大型的监控系统,其提供了更全面的看法。这种更全面的视图提供了对于发现错误更直接的方法,并有助于在一个不断变化的环境中确定造成的因素。备份软件和监控系统被一起使用,以便IT部门可以准确评估备份环境的需求。
相关下载
史上最全,数据中心机房标准及规范汇总(下载)
数据中心运维管理 | 资料汇总(2017.7.2版本)
专注于数据中心基础设施运维与运营管理,分享运行维护经验,分享数据中心行业发展趋势及新技术应用。
加微信群:suifengerqu-2013
QQ交流群: 108888484
投稿邮箱:[email protected]