1. 容灾方案的规划
不同企业的系统环境千差万别,从单机到大型数据中心,从小型单业务到复杂的多业务集成。平台复杂度、数据复杂度、业务复杂度、管理复杂度的区别使得我们很难用简单的思维去理解和规划容灾系统。近几年,我们在帮助客户建设存储系统的过程中感觉到,容灾项目的推进不是需求与技术的简单匹配,而要深入地分析用户的应用环境,找到最适合的解决方案。正所谓“没有最好的产品,只有最合适的方案”。
在建设容灾工程之前,首先要提出容灾系统的建设目标,作为衡量和选择容灾产品技术和解决方案的参数。例如:
Ø
数据及系统保护的范围
Ø
业务系统与容灾系统之间的距离
Ø
业务系统与容灾系统之间如何相互连接
Ø
数据是怎样在两个系统之间传送的
Ø
允许有多少数据被丢失,RPO指标
Ø
容灾系统可以开始支持服务的能力,RTO指标
在选择容灾技术时,需要考虑业务系统的类型,是单业务系统还是多业务系统?是数据库应用还是非结构化数据?是数据容灾还是业务系统容灾?经过具体的分析结果和业务要求,选择一种主要的技术作为容灾解决方案的基础,辅之其它的容灾技术以满足特定的要求。
1.1. 容灾地点规划
容灾地点是建立一个容灾系统首先应该考虑的问题,地点的选择往往会影响技术类型的选择以及容灾的效果。评估一个地点是否合适,主要应考虑以下因素:
Ø
距离;
Ø
通讯线路技术;
Ø
通讯成本;
Ø
地理风险;
Ø
当地机房条件;
Ø
当地人员技术条件;
Ø
管理成本;
Ø
交通情况等。
地点没有所谓的最佳标准,公司可以根据自身条件选择。但是有一些因素我们不应该忽略,譬如该地区是否经常发生自然灾害?治安是否稳定?有没有战争风险。另外一些常识性问题也很重要,例如8级地震的破坏范围可能超过 100公里 等等。
选择或建设灾难备份中心时,应根据风险分析的结果,避免灾难备份中心与主中心同时遭受同类风险。灾难备份中心包括同城和异地两种类型,以规避不同影响范围的灾难风险。
灾难备份中心应具有数据备份和灾难恢复所需的通信、电力等资源,以及方便灾难恢复人员和设备到达的交通条件。
灾难备份中心应根据统筹规划、资源共享、平战结合的原则,合理地布局。
1.2. 容灾网络规划
容灾是一套跨区域的异地工作系统,其可用性受到网络的影响非常大。采用的复制技术决定了带宽的配置,反之带宽成本也会影响技术方案的选择。通常情况主要从两个方面评估带宽的需求:数据同步时间和网络带宽。
同步时间的估算:同步时间是指生产系统的数据初始化复制到灾备系统的时间,在容灾系统最初运行和灾后恢复过程中,都会有数据同步复制的过程,大概的计算方法如下:
同步时间 = 数据量×8/(线路带宽×0.8网络效率比)/3600
数据量 = 实际数据量 *(1+30%冗余数据)
下表是计算后的结果,可见如果数据量在10GB以上,E1线路可以满足基本需求,如果数据量达到在100GB,这10Mb带宽是必不可少的。
网络带宽的要求一般根据每天传输的平均数据量以及业务高峰期的数据产生峰值等因素综合考虑,该指标与用户的业务处理量密切相关。一般情况我们可以通过查看文件、日志的产生量或通过网络流量统计来估算。
1.3. 系统资源的考虑
所有类型的容灾技术都或多或少的会对生产系统产生一定的影响,占用部分资源。为了避免容灾系统影响业务处理的能力,我们建议选型期间要进行详细的测试,主要评估以下因素:CPU、内存、I/O压力以及磁盘的空间使用。
根据我们的经验,容灾系统占用整体资源的5% 到10%,是比较理想的结果。
1.4. 方案选择要考虑企业的特点
容灾的建设不能局限于技术类型的划分,而要打破产品技术局限,根据不同应用的特点,综合地考虑RTO、RPO、TCO、RIO等指标和技术实现方式。我们将提供从单业务系统到企业数据中心的多套灾难解决方案共用户选择。用户不必过多地考虑不同技术的差异,仅需要理解技术方案与自身业务的匹配度。
例如,针对中小企业,基于主机容灾方案比较合适,充分考虑中小企业没有大型存储,环境简单的特点,支持从操作系统 -- 应用软件-- 数据的全面容灾保护,使得客户不需要关心数据结构和类型的差别。主机级方案一般兼具HA与远程复制容灾功能,传输数据量小,容灾距离无限制等特点。首先对生产系统做数据镜像,实时捕捉系统byte-level变化,当数据有任何变动时,将变动的部分更新至目标备用服务器,一旦生产数据库宕机,则灾备服务器立即接管相关的服务,系统实时数据复制与保护,最大程度降低服务中断时间,并可加强磁带备份机制,该方案同时支持SAN,NAS或 Microsoft Cluster Server(MSCS)等中小企业常用应用平台,系统环境不需要修改,最大限度的保护了现有设备的投资。
中型企业的业务一般围绕着一套核心平台展开,所有的关键数据都集中在一个核心数据库。与小企业相比,大多有专业的技术人员,维护管理能力更强。因此基于数据库的容灾复制方案比较适合中型企业。既不用过多的考虑不同软硬件系统兼容性的差异,又满足了用户自身对数据库管理的需求。
大型企业的容灾建设就需要另外的思路。企业级数据中心的复杂度在于业务平台繁多,各类系统的RTO、RPO指标可能差距很大。如果分散使用各类容灾技术,会极大的影响产品采购及后期使用维护的整体成本(CTO)。所以在数据中心环境下建立灾备系统,不能单独考虑某个技术或产品适合某个系统的问题。
另外大型企业数据中心进行容灾建设的前提是数据的集中。如果在数据分散存储的状态下做容灾规划是不可想象的。因此统一的SAN存储结构最有利于容灾系统的设计。
基于SAN存储虚拟化企业级容灾方案即基于以上环境,充分考虑大型数据中心对高可靠性、高性能、高扩展性的要求,利用带外虚拟化技术在现有的SAN存储架构上增加虚拟化管理器来实现高级的统一存储管理和远程容灾功能。能够提供先进的、集中简化的SAN管理及多层次的数据保护功能(快照和复制)。企业用户能够更加有效地管理和利用存储系统,建立可靠的容灾环境,确保业务的可靠性和连续性。同时,SAN虚拟化能够使用户的存储基础构架更具扩展性和灵活性,支持不同厂商的存储平台,将选择权真正交还给用户,现有设备的投资受到保护,从发展的观点看能够真正降低企业的总体拥有成本(TCO)。
小结
自从上世纪70年代在美国出现容灾中心开始,容灾始终是企业信息系统的重要保护手段。目前在美国超过70%的企业实施了容灾计划,平均每年完成超过40次灾难切换,为企业挽回了很多无法衡量的损失。
今天,容灾无疑是各类企业在IT建设中最关注的话题,对于容灾项目来说,不是建与不建的问题,而是如何建设的问题。UIT希望本文探讨的企业容灾建设中所需要注意的问题以及我们提及的灾备技术和数据应用领域的观点、能够为企业各级领导及技术人员提供有益的参考。