UIT给XX建立xxx容灾中心的建议
1 容灾模式建议
1.1 合作模式
对于客户来说,容灾系统的建设主要有
5
种模式:
1
、自己建设自己运营
|
多为大型企业采用,自主建设数据中心机房,自己的运营团队。
|
2
、租赁机房自己运营
|
典型为客户租用电信
IDC
,但自己维护机器。客户只需要付场地费用。
|
3
、自己建设外包运营
|
部分大企业建设自己的机房,但由于缺少技术团队或成本原因,将运营和技术支持外包给专业公司。外包公司按提供的人力资源数量收费。
|
4
、租赁机房外包运营
|
客户租用专业容灾服务商的机房、外包运营服务,但自己采购设备。服务商收取场地出租费和维护费。
|
5
、租赁机房、租赁设备、外包运营
|
专业容灾服务商将机房、设备和技术团队一起租给客户使用。客户将固定资产投入减小到最少。服务商前期投入大,收费高,但需要稳定的客户源。
|
XX
公司与
xxx
客户之间是长期的战略合作关系,可以充分发挥自身的优势,以第
3
、
4
、
5
种模式与客户合作,获得最大化的利益。容灾中心不仅仅是客户保护数据的场所,对未来的
IT
规划也非常重要。
目前,各省及主要中心城市的政府部门都在规划建设自己的数据中心,
XX
也在计划用自己的数据中心提供外包服务。未来的发展趋势是客户的核心生产系统会逐渐的搬迁到专业数据中心去,而不是扩建办公楼里边的准专业机房,这一点在从当前金融行业表现尤其明显。
所以,今天
XX
帮助客户运营容灾中心,未来就有机会管理全部的生产系统,从而获得长期稳定的收益。
1.2 集中容灾
目前,国内
xxx
行业主要的容灾案例基本上都是地市自己建设,设备投资比较大,容灾距离也很有限。当前的建设模式有明显的缺点:
1
、设备重复投资情况严重;
2
、系统资源的利用率较低;
3
、分散部署造成维护成本高昂;
4
、不利于未来的规划和发展。
我们建议客户采用集中容灾的方式,在省级单位统一协调下,集中建立一个容灾中心,将设备、网络、数据、人员集中在一起,优化资源的使用。无论对于用户还是服务商来说,资源投入和管理成本可以降到最低。
此外,专业化的集中容灾中心,由于有统一的流程、完善的管理和专业的人员配置,在发生灾难的情况下,恢复生产的效率也是最高的。
而从另一个角度说,由于集中了数据和计算资源,很多针对数据应用的业务得以开展,容灾系统成为日常应用的一环。客户通过资源的复用也将获得更多的投资回报。
2 灾备技术的选择
2.1 容灾还是备份
容灾是为了预防物理事故,比如地震、火灾、水灾、硬件损坏等等;备份一般是为了应对逻辑故障,如病毒、误操作。所以说容灾和备份不是二选一的问题,而都是客户需要的。
容灾强调的是实时性、远距离、业务连续性;备份强调的是历史时间点恢复、部分
/
完全恢复,如果数据量大,则只适合本地部署。
对于某些不依赖于
IT
就可以展开业务的客户来说,有备份系统即可,因为容灾所强调的业务连续性他们并不需要。但是对于
xxx
这样的数据量较大又不能长时间中断业务处理的环境,容灾和备份都是必要的。
2.2 成本效益
科学的说,客户对灾备系统的投入预算与具体的应用是有关系的,而不能靠人的主观臆断。在发生灾难的时候,都可以有一个评估损失的方法,比如中断业务
1
小时损失
10
万元。如果
1
小时是客户能够接受的最长时间,那么灾备系统投入的最合理成本就应该是
10
万元。
2.3 UIT容灾方案的技术优点
2.3.1 远程数据复制
远程数据复制是容灾系统的核心技术,关键指标是
“
数据的实时性
”
和
“
对带宽的占用
”
。鉴于
xxx
系统的核心是
Oracle
数据库,
UIT
推荐
XX
采用
RealSync
数据库复制软件作为远程数据复制的唯一方案。因为与其他类型的复制技术相比,
RealSync
数据库复制传输的数据量最小、带宽要求最低、距离无限制。在最小网络资源使用的前提下,数据的实时性可达到秒级。
2.3.2 数据的一致性
由于系统的核心是数据库,所以数据的一致性尤其重要,对于客户来说,灾难发生时丢失部分数据是可以通过其他途径弥补的,但是如果数据库的数据出现不一致,那么数据库将无法正常启动。
UIT
推荐的
Realsync
方案,利用
Oracle
自身的事务机制来保证容灾数据的一致性,与其他基于硬件的容灾技术相比,完全避免了容灾切换过程中数据库启动失败的风险,能够提供最可靠的容灾保证。
2.3.3 异构环境的支持
各地市的
xxx
系统环境复杂,既有
IBM
平台,也有
HP
平台。在容灾中心如果采用一一对应的方式部署,无疑会有很高的成本。
UIT
推荐的
Realsync
方案支持硬件的异构环境,在容灾中心,我们可以任意选择服务器的类型,
IBM
、
HP
、
Pcserver+Linux
、服务器逻辑分区或者虚拟机都是可以选择的对象。由于
RealSync
只处理数据库层的数据变化,因此生产和容灾两端的服务器、操作系统、存储都可以异构。
2.3.4 多对一容灾
Realsync
方案支持多对一容灾部署,即各地市的系统同时将数据复制到容灾中心的一台服务器上或一个集群系统上。该模式可以极大地节约容灾中心的部署成本。
2.3.5 容灾数据可用
传统的容灾技术中,灾备服务器上的数据库是不能打开的。不但无法检验容灾的有效性,而且对资源也是一种浪费。
UIT
推荐的
RealSync
方案属于逻辑热容灾技术,容灾数据库始终处于打开的状态,不但能够执行快速的数据检验和容灾切换,而且还可以对容灾系统加以利用,测试、报表、备份、历史查询都可以在容灾数据库上执行。此特点给客户带来很大的投资回报,客户也不再认为容灾是一个只花钱不见效的系统了。
2.4 备份系统的部署建议
备份和容灾一样都是不可或缺的,但是备份系统如果分散在各地部署,成本和管理的问题会非常突出。我们建议在容灾中心进行集中备份。当容灾系统将数据和设备都集中在一起后,备份的部署和管理缩小到中心内部进行,一切变得非常简单。而服务器数量的减少也使得备份的采购成本大大降低。
2.5 虚拟化存储管理的建议
服务器通过虚拟化可以优化系统资源的分配,存储也是一样。在本项目中,我们向
XX
推荐了
UIT SVM
存储虚拟化管理平台作为可选方案。
SVM
平台可以将不同品牌的存储设备整合在一起,为前端服务器提供虚拟管理。推荐此方案的原因是我们考虑到容灾中心的规模会不断地扩大,对存储性能、空间的需求会不断地增加。而为了满足需求采购高端的存储设备将带来沉重的成本负担。
SVM
可以帮助用户整合使用旧存储和中低端存储,同样满足对性能和容量的需求,还可以优化资源的分配,减少浪费。
3 容灾服务建议
3.1 服务等级的划分
为了适应不同等级客户的需求,我们可以将容灾服务划分等级,作为服务差异化和成本核算的标准,主要从
3
个维度体现:
第
1
,根据客户数据量、数据库的多少分配资源,相应地收费标准也会产生差别。此种方法适合同行业的客户,如
xxx
,虽然因人口差异造成数据量和业务量的差异,但是客户对容灾效果的期望值是一致的。
第
2
,按照用户期望的容灾效果分配资源并制定收费标准。适合不同行业的用户。例如大企业和小企业对数据实时性和业务连续性的要求差别就很大。
第
3
,按照用户占有的资源制定收费标准。
(注意不能用容灾和备份的区别来划分等级,因为二者对用户来说都是必须的。)
级别
|
分级标准参考
(数据量)
|
评估因素
|
高
|
>3TB
|
|
中
|
1~3TB
|
低
|
< 1TB
|
表
1
:根据数据量划分等级
级别
|
分级标准参考
(业务连续性)
|
评估因素
|
高
|
1
小时以内
|
|
中
|
1~12
小时
|
低
|
12~48
小时
|
表
2
:根据容灾效果划分等级
级别
|
分级标准参考
(资源占用)
|
评估因素
|
高
|
|
网络带宽、主机数、机柜数、机房面积、是否选择备份服务等
|
中
|
|
低
|
|
表
3
:根据资源占用划分等级
3.2 容灾中心服务内容
为客户提供容灾服务,主要包括几个方面:
1
、提供场地和运维人员;
2
、提供技术实施和系统集成;
3
、提供容灾管理咨询服务。
而容灾中心的运营主要包括:软硬件系统的运行维护、资产管理、流程的维护和管理、应急切换服务支持等。
以上内容
UIT
希望与
XX
一起整合资源、优势互补,共同为客户提供相关服务。