两地三中心概念

结合近年国内出现的大范围自然灾害,以同城双中心加异地灾备中心的“两地三中心”的灾备模式也随之出现,这一方案兼具高可用性和灾难备份的能力。

同城双中心是指在同城或邻近城市建立两个可独立承担关键系统运行的数据中心,双中心具备基本等同的业务处理能力并通过高速链路实时同步数据,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。与异地灾备模式相比较,同城双中心具有投资成本低、建设速度快、运维管理相对简单、可靠性更高等优点。

异地灾备中心是指在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。

 

针对两地三中心灾备建设的需求,华为赛门铁克公司利用Symantec软件的优势结合自身的存储开发能力,设计了典型的建设方案,方案原理和组网如图所示。

如图,同城双中心的应用切换,采用Symantec Veritas的VCS(Veritas Cluster Server)集群软件来实现,生产中心主机和灾备中心主机上都需要安装VCS。采用VCS监测本地双机或集群状态,并通过组件GCO(Global Cluster Option)在本地和远程的集群之间进行状态监测。

在网络层,同城双中心之间采用光纤连接,保证双中心之间较大的带宽,以响应实时的业务数据需求,同城异地之间采用专网或IP广域网即可实现,以节约成本。同城双中心的光纤采用波分复用(WDM)技术进行建设,针对两地只有1条或2条光纤连接的场景,采用WDM方式,能够虚拟出多条FC或GE联络,满足两地之间对业务和数据多重链路的需求。WDM技术能充分利用光纤的巨大带宽资源,大幅度提高系统传输容量,降低传输成本,因此在长途和骨干网的超大容量传输中得到了广泛的应用。将WDM技术引入城域网、接入网,整个网络就会变成无缝连接的整体,为所有不同的业务提供支持和连接,因此城域网中WDM具有很大优越性。

在数据存储层,部署虚拟存储Oceanspace VIS6000或Oceanspace S5000/S6800E磁盘阵列,通过存储的同步远程复制功能将数据同步复制到灾备站点。确保生产中心和灾备中心的数据完全一致。使用存储的异步复制功能,将数据通过广域网复制到远端的灾备站点,并且保证数据的完整性和可用性。远端站点的作用主要是用来防止地理和自然灾难,当同城的双中心全部故障后,可以确保在异地有一份完整的数据拷贝,用于后续业务的恢复。

下面介绍方案具体的数据备份及业务流程:

  • 数据备份

同城双中心的数据采用同步复制,在同城灾备中心建立一个在线更新的数据副本。当有数据下发到生产中心阵列时,阵列间的同步复制都会同时将数据复制一份到同城灾备中心。

同城灾备中心与异地灾备中心之间采用异步复制方式,定期将数据进行复制备份,异步复制支持增量复制方式,可以节省数据备份的带宽占用,缩短数据的备份时间。

  • 灾难检测

主机上的VCS-Global Cluster通过对资源组状态的监控来判断资源的可用性,包括数据库资源组、网络资源组等。资源组的状态分online/offline/fault三种,正常情况下生产中心在工作的时候资源组的状态都是online,而灾备中心的资源组是offline状态。每个资源组在online和offline的时候均可以指定运行程序或脚本,程序或脚本执行完成后资源组即完成online或offline的过程。当检测到生产中心有资源组出现fault状态时,同城内生产中心同灾备中心将进行切换,以保证业务的连续性。

  • 容灾切换

基于应用容灾切换包括一系列的动作:停止灾难节点的部件服务、切断数据复制链路、建立数据容灾基线、启动容灾节点的部件服务、通知前端设备进行业务网络切换。具体动作可以结合实际情况,通过脚本来定制。

  • 恢复回切

回切工作流程和切换流程原理是一样的,只是因为切换的时候是不确定触发的、可能导致业务受部分影响;而回切的时候通过人工确认,选择最小影响的情况下执行操作(比如业务流量非常小的情况下,甚至暂停业务情况下),因此回切推荐采用的是手动切换模式。

应用级容灾采用的是自动切换还是手动切换,用户可以在部署时通过修改主机集群软件的切换配置实现。

  • 同城范围有效保证了数据的安全性和业务连续性;
  • 异地复制数据根据灾难情形,尽可能降低数据丢失机率;
  • 同城双中心为同步复制,数据实时同步,RPO=0;
  • 异地无距离限制,保证数据一致性,保证了数据的有效保护;
  • 异地容灾带宽要求低,先进的复制机制提高带宽利用率