GaussDB 200的高可用容灾目标是在任何故障场景,数据不丢失,业务不停机。为达到这样的目标,GaussDB 200设计了双集群容灾的方案:分别部署两套同构的集群,集群间通过容灾任务进行周期性的物理数据同步。其中主集群提供正常的业务,灾备集群(亦称“备集群”)在恢复期间不可用,非恢复期间提供只读服务。当主集群不可用时,灾备集群可以代替主集群正常提供业务,从而实现数据库的高可用。双集群容灾的约束限制见下图:
GaussDB 200集群容灾管理_第1张图片

1、环境信息

如下图所示,两个同构集群环境(Gauss1和Gauss2)都是由三个节点组成,容灾数据的存放路径都指定在同一位置(这里在各个节点单独挂载了一块磁盘用于存放容灾数据)。
GaussDB 200集群容灾管理_第2张图片

2、配置主备集群容灾

在启动双集群容灾功能之前,必须先对主备集群进行容灾配置,步骤如下:

2.1 配置主集群容灾

登录主集群FusionInsight Manager,在“集群”下拉列表中单击需要操作的集群名称,选择“服务 > MPPDB > 容灾 ”,填写完成后,单击“保存配置”。保存成功,配置状态显示为“已配置”。
GaussDB 200集群容灾管理_第3张图片

2.2 配置备集群容灾

登录备集群FusionInsight Manager,在“集群”下拉列表中单击需要操作的集群名称,选择“服务 > MPPDB > 容灾 ”,填写完成后,单击“保存配置”。保存成功,配置状态显示为“已配置”。
GaussDB 200集群容灾管理_第4张图片

2.3 配置说明

GaussDB 200集群容灾管理
GaussDB 200集群容灾管理_第5张图片

3、启动与停止集群容灾

3.1 启动集群容灾
  1. 登录主集群FusionInsight Manager,在“集群”下拉列表中单击需要操作的集群名称,选择“服务 > MPPDB > 容灾 ”,单击“启动容灾”。
  2. 在弹出窗口中输入Manager管理员密码,单击“确定”。在弹出窗口中输入对端集群root用户密码,单击“确定”。
  3. 等待容灾启动成功,单击“完成”。
    GaussDB 200集群容灾管理_第6张图片
  4. 重复1~3,启动备集群容灾。
    GaussDB 200集群容灾管理_第7张图片
    容灾启动后,主集群首先会执行一次全量备份,然后在备集群进行恢复(默认一周做一次全备份)。之后会周期性(默认为1小时)的执行增量备份恢复任务。备集群恢复期间,mppdb服务不可用,可以暂时忽略系统的告警信息。
    3.2 停止集群容灾

    1.登录主集群FusionInsight Manager,在“集群”下拉列表中单击需要操作的集群名称,选择“服务 > MPPDB > 容灾 ”,单击“停止容灾”。
    2.在弹出窗口中输入Manager管理员密码,然后单击“确定”。在确认停止容灾任务的对话框中单击“确定”。
    3.参见1~2登录备集群FusionInsight Manager停止备集群容灾。
    GaussDB 200集群容灾管理_第8张图片

    4、即时恢复

    在主备集群容灾过程中,备集群的恢复任务为周期性任务,如果设置的恢复周期较长,在两个周期之间如需在备集群即时执行一次数据恢复,可使用备集群的即时恢复功能。
    1.登录备集群FusionInsight Manager,在“集群”下拉列表中单击需要操作的集群名称,选择“服务 > MPPDB > 容灾”。
    2.单击“即时恢复”。
    3.在弹出窗口中输入备集群FusionInsight Manager管理员密码,单击“确定”。
    GaussDB 200集群容灾管理_第9张图片
    4.在弹出窗口中输入主集群root用户密码,单击“确定”。
    GaussDB 200集群容灾管理_第10张图片
    5.在确认执行即时恢复任务的对话框中单击“确定”。
    GaussDB 200集群容灾管理_第11张图片

5、主备集群切换

当主集群出现故障或需要升级时,可以使用容灾的主备切换功能将灾备集群升级为主集群,解除只读限制,在原主集群故障或升级期间继续对外提供服务,保证业务不中断。
GaussDB 200集群容灾管理

1.登录备集群FusionInsight Manager,在“集群”下拉列表中单击需要操作的集群名称,选择“服务 > MPPDB > 容灾 ”,单击“停止容灾”。
GaussDB 200集群容灾管理_第12张图片
2.等待容灾停止后,单击“主备集群切换”。在弹出窗口中输入Manager管理员密码,单击“确定”。在确认执行主备切换任务的对话框中单击“确定”进行主备切换。
GaussDB 200集群容灾管理_第13张图片
切换之前,会做一次增量备份与恢复,如果数据量大,则切换的时间比较长,需耐心等待。
3.等待主备切换成功之后,修改原备集群的容灾配置。
GaussDB 200集群容灾管理_第14张图片
4.如果原主集群正常,修改原主集群的容灾配置,否则,请先修复原主集群故障,再配置。
GaussDB 200集群容灾管理_第15张图片
5.启动主备集群的容灾,建立新的主备关系,如下图所示:
GaussDB 200集群容灾管理_第16张图片
GaussDB 200集群容灾管理_第17张图片