DM8数据守护实时主备集群V4.0的搭建

注:

前菜
在搭建数据守护系统前,应注意数据守护系统中各实例使用的 DM 服务器版本应一致,同时还应注意各实例所在主机的操作系统位数、大小端模式、时区及时间设置都应一致,以及使用同一个用户启动 DM 服务器和守护进程 dmwatcher,以免系统在运行时出现意想不到的错误。

首先要有两台虚拟机,都要安装DM8数据库:(建议查看一下,方便知道安装路径和实例路径)
安装详解如下链接:
https://blog.csdn.net/chenyu940415/article/details/107481183

开始进行正餐
1.数据准备:
配置数据守护之前,必须先同步实例数据,确保两者保持完全一致;主库可以是新初始化的数据,也可以是正在生产、使用中的数据。DM 提供了两种方式初始化同步实例数据,数据文件拷贝以及备份还原方式。
如果是初始搭建环境,可以通过对主库脱机备份、对备库脱机还原的方式来准备数据,如果主库已经处于运行状态,则可以对主库进行联机备份、对备库脱机还原的方式来准备数据。

1.1 联机备份、脱机还原方式
1.1.1 对主库进行联机备份操作

SQL> BACKUP DATABASE BACKUPSET '/dm8/data/BACKUP_FILE_01';

1.1.2. 拷贝备份文件到备库所在机器

[dmdba@localhost data]$ scp -r /dm8/data/BACKUP_FILE_01/ [email protected]:/dm8/data/

1.1.3. 执行脱机数据库还原与恢复

./dmrman CTLSTMT="RESTORE DATABASE '/dm8/data/DAMENG/dm.ini' FROM BACKUPSET '/dm8/data/BACKUP_FILE_01'"
./dmrman CTLSTMT="RECOVER DATABASE '/dm8/data/DAMENG/dm.ini' FROM BACKUPSET '/dm8/data/BACKUP_FILE_01'"
./dmrman CTLSTMT="RECOVER DATABASE '/dm8/data/DAMENG/dm.ini' UPDATE DB_MAGIC"

本次采用的便是这种方式:
1.2 脱机备份、脱机还原方式
用户也可以通过脱机备份、脱机还原的方式同步主库和备库数据,具体步骤包括:
1.2.1 正常关闭数据库:

[dmdba@localhost bin]$ ./DmServiceTEST stop
Stopping DmServiceTEST:                                    [ OK ]

1.2.2 进行脱机备份:
先检查Dmap服务是否在运行,要保证在运行状态,否则会报错:

[dmdba@localhost bin]$ ./DmAPService status
DmAPService (pid 7047) is running.

执行以下命令进行脱机备份,目录为自己安装时的目录:

[dmdba@localhost bin]$./dmrman CTLSTMT="BACKUP DATABASE '/dm8/data/DAMENG/dm.ini' FULL TO BACKUP_FILE1 BACKUPSET '/dm8/data/BACKUP_FILE_01'"

1.2.3. 拷贝脱机备份的文件到备库所在机器

[dmdba@localhost data]$ scp -r /dm8/data/BACKUP_FILE_01/ dmdba:192.168.130.12:/dm8/data/

1.2.4. 执行脱机数据库还原与恢复(数据库处于关闭状态下执行)

./dmrman CTLSTMT="RESTORE DATABASE '/dm8/data/DAMENG/dm.ini' FROM BACKUPSET '/dm8/data/BACKUP_FILE_01'"
./dmrman CTLSTMT="RECOVER DATABASE '/dm8/data/DAMENG/dm.ini' FROM BACKUPSET '/dm8/data/BACKUP_FILE_01'"
./dmrman CTLSTMT="RECOVER DATABASE '/dm8/data/DAMENG/dm.ini' UPDATE DB_MAGIC"

2.配置实时主备:

2.1配置主库GRP1_RT_01
2.1.1配置 dm.ini
在机器上配置主库的实例名为GRP1_RT_01,dm.ini 参数修改如下:

INSTANCE_NAME = GRP1_RT_01
PORT_NUM = 5236 		#数据库实例监听端口
DW_INACTIVE_INTERVAL = 60 		#接收守护进程消息超时时间
ALTER_MODE_STATUS = 0 		#不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 		#不允许备库 OFFLINE 表空间
MAL_INI = 1 			#打开 MAL 系统
ARCH_INI = 1			#打开归档配置
RLOG_SEND_APPLY_MON = 64 	#统计最近 64 次的日志发送信息

2.1.2配置 dmmal.ini
配置 MAL 系统,各主备库的 dmmal.ini 配置必须完全一致,MAL_HOST 使用内部网络 IP,MAL_PORT 与 dm.ini 中 PORT_NUM 使用不同的端口值,MAL_DW_PORT 是各实例对应的守护进程之间,以及守护进程和监视器之间的通信端口,配置如下:

MAL_CHECK_INTERVAL = 5 			#MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5 		#判定 MAL 链路断开的时间
[MAL_INST1]
 MAL_INST_NAME = GRP1_RT_01 		#实例名,和 dm.ini 中的 INSTANCE_NAME 一致
 MAL_HOST = 192.168.130.11 			#MAL 系统监听 TCP 连接的 IP 地址  MAL IP 地址,使用 MAL_HOST + MAL_PORT 创建 MAL 链路
 MAL_PORT = 61141 			#MAL 系统监听 TCP 连接的端口
 MAL_INST_HOST = 192.168.130.11 		#实例的对外服务 IP 地址
 MAL_INST_PORT = 5236			#实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致
 MAL_DW_PORT = 52141 			#实例本地的守护进程监听 TCP 连接的端口
 MAL_INST_DW_PORT = 33141 			#实例监听守护进程 TCP 连接的端口
[MAL_INST2]
 MAL_INST_NAME = GRP1_RT_02
 MAL_HOST = 192.168.130.12
 MAL_PORT = 61142
 MAL_INST_HOST = 192.168.130.12
 MAL_INST_PORT = 5236			
 MAL_DW_PORT = 52142
 MAL_INST_DW_PORT = 33142

2.1.3 配置 dmarch.ini
当前实例GRP1_RT_01 是主库,需要向 GRP1_RT_02(实时备库)同步数据,因此实时归档的 ARCH_DEST 配置为 GRP1_RT_02,配置如下:

[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME 					#实时归档类型
ARCH_DEST = GRP1_RT_02 					#实时归档目标实例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL 					#本地归档类型
ARCH_DEST = /dm8/data/DAMENG/arch 				#本地归档文件存放路径
ARCH_FILE_SIZE = 1024 					#单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 20480					#单位 Mb,0 表示无限制,范围 1024~4294967294M

2.1.4 配置 dmwatcher.ini
修改 dmwatcher.ini 配置守护进程,配置为全局守护类型,使用自动切换模式,配置如下:

[GRP1]
DW_TYPE = GLOBAL 						#全局守护类型
DW_MODE = AUTO 						#自动切换模式
DW_ERROR_TIME = 10 					#远程守护进程故障认定时间
INST_RECOVER_TIME = 60 					#主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 					#本地实例故障认定时间
INST_OGUID = 453331 					#守护系统唯一 OGUID 值
INST_INI = /dm8/data/DAMENG/dm.ini 		#dm.ini 配置文件路径
INST_AUTO_RESTART = 1 					#打开实例的自动启动功能
INST_STARTUP_CMD = /dm8/soft/bin/dmserver 		#命令行方式启动
RLOG_SEND_THRESHOLD = 0 				#指定主库发送日志到备库的时间阀值,默认关闭
RLOG_APPLY_THRESHOLD = 0			 	#指定备库重演日志的时间阀值,默认关闭

2.1.5 启动主库(有两种方式启动)
*注意:对于新初始化的库,首次启动不允许使用 Mount 方式,需要先正常启动并正常退出,然后才允许 Mount 方式启动。
①以 Mount 方式启动主库(前台启动):

[dmdba@localhost bin]$ ./dmserver /dm8/data/DAMENG/dm.ini mount

②以 Mount 方式启动主库(后台启动):

[root@localhost /]# cd /dm8/soft/script/root/
[root@localhost root]# ./dm_service_installer.sh -t dmserver -p Mount -dm_ini /dm8/data/DAMENG/dm.ini -m mount
[dmdba@localhost /]$ cd /dm8/soft/bin
[dmdba@localhost bin]$ ./DmServiceMount start

2.1.6 设置 OGUID(处于配置状态)
启动命令行工具 DIsql,登录主库设置 OGUID 值,如下:

[dmdba@localhost bin]$ ./disql
服务器[LOCALHOST:5236]:处于普通配置状态
登录使用时间: 4.370(毫秒)
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL>sp_set_oguid(453331);
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);

2.1.7 修改数据库模式

SQL>alter database primary;

==============================================================================
2.2配置备库 GRP1_RT_02

2.2.1配置 dm.ini
在 机器上配置备库的实例名为 GRP1_RT_02,dm.ini 参数修改如下:

INSTANCE_NAME = GRP1_RT_02
PORT_NUM = 5236 		#数据库实例监听端口
DW_INACTIVE_INTERVAL = 60 		#接收守护进程消息超时时间
ALTER_MODE_STATUS = 0 		#不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 		#不允许备库 OFFLINE 表空间
MAL_INI = 1 			#打开 MAL 系统
ARCH_INI = 1			#打开归档配置
RLOG_SEND_APPLY_MON = 64 	#统计最近 64 次的日志发送信息

2.2.2配置 dmmal.ini
配置 MAL 系统,各主备库的 dmmal.ini 配置必须完全一致,MAL_HOST 使用内部网络 IP,MAL_PORT 与 dm.ini 中 PORT_NUM 使用不同的端口值,MAL_DW_PORT 是各实例对应的守护进程之间,以及守护进程和监视器之间的通信端口,配置如下:

MAL_CHECK_INTERVAL = 5 			#MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5 		#判定 MAL 链路断开的时间
[MAL_INST1]
 MAL_INST_NAME = GRP1_RT_01 		#实例名,和 dm.ini 中的 INSTANCE_NAME 一致
 MAL_HOST = 192.168.130.11 			#MAL 系统监听 TCP 连接的 IP 地址  MAL IP 地址,使用 MAL_HOST + MAL_PORT 创建 MAL 链路
 MAL_PORT = 61141 			#MAL 系统监听 TCP 连接的端口
 MAL_INST_HOST = 192.168.130.11 		#实例的对外服务 IP 地址
 MAL_INST_PORT = 5236			#实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致
 MAL_DW_PORT = 52141 			#实例本地的守护进程监听 TCP 连接的端口
 MAL_INST_DW_PORT = 33141 			#实例监听守护进程 TCP 连接的端口
[MAL_INST2]
 MAL_INST_NAME = GRP1_RT_02
 MAL_HOST = 192.168.130.12
 MAL_PORT = 61142
 MAL_INST_HOST = 192.168.130.12
 MAL_INST_PORT = 5236			
 MAL_DW_PORT = 52142
 MAL_INST_DW_PORT = 33142

2.2.3 配置 dmarch.ini
当前实例GRP1_RT_02 是主库,需要向GRP1_RT_01(实时备库)同步数据,因此实时归档的 ARCH_DEST 配置为 GRP1_RT_01,配置如下:

[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME 					#实时归档类型
ARCH_DEST = GRP1_RT_01 					#实时归档目标实例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL 					#本地归档类型
ARCH_DEST = /dm8/data/DAMENG/arch 				#本地归档文件存放路径
ARCH_FILE_SIZE = 1024 					#单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 20480					#单位 Mb,0 表示无限制,范围 1024~4294967294M

2.2.4 配置 dmwatcher.ini
修改 dmwatcher.ini 配置守护进程,配置为全局守护类型,使用自动切换模式,配置如下:

[GRP1]
DW_TYPE = GLOBAL 						#全局守护类型
DW_MODE = AUTO 						#自动切换模式
DW_ERROR_TIME = 10 					#远程守护进程故障认定时间
INST_RECOVER_TIME = 60 					#主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 					#本地实例故障认定时间
INST_OGUID = 453331 					#守护系统唯一 OGUID 值
INST_INI = /dm8/data/DAMENG/dm.ini 		#dm.ini 配置文件路径
INST_AUTO_RESTART = 1 					#打开实例的自动启动功能
INST_STARTUP_CMD = /dm8/soft/bin/dmserver 		#命令行方式启动
RLOG_APPLY_THRESHOLD = 0			 	#指定备库重演日志的时间阀值,默认关闭

2.2.5 启动备库(有两种方式启动)
①以 Mount 方式启动备库(前台启动):

[dmdba@localhost bin]$ ./dmserver /dm8/data/DAMENG/dm.ini mount

②以 Mount 方式启动备库(后台启动):

[root@localhost /]# cd /dm8/soft/script/root/
[root@localhost root]# ./dm_service_installer.sh -t dmserver -p Mount -dm_ini /dm8/data/DAMENG/dm.ini -m mount
[dmdba@localhost /]$ cd /dm8/soft/bin
[dmdba@localhost bin]$ ./DmServiceMount start

2.2.6 设置 OGUID(处于配置状态)
启动命令行工具 DIsql,登录主库设置 OGUID 值,如下:

[dmdba@localhost bin]$ ./disql
服务器[LOCALHOST:5236]:处于普通配置状态
登录使用时间: 4.370(毫秒)
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL>sp_set_oguid(453331);
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);

2.1.7 修改数据库模式
如果当前数据库不是 Normal 模式,需要先修改 dm.ini 中 ALTER_MODE_STATUS 值 为 1,允许修改数据库模式,修改 Standby 模式成功后再改回为 0。如果是 Normal 模式,请忽略下面的第 1 步和第 3 步。

SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); ----第 1 步
SQL>alter database standby; ----第 2 步 
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0); ----第 3 步

3.配置监视器(可以在备库,也可以在另外一台虚拟机上配置)
由于主库和实时备库的守护进程配置为自动切换模式,因此这里选择配置确认监视器。和普通监视器相比,确认监视器除了相同的命令支持外,在主库发生故障时,能够自动通知实时备库接管为新的主库,具有自动故障处理的功能。
修改 dmmonitor.ini 配置确认监视器,其中 MON_DW_IP 中的 IP 和 PORT 和dmmal.ini 中的 MAL_HOST 和 MAL_DW_PORT 配置项保持一致,配置如下:

MON_DW_CONFIRM = 1 		#确认监视器模式
MON_LOG_PATH = /dm8/data/DAMENG/log 	#监视器日志文件存放路径
MON_LOG_INTERVAL = 60 		#每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 32 		#每个日志文件最大 32M
MON_LOG_SPACE_LIMIT = 0 		#不限定日志文件总占用空间
[GRP1]
MON_INST_OGUID = 453331 		#组 GRP1 的唯一 OGUID 值
#以下配置为监视器到组 GRP1 的守护进程的连接信息,以“IP:PORT”的形式配置
#IP 对应 dmmal.ini 中的 MAL_HOST,PORT 对应 dmmal.ini 中的 MAL_DW_PORT
MON_DW_IP = 192.168.130.11:52141
MON_DW_IP = 192.168.130.12:52142

4.启动守护进程
启动各个主备库上的守护进程:

[dmdba@localhost bin]$ ./dmwatcher /dm8/data/DAMENG/dmwatcher.ini

守护进程启动后,进入 Startup 状态,此时实例都处于 Mount 状态。守护进程开始广播自身和其监控实例的状态信息,结合自身信息和远程守护进程的广播信息,守护进程将本地实例 Open,并切换为 Open 状态。
5.启动监视器
监视器提供一系列命令,支持当前守护系统状态查看以及故障处理,可输入 help 命令,查看各种命令说明使用,结合实际情况选择使用。
至此一主一备的实时数据守护系统搭建完毕,在搭建步骤和各项配置都正确的情况下,在监视器上执行 show 命令,可以监控到所有实例都处于 Open 状态,所有守护进程也都处于 Open 状态,即为正常运行状态。

[dmdba@localhost bin]$ ./dmmonitor /dm8/data/DAMENG/dmmonitor.ini

出现以下结果就ok

show
2020-07-11 12:26:29 
#================================================================================#
GROUP            OGUID       MON_CONFIRM     MODE            MPP_FLAG  
GRP1             453331      TRUE            MANUAL          FALSE     


<<DATABASE GLOBAL INFO:>>
IP              MAL_DW_PORT  WTIME                WTYPE     WCTLSTAT  WSTATUS        INAME            INST_OK   N_EP  N_OK  ISTATUS     IMODE     DSC_STATUS     RTYPE     RSTAT    
192.168.130.11  5236         2020-07-11 12:26:29   GLOBAL    VALID     OPEN           DAVE1            OK        1     1     OPEN        PRIMARY   DSC_OPEN       REALTIME  VALID    

EP INFO:
INST_PORT  INST_OK   INAME            ISTATUS     IMODE     DSC_SEQNO  DSC_CTL_NODE RTYPE     RSTAT    FSEQ            FLSN            CSEQ            CLSN            DW_STAT_FLAG          
5236       OK        DAVE1            OPEN        PRIMARY   0          0            REALTIME  VALID    3654            71664           3654            71664           NONE                  

<<DATABASE GLOBAL INFO:>>
IP              MAL_DW_PORT  WTIME                WTYPE     WCTLSTAT  WSTATUS        INAME            INST_OK   N_EP  N_OK  ISTATUS     IMODE     DSC_STATUS     RTYPE     RSTAT    
192.168.130.12  5236         2020-07-11 12:26:29   GLOBAL    VALID     OPEN           DAVE2            OK        1     1     OPEN        STANDBY   DSC_OPEN       REALTIME  VALID    

EP INFO:
INST_PORT  INST_OK   INAME            ISTATUS     IMODE     DSC_SEQNO  DSC_CTL_NODE RTYPE     RSTAT    FSEQ            FLSN            CSEQ            CLSN            DW_STAT_FLAG          
5236       OK        DAVE2            OPEN        STANDBY   0          0            REALTIME  VALID    3645            71664           3645            71664           NONE                  

DATABASE(DAVE2) APPLY INFO FROM (DAVE1):
DSC_SEQNO[0], (ASEQ, SSEQ, KSEQ)[3654, 3654, 3654], (ALSN, SLSN, KLSN)[71664, 71664, 71664], N_TSK[0], TSK_MEM_USE[0]

你可能感兴趣的:(DM8,linux,运维,数据库)