Oracle Data Guard从宏观上来说,主要提供以下两个服务:
1)日志传输:主库把生成的Redo日志传输至备库;
2)日志应用:备库应用从主库传输过来的Redo日志。
本文先介绍其中的日志传输服务,日志应用服务在下节《Data Guard 系列(3) - 日志应用》介绍。
有两种日志传输方式(ARC和LGWR),第一种是采用ARC进程传输日志,其示意图如下:
注:上图来自《大话Oracle RAC》
其大致过程如下:
1)主库:日志先写入在线重做日志,当在线重做日志满后(或人为切换), ARC0进程归档该日志至主库本地归档目录,归档完成后,ARC1马上将该归档日志传输到备库;
2)备库:RFS进程接收日志,如果备库有Standby重做日志,则把日志复制到Standby重做日志,接着把Standby重做日志归档至备库本地归档目录,最后应用归档日志;如果没有配置Standby重做日志,RFS进程接收日志后,直接把它放到备库的归档目录下,再应用该日志。
另外一种是使用LGWR进程传输日志,它又分为两种方式,分别是ASYNC和SYNC,下面是ASYNC的示意图:
下面是SYNC的示意图如下:
注:上图来自《大话Oracle RAC》
用LGWR传输大致如下:
1)主库:只要有新的重做日志产生,LGWR进程将触发LNSn进程把新生成的日志传输到备库(注意:这里不能由LGWR直接传输,因为整个数据库实例只有一个LGWR,为了保证它的主要业务性能不受影响,不能由它直接传输);
2)备库:RFS进程接收到日志后,将其写入Standby重做日志,如果备库开启了实时应用,就立即做日志应用,如果没有开启,则等Standby重做日志归档后再应用。
3)其中,ASYNC和SYNC的区别在于:SYNC是在redo还在内存时,LNSn进程就开始传输,而ASYNC是在redo缓冲到online redo log后,LNSn才开始传输。
从上面可以得出,从同步的实时性来看,LGWR(SYNC) > LGWR(ASYNC)> ARCH
SERVICE(必须):指定备库的网络连接名;
SYNC/ASYNC(默认为ASYNC):指定日志的传输模式(同步/异步);
NET_TIMEOUT:指定当采用SYNC传输模式时,超过多少秒则表示网路超时(默认为30s),在使用SNYC模式时,强烈建议设置改参数;
AFFIRM/NOAFFIRM:AFFIRM表示只有当日志写入Standby重做日志后才算日志传输成功,NOAFFIRM则没有这个要求;
DB_UNIQUE_NAME:指定备库的DB_UNIQUE_NAME;
VALID_FOR:格式为(
redo_log_type,
database_role),只有这两个条件全部符合,才会发送日志;
其中redo_log_type有如下取值:
ONLINE_LOGFILE, STANDBY_LOGFILE, ALL_LOGFILES
database_role有如下取值:PRIMARY_ROLE, STANDBY_ROLE, ALL_ROLES
REOPEN:指定当连接错误发生时,多少秒之后重试;
COMPRESSION:指定是否对日志进行压缩,已提高网络传输性能。
下面是log_archive_dest_n的一个例子:
DB_UNIQUE_NAME=BOSTON LOG_ARCHIVE_CONFIG='DG_CONFIG=(BOSTON,CHICAGO,HARTFORD)' LOG_ARCHIVE_DEST_2='SERVICE=CHICAGO ASYNC NOAFFIRM VALID_FOR=(ONLINE_LOGFILE, PRIMARY_ROLE) REOPEN=60 COMPRESSION=ENABLE DB_UNIQUE_NAME=CHICAGO' LOG_ARCHIVE_DEST_STATE_2='ENABLE' LOG_ARCHIVE_DEST_3='SERVICE=HARTFORD SYNC AFFIRM NET_TIMEOUT=30 VALID_FOR=(ONLINE_LOGFILE,PRIMARY_ROLE) REOPEN=60 COMPRESSION=ENABLE DB_UNIQUE_NAME=HARTFORD' LOG_ARCHIVE_DEST_STATE_3='ENABLE'
SQL> SELECT GROUP#, BYTES FROM V$LOG;通过下面的语句可以查询备库Standby日志的大小和组数:
SQL> SELECT GROUP#, BYTES FROM V$STANDBY_LOG;假设主库有两组在线日志,每个日志文件大小为500M,那么我们至少需要3组Standby,且每个日志文件大小不少于500M:
SQL> ALTER DATABASE ADD STANDBY LOGFILE ('/oracle/dbs/slog1.rdo') SIZE 500M; SQL> ALTER DATABASE ADD STANDBY LOGFILE ('/oracle/dbs/slog2.rdo') SIZE 500M; SQL> ALTER DATABASE ADD STANDBY LOGFILE ('/oracle/dbs/slog3.rdo') SIZE 500M;
上面提到过,备库的Standby日志也会被归档,它的归档路径由备库的log_archive_dest_n参数的location属性设置,如下所示:
LOG_ARCHIVE_DEST_1 = 'LOCATION = /disk2/archive VALID_FOR=(STANDBY_LOGFILE,STANDBY_ROLE)' LOG_ARCHIVE_DEST_STATE_2=ENABLE
第一步:在主库执行如下语句获得最新归档序列号:
SQL> SELECT MAX(SEQUENCE#), THREAD# FROM V$ARCHIVED_LOG GROUP BY THREAD#;
第二步:在主库执行如下语句确认最新归档的日志是否已经传输至备库:
SQL> SELECT DESTINATION, STATUS, ARCHIVED_THREAD#, ARCHIVED_SEQ# FROM V$ARCHIVE_DEST_STATUS > WHERE STATUS <> 'DEFERRED' AND STATUS <> 'INACTIVE'; DESTINATION STATUS ARCHIVED_THREAD# ARCHIVED_SEQ# ------------------ ------ ---------------- ------------- /private1/prmy/lad VALID 1 947 standby1 VALID 1 947如果状态不是VALID,则说明日志传输失败。
Oracle DG会自动检测日志传输GAP并自动解决,但有时候GAP无法自动解决,必须DBA人工干预,下面我们讲讲手动解决的步骤:
首先,在备库执行下列语句查询是否有GAP:
SQL> SELECT * FROM V$ARCHIVE_GAP; THREAD# LOW_SEQUENCE# HIGH_SEQUENCE# ----------- ------------- -------------- 1 7 10HIGH_SEQUENCE#减去LOW_SEQUENCE#就是当前的GAP数,上例显示备库缺少从7到10(不包含10)的归档日志。
接着,在主库查询这些归档日志的目录位置:
SQL> SELECT NAME FROM V$ARCHIVED_LOG WHERE THREAD#=1 AND DEST_ID=1 AND SEQUENCE# BETWEEN 7 AND 10; NAME -------------------------------------------------------------------------------- /primary/thread1_dest/arcr_1_7.arc /primary/thread1_dest/arcr_1_8.arc /primary/thread1_dest/arcr_1_9.arc
把这些归档日志从主库拷贝至备库,并在备库上注册:
SQL> ALTER DATABASE REGISTER LOGFILE '/physical_standby1/thread1_dest/arcr_1_7.arc'; SQL> ALTER DATABASE REGISTER LOGFILE '/physical_standby1/thread1_dest/arcr_1_8.arc'; SQL> ALTER DATABASE REGISTER LOGFILE '/physical_standby1/thread1_dest/arcr_1_9.arc';
《[Oracle] Data Guard 系列(1) - 三种保护模式》
《[Oracle] Data Guard 系列(2) - 日志传输》
《[Oracle] Data Guard 系列(3) - 日志应用》
《[Oracle] Data Guard 系列(4) - 在不停主库的情况下创建物理备库》
《[Oracle] Data Guard 系列(5) - 创建逻辑备库》
《[Oracle] Data Guard 系列(6) - 角色转换》