RAC,DataGurad,Stream是Oracle高可用性体系中的三种工具,每个工具即可以独立应用,也可以相互配合。他们各自的侧重点不同,适用场景也不同。
RAC它的强项在于解决单点故障和负载均衡,因此RAC方案常用于7*24的核心系统,但RAC方案中的数据只有一份,尽管可以通过RAID等机制可以避免存储故障,但是数据本身是没有冗余的,容易形成单点故障。
DataGurad通过冗余数据来提供数据保护,DataGurad通过日志同步机制保证冗余数据和主数据之前的同步,这种同步可以是实时,延时,同步,异步多种形式。DataGurad常用于异地容灾和小企业的高可用性方案,虽然可以在Standby机器上执行只读查询,从而分散Primary苏菊哭的性能压力,但是DataGurad决不是性能解决方案。
Stream是以OracleAdvancedQueue为基础实现的数据同步,提供了多种级别的灵活配置,并且Oracle提供了丰富的API等开发支持,Stream更适用在应用层面的数据共享。
在DataGurad环境中,至少有两个数据库,一个处于Open状态对外提供服务,这个数据库叫作PrimaryDatabase。第二个处于恢复状态,叫作StandbyDatabase。运行时primaryDatabase对外提供服务,用户在PrimaryDatabase上进行操作,操作被记录在联机日志和归档日志中,这些日志通过网络传递给StandbyDatabase。这个日志会在StandbyDatabase上重演,从而实现PrimaryDatabase和StandbyDatabase的数据同步。
OracleDataGurad对这一过程进一步的优化设计,使得日志的传递,恢复工作更加自动化,智能化,并且提供一系列参数和命令简化了DBA工作。
如果是可预见因素需要关闭PrimaryDatabase,比如软硬件升级,可以把StandbyDatabase切换为PrimaryDatabase继续对外服务,这样即减少了服务停止时间,并且数据不会丢失。如果异常原因导致PrimaryDatabase不可用,也可以把StandbyDatabase强制切换为PrimaryDatabase继续对外服务,这时数据损失成都和配置的数据保护级别有关系。因此Primary和Standby只是一个角色概念,并不固定在某个数据库中。
一.DataGuard架构
DG架构可以按照功能分成3个部分:
1)日志发送(RedoSend)
2)日志接收(RedoReceive)
3)日志应用(RedoApply)
1.日志发送(RedoSend)
PrimaryDatabase运行过程中,会源源不断地产生Redo日志,这些日志需要发送到StandyDatabase。这个发送动作可以由PrimaryDatabase的LGWR或者ARCH进程完成,不同的归档目的地可以使用不同的方法,但是对于一个目的地,只能选用一种方法。选择哪个进程对数据保护能力和系统可用性有很大区别。
1.1使用ARCH进程
1)PrimaryDatabase不断产生RedoLog,这些日志被LGWR进程写到联机日志。
2)当一组联机日志被写满后,会发生日志切换(LogSwitch),并且会触发本地归档,本地归档位置是采用LOG_ARCHIVE_DEST_1='LOCATION=/path'这种格式定义的。
如:altersystemsetlog_archive_dest_1='LOCATION=/u01/arch'scope=both;
3)完成本地归档后,联机日志就可以被覆盖重用。
4)ARCH进程通过Net把归档日志发送给StandbyDatabase的RFS(RemoteFileServer)进程。
5)StandbyDatabase端的RFS进程把接收的日志写入到归档日志。
6)StandbyDatabase端的MRP(ManagedRecoveryProcess)进程(RedoApply)或者LSP进程(SQLApply)在StandbyDatabase上应用这些日志,进而同步数据。
用ARCH模式传输不写StandbyRedologs,直接保存成归档文件存放于Standby端。
说明:
逻辑Standby接收后将其转换成SQL语句,在Standby数据库上执行SQL语句实现同步,这种方式叫SQLApply。
物理Standby接收完Primary数据库生成的REDO数据后,以介质恢复的方式实现同步,这种方式也叫RedoApply。
注意:创建逻辑Standby数据库要先创建一个物理Standby数据库,然后再将其转换成逻辑Standby数据库。
使用ARCH进程传递最大问题在于:PrimaryDatabase只有在发生归档时才会发送日志到StandbyDatabase。如果PrimaryDatabase异常宕机,联机日志中的Redo内容就会丢失,因此使用ARCH进程无法避免数据丢失的问题,要想避免数据丢失,就必须使用LGWR,而使用LGWR又分SYNC(同步)和ASYNC(异步)两种方式。
在缺省方式下,PrimaryDatabase使用的是ARCH进程,参数设置如下:
altersystemsetlog_archive_dest_2='SERVICE=ST'scope=both;
1.2使用LGWR进程的SYNC方式
1)PrimaryDatabase产生的Redo日志要同时写道日志文件和网络。也就是说LGWR进程把日志写到本地日志文件的同时还要发送给本地的LNSn进程(NetworkServerProcess),再由LNSn(LGWRNetworkServerprocess)进程把日志通过网络发送给远程的目的地,每个远程目的地对应一个LNS进程,多个LNS进程能够并行工作。
2)LGWR必须等待写入本地日志文件操作和通过LNSn进程的网络传送都成功,PrimaryDatabase上的事务才能提交,这也是SYNC的含义所在。
3)StandbyDatabase的RFS进程把接收到的日志写入到StandbyRedoLog日志中。
4)PrimaryDatabase的日志切换也会触发StandbyDatabase上的日志切换,即StandbyDatabase对StandbyRedoLog的归档,然后触发StandbyDatabase的MRP或者LSP进程恢复归档日志。
因为PrimaryDatabase的Redo是实时传递的,于是StandbyDatabase端可以使用两种恢复方法:
实时恢复(Real-TimeApply):只要RFS把日志写入StandbyRedoLog就会立即进行恢复;
归档恢复:在完成对StandbyRedoLog归档才触发恢复。
PrimaryDatabase默认使用ARCH进程,如果使用LGWR进程必须明确指定。使用LGWRSYNC方式时,可以同时使用NET_TIMEOUT参数,这个参数单位是秒,代表如果多长时间内网络发送没有响应,LGWR进程会抛出错误。示例如下:
altersystemsetlog_archive_dest_2='SERVICE=STLGWRSYNCNET_TIMEOUT=30'scope=both;
1.3使用LGWR进程的ASYNC方式
使用LGWRSYNC方法的可能问题在于,如果日志发送给StandbyDatabase过程失败,LGWR进程就会报错。也就是说PrimaryDatabase的LGWR进程依赖于网络状况,有时这种要求可能过于苛刻,这时就可以使用LGWRASYNC方式。它的工作机制如下:
1)PrimaryDatabase一段产生Redo日志后,LGWR把日志同时提交给日志文件和本地LNS进程,但是LGWR进程只需成功写入日志文件就可以,不必等待LNSn进程的网络传送成功。
2)LNSn进程异步地把日志内容发送到StandbyDatabase。多个LNSn进程可以并发发送。
3)PrimaryDatabase的OnlineRedoLog写满后发生LogSwitch,触发归档操作,也触发StandbyDatabase对StandbyDatabase对StandbyRedoLog的归档;然后触发MRP或者LSP进程恢复归档日志。
因为LGWR进程不会等待LNSn进程的响应结果,所以配置LGWRASYNC方式时不需要NET_TIMEOUT参数。示例如下:
altersystemsetlog_archive_dest_2='SERVICE=STLGWRASYNC'scope=both;
2.日志接收(RedoReceive)
StandbyDatabase的RFS(RemoteFileServer)进程接收到日志后,就把日志写到StandbyRedoLog或者ArchivedLog文件中,具体写入哪个文件,取决于Primary的日志传送方式和Standbydatabase的位置。如果写到StandbyRedoLog文件中,则当PrimaryDatabase发生日志切换时,也会触发StandbyDatabase上的StandbyRedoLog的日志切换,并把这个StandbyRedoLog归档。如果是写到ArchivedLog,那么这个动作本省也可以看作是个归档操作。
在日志接收中,需要注意的是归档日志会被放在什么位置:
1)如果配置了STANDBY_ARCHIVE_DEST参数,则使用该参数指定的目录。
2)如果某个LOG_ARCHIVE_DEST_n参数明确定义了VALID_FOR=(STANDBY_LOGFILE,*)选项,则使用这个参数指定的目录。
3)如果数据库的COMPATIBLE参数大于等于10.0,则选取任意一个LOG_ARCHIVE_DEST_n的值。
4)如果STANDBY_ARCHIVE_DEST和LOG_ARCHIVE_DEST_n参数都没有配置,使用缺省的STANDBY_ARCHIVE_DEST参数值,这个缺省值是$ORACLE_HOME/dbs/arc.
3.日志应用(RedoApply)
日志应用服务,就是在StandbyDatabase上重演PrimaryDatabase日志,从而实现两个数据库的数据同步。根据StandbyDatabase重演日志方式的不同,可分为物理Standby(PhysicalStandby)和逻辑Standby(LogicalStandby)。
PhysicalStandby使用的是MediaRecovery技术,在数据块级别进行恢复,这种方式没有数据类型的限制,可以保证两个数据库完全一致。PhysicalStandby数据库只能在Mount状态下进行恢复,也可以是打开,但只能已只读方式打开,并且打开时不能执行恢复操作。
LogicalStandby使用的是Logminer技术,通过把日志内容还原成SQL语句,然后SQL引擎执行这些语句,LogminerStandby不支持所有数据类型,可以在视图DBA_LOGSTDBY_UNSUPPORTED中查看不支持的数据类型,如果使用了这种数据类型,则不能保证数据库完全一致。LogicalStandby数据库可以在恢复的同时进行读写操作。
Standby数据库的相关进程读取接收到的REDO数据(可能来自于Standby端的归档文件,也可能来自于StandbyRedologs),再将其写入Standby数据库。保存之后数据又是怎么生成的呢?两种方式:物理Standby通过REDO应用,逻辑Standby通过SQL应用
根据RedoApply发生的时间可以分成两种:
一种是实时应用(Real-TimeApply),这种方式必须StandbyRedoLog,每当日志被写入StandbyRedoLog时,就会触发恢复,使用这种方式的好处在与可以减少数据库切换(Switchover或者Failover)的时间,因为切换时间主要用在剩余日志的恢复上。
另一种是归档时应用,这种方式在PrimaryDatabase发生日志切换,触发StandbyDatabase归档操作,归档完成后触发恢复。这也是默认的恢复方式。
如果是PhysicalStandby,可以使用下面命令启用Real-Time:
Alterdatabaserecovermanagedstandbydatabaseusingcurrentlogfile;
如果是LogicalStandby,可以使用下面命令启用Real-Time:
Alterdatabasestartlogicalstandbyapplyimmediate;
查看是否使用Real-Timeapply:
Selectrecovery_modefromv$archive_dest_status;
SQL> set wrap off
SQL> select process,status,thread#,sequence#,client_pid from v$managed_standby;
PROCESS STATUS THREAD# SEQUENCE# CLIENT_PID
--------- ------------ ---------- ---------- -----------------------------------
ARCH CONNECTED 0 0 240
ARCH CONNECTED 0 0 196
ARCH CONNECTED 0 0 1944
ARCH CONNECTED 0 0 3956
MRP0 WAIT_FOR_LOG 1 30843 N/A
RFS RECEIVING 1 30838 2620
RFS RECEIVING 1 30837 2612
RFS RECEIVING 1 30833 2652
RFS ATTACHED 1 30841 2628
RFS ATTACHED 1 30835 2604
RFS ATTACHED 1 30842 2608
已选择11行。
二.数据保护模式
DataGuard允许定义3钟数据保护模式,分别是最大保护(MaximumProtection),最大可用(MaximumAvailability)和最大性能(MaximumPerformance)。
1.最大保护(MaximumProtection)
这种模式能够确保绝无数据丢失。要实现这一步当然是有代价的,它要求所有的事务在提交前其REDO不仅被写入到本地的OnlineRedologs,还要同时写入到Standby数据库的StandbyRedologs,并确认REDO数据至少在一个Standby数据库中可用(如果有多个的话),然后才会在Primary数据库上提交。如果出现了什么故障导致Standby数据库不可用的话(比如网络中断),Primary数据库会被Shutdown,以防止数据丢失。
使用这种方式要求StandbyDatabase必须配置StandbyRedoLog,而PrimaryDatabase必须使用LGWR,SYNC,AFFIRM方式归档到StandbyDatabase.
2.最高可用性(Maximumavailability)
这种模式在不影响Primary数据库可用前提下,提供最高级别的数据保护策略。其实现方式与最大保护模式类似,也是要求本地事务在提交前必须至少写入一台Standby数据库的StandbyRedologs中,不过与最大保护模式不同的是,如果出现故障导致Standby数据库无法访问,Primary数据库并不会被Shutdown,而是自动转为最高性能模式,等Standby数据库恢复正常之后,Primary数据库又会自动转换成最高可用性模式。
这种方式虽然会尽量避免数据丢失,但不能绝对保证数据完全一致。这种方式要求StandbyDatabase必须配置StandbyRedoLog,而PrimaryDatabase必须使用LGWR,SYNC,AFFIRM方式归档到StandbyDatabase.
3.最高性能(Maximumperformance)
缺省模式。这种模式在不影响Primary数据库性能前提下,提供最高级别的数据保护策略。事务可以随时提交,当前Primary数据库的REDO数据至少需要写入一个Standby数据库,不过这种写入可以是不同步的。如果网络条件理想的话,这种模式能够提供类似最高可用性的数据保护,而仅对Primary数据库的性能有轻微影响。这也是创建Standby数据库时,系统的默认保护模式。
这种方式可以使用LGWRASYNC或者ARCH进程实现,StandbyDatabase也不要求使用StandbyRedoLog。
4.修改数据保护模式步骤
1)关闭数据库,重启到Mount状态,如果是RAC,需要关闭所有实例,然后只启动一个实例到mount状态。
2)修改模式:
语法:ALTERDATABASESETSTANDBYDATABASETOMAXIMIZE{PROTECTION|AVAILABILITY|PERFORMANCE};
如:SQL>ALTERDATABASESETSTANDBYDATABASETOMAXIMIZEPROTECTION;
3)打开数据库:alterdatabaseopen;
4)确认修改数据保护模式:
SQL>selectprotection_mode,protection_levelfromv$database;
三.自动裂缝检测和解决
当PrimaryDatabase的某些日志没有成功发送到StandbyDatabase,这时候发生饿了归档裂缝(ArchiveGap)。
缺失的这些日志就是裂缝(Gap)。DataGuard能够自动检测,解决归档裂缝,不需要DBA的介入。这需要配置FAL_CLIENT,FAL_SERVER这两个参数(FAL:FetchArchiveLog)。
从FAL这个名字可以看出,这个过程是StandbyDatabase主动发起的“取”日志的过程,StandbyDatabase就是FAL_CLIENT.它是从FAL_SERVER中取这些Gap,10g中,这个FAL_SERVER可以是PrimaryDatabase,也可以是其他的StandbyDatabase。
如:FAL_SERVER='PR1,ST1,ST2';
FAL_CLIENT和FAL_SERVER两个参数都是OracleNetName。FAL_CLIENT通过网络向FAL_SERVER发送请求,FAL_SERVER通过网络向FAL_CLIENT发送缺失的日志。但是这两个连接不一定是一个连接。因此FAL_CLIENT向FAL_SERVER发送请求时,会携带FAL_CLIENT参数值,用来告诉FAL_SERVER应该向哪里发送缺少的日志。这个参数值也是一个OracleNetName,这个Name是在FAL_SERVER上定义的,用来指向FAL_CLIENT.
当然,除了自动地日志缺失解决,DBA也可以手工解决。具体操作步骤如下:
1)查看是否有日志GAP:
SQL>SELECTUNIQUETHREAD#,MAX(SEQUENCE#)OVER(PARTITIONBYTHREAD#)LASTFROMV$ARCHIVED_LOG;
SQL>SELECTTHREAD#,LOW_SEQUENCE#,HIGH_SEQUENCE#FROMV$ARCHIVE_GAP;
2)如果有,则拷贝过来
3)手工的注册这些日志:
SQL>ALTERDATABASEREGISTERLOGFILE'路径';
四.指定日志发送对象
1.VALID_FOR属性指定传输及接收对象
LOG_ARCHIVE_DEST_n参数中的VALID_FOR属性,用来指定传输的内容。从字面理解VALID_FOR就是基于那谁有效,该属性有两个参数值需要指定:REDO_LOG_TYPE和DATABASE_ROLE,我们基本上可以将其理解为:发送指定角色生成的指定类型的日志文件,该参数的主要目的是为了确保,一旦发生角色切换操作后数据库的正常运转。
其中,REDO_LOG_TYPE和DATABASE_ROLE两个参数可供选择的参数值如下:
REDO_LOG_TYPE:可设置为ONLINE_LOGFILE、STANDBY_LOGFILE、ALL_LOGFILES。
DATABASE_ROLE:可设置为PRIMARY_ROLE、STANDBY_ROLE、ALL_ROLES。
注意:VALID_FOR参数默认值是:VALID_FOR=(ALL_LOGFILES,ALL_ROLES)。
推荐手动设置该参数而不要使用默认值,在某些情况下默认的参数值不一定合适,如逻辑Standby在默认情况下就处于OPENREADWRITE模式,不仅有REDO数据而且还包含多种日志文件(OnlineRedologs、ArchivedRedologs及StandbyRedologs)。
默认情况下,逻辑Standby数据库生成的归档文件和接收到的归档文件在相同的路径下,这既不便于管理,也极有可能带来一些隐患。建议对每个LOG_ARCHIVE_DEST_n参数设置合适的VALID_FOR属性。本地生成的归档文件和接收到的归档文件最好分别保存于不同路径下。
2.通过DB_UNIQUE_NAME属性指定数据库
DB_UNIQUE_NAME属性是10g版本新增加的一个关键字,在之前版本并没有这一说法。该属性的作用是指定唯一的Oracle数据库名称,也正因有了DB_UNIQUE_NAME,REDO数据在传输过程中才能确认传输到DBA希望被传输到的数据库上。
当然要确保REDO数据被传输到指定服务器,除了在LOG_ARCHIVE_DEST_n参数中指定正确DB_UNIQUE_NAME属性之外,还有一个初始化参数LOG_ARCHIVE_CONFIG也需要进行正确的配置。该参数除了指定DataGuard环境中的唯一数据库名外,还包括几个属性,用来控制REDO数据的传输和接收:
SEND:允许数据库发送数据到远端。
RECEIVE:允许Standby接收来自其他数据库的数据。
NOSEND,NORECEIVE:自然就是禁止喽。
例如,设置Primary数据库不接收任何归档数据,可以做如下的设置:
LOG_ARCHIVE_CONFIG='NORECEIVE,DG_CONFIG=(PRI,ST)'
如果做了如上的设置,如果该服务器发生了角色切换,那它也没有接收REDO数据的能力。
五.DataGuard环境应配置的初始化参数
下列参数为Primary角色相关的初始化参数 |
|
DB_NAME |
注意保持同一个DataGuard中所有数据库DB_NAME相同 例如:DB_NAME=Dave |
DB_UNIQUE_NAME |
为每一个数据库指定一个唯一的名称,该参数一经指定不会再发生变化,除非DBA主动修改它 例如:DB_UNIQUE_NAME=DavePre |
LOG_ARCHIVE_CONFIG |
该参数用来控制从远端数据库接收或发送REDO数据,通过DG_CONFIG属性罗列同一个DataGuard中所有DB_UNIQUE_NAME(含Primary数据库和Standby数据库),以逗号分隔,SEND/NOSEND属性控制是否可以发送,RECEIVE/NORECEIVE属性控制是否能够接收 例如:LOG_ARCHIVE_CONFIG='DG_CONFIG=(DavePre,DaveDG)' |
LOG_ARCHIVE_DEST_n |
归档文件的生成路径。该参数非常重要,并且属性和子参数也特别多(可以直接查询Oracle官方文档。DataGuard白皮书第14章专门介绍了该参数各属性及子参数的功能和设置)。例如: LOG_ARCHIVE_DEST_1='LOCATION=l:/oracle/oradata/DaveVALID_FOR=(ALL_LOGFILES,ALL_ROLES)DB_UNIQUE_NAME=DavePre' |
LOG_ARCHIVE_DEST_STATE_n |
是否允许REDO传输服务传输REDO数据到指定的路径。该参数共拥有4个属性值,功能各不相同。 |
REMOTE_LOGIN_PASSWORDFILE |
推荐设置参数值为EXCLUSIVE或者SHARED,注意保证相同DataGuard配置中所有DB服务器SYS密码相同 |
以下参数为与Standby角色相关的参数(建议在Primary数据库的初始化参数中也进行设置,这样即使发生角色切换,新的Standby也能直接正常运行) |
|
FAL_SERVER |
指定一个Net服务名,该参数值对应的数据库应为Primary角色。当本地数据库为Standby角色时,如果发现存在归档中断的情况,该参数用来指定获取中断的归档文件的服务器 例如:FAL_SERVER=DavePre 提示:FAL是FetchArchivedLog的缩写 FAL_SERVER参数支持多个参数值的哟,相互间以逗号分隔 |
FAL_CLIENT |
又指定一个Net服务名,该参数对应数据库应为Standby角色。当本地数据库以Primary角色运行时,向参数值中指定的站点发送中断的归档文件 例如:FAL_CLIENT=DaveDG FAL_CLIENT参数也支持多个参数值,相互间以逗号分隔。 |
DB_FILE_NAME_CONVERT |
Standby数据库的数据文件路径与Primary数据库数据文件路径不一致时,可以通过设置DB_FILE_NAME_CONVERT参数的方式让其自动转换。该参数值应该成对出现,前面的值表示转换前的形式,后面的值表示转换后的形式 例如:DB_FILE_NAME_CONVERT='f:/oradata/DavePre','l:/oradata/DaveDG' |
LOG_FILE_NAME_CONVERT |
使用方式与上相同,只不过LOG_FILE_NAME_CONVERT专用来转换日志文件路径 例如: LOG_FILE_NAME_CONVERT='f:/oradata/DavePre','l:/oradata/DaveDG' |
STANDBY_FILE_MANAGEMENT |
如果Primary数据库数据文件发生修改(如新建、重命名等)则按照本参数的设置在Standby数据库中作相应修改。设为AUTO表示自动管理。设为MANUAL表示需要手工管理 例如:STANDBY_FILE_MANAGEMENT=AUTO |
对于归档失败的处理,LOG_ARCHIVE_DEST_n参数有几个属性,可以用来控制归档过程中出现故障时应该采取的措施。
1.REOPEN指定时间后再次尝试归档
使用REOPEN=seconds(默认为300秒)属性,在指定时间重复尝试向归档目的地进行归档操作,如果该参数值设置为0,则一旦失败就不会再尝试重新连接并发送,直到下次REDO数据再被归档时会重新尝试。
例如,设置REOPEN为100秒:
LOG_ARCHIVE_DEST_2='SERVICE=DavePrimaryLGWRASYNCREOPEN=100'
2.ALTERNATE指定替补的归档目的地
ALTERNATE属性定义一个替补的归档目的地,所谓替补就是一旦主归档目的地因各种原因无法使用,则临时向ALTERNATE属性中指定的路径写。
例如:
LOG_ARCHIVE_DEST_1='LOCATION=/disk1ALTERNATE=LOG_ARCHIVE_DEST_2'
LOG_ARCHIVE_DEST_STATE_1=ENABLE
LOG_ARCHIVE_DEST_2='LOCATION=/disk2'
LOG_ARCHIVE_DEST_STATE_2=ALTERNATE
上述参数设置归档路径为/disk1,当/disk1路径下无法成功归档时,自动尝试向/disk2路径下归档文件。
从功能上来看,REOPEN与ALTERNATE是有一定重复的,不过需要注意一点,REOPEN属性比ALTERNATE属性的优先级要高,如果你指定REOPEN属性的值>0,则LGWR(或ARCn)进程会首先尝试向主归档目的地写入,直到达到最大重试次数,如果仍然写入失败,才会向ALTERNATE属性指定的路径写。
3.MAX_FAILURE控制失败尝试次数
用REOPEN指定失败后重新尝试的时间周期,MAX_FAILURE则控制失败尝试的次数。
例如,设置LOG_ARCHIVE_DEST_1在本地归档文件时,如果遇到错误,则每隔100秒尝试一次,共尝试不超过3次,设置如下:
LOG_ARCHIVE_DEST_1='LOCATION=E:/ora10g/oradata/jsspdg/REOPEN=100MAX_FAILURE=3'
六.物理Standby和逻辑Standby的区别
Standby数据库类型分为两类:物理Standby和逻辑Standby。
1.物理Standby
我们知道物理Standby与Primary数据库完全一模一样,DG通过REDO应用来维护物理Standby数据库。
通常在物理Standby没有执行REDO应用操作的时候,可以将物理Standby数据库以READONLY模式打开,如果数据库中指定了FlashbackArea的话,甚至还可以被临时性的置为READWRITE模式,操作完之后再通过FlashbackDatabase特性恢复回READWRITE前的状态,以便继续接收Primary端发送的REDO并应用。
REDO应用。物理Standby通过REDO应用来保持与Primary数据库的一致性,所谓的REDO应用,实质是通过Oracle的恢复机制,应用归档文件(或StandbyRedologs文件)中的REDO数据。恢复操作属于块对块的应用。如果正在执行REDO应用的操作,Oracle数据库就不能被Open。
READONLY模式打开。以READONLY模式打开后,可以在Standby数据库执行查询或备份等操作(变相减轻Primary数据库压力)。此时Standby数据库仍然能够继续接收Primary数据库发送的REDO数据,不过并不会应用,直到Standby数据库重新恢复REDO应用。
也就是说在READONLY模式下不能执行REDO应用,REDO应用时数据库肯定处于未打开状态。如果需要的话,你可以在两种状态间转换,如先应用REDO,然后将数据库置为READONLY状态,需要与Primary同步时再次执行REDO应用命令,切换回REDO应用状态。呵呵,人生就是循环,数据库也是一样。
提示:Oracle11g版本中增强物理Standby的应用功能,在11g版本中,物理Standby可以在OPENREADONLY模式下继续应用REDO数据,这就极大地提升了物理Standby数据库的应用场合。
READWRITE模式打开。如果以READWRITE模式打开,那么Standby数据库将暂停从Primary数据库接收REDO数据,并且暂时失去灾难保护的功能。当然,以READWRITE模式打开也并非一无是处,如你可能需要临时调试一些数据,但又不方便在正式库中操作,那就可以临时将Standby数据库置为READWRITE模式,操作完之后将数据库闪回到操作前的状态(闪回之后,DataGuard会自动同步,不需要重建物理Standby,不过如果从另一个方向看,没有启动闪回,那就回不到READWRITE前的状态了)。
物理Standby特点如下:
(1)灾难恢复及高可用性。物理Standby提供了一个健全、高效的灾难恢复,以及高可用性的解决方案。更加易于管理switchover/failover角色转换及在更短的计划内或计划外停机时间。
(2)数据保护。使用物理Standby数据库,DG能够确保即使面对无法预料的灾害也能够不丢失数据。前面也提到物理Standby是基于块对块的复制,因此与对象、语句无关,Primary数据库上有什么,物理Standby数据库端也会有什么。
(3)分担Primary数据库压力。通过将一些备份任务、仅查询的需求转移到物理Standby数据库,可以有效节省Primary数据库的CPU及I/O资源。
(4)提升性能。物理Standby所使用的REDO应用技术使用最底层的恢复机制,这种机制能够绕过SQL级代码层,因此效率最高。
2.逻辑Standby
逻辑Standby也要通过Primary数据库(或其备份,或其复制库,如物理Standby)创建,因此在创建之初与物理Standby数据库类似。不过由于逻辑Standby通过SQL应用的方式应用REDO数据,因此逻辑Standby的物理文件结构,甚至数据的逻辑结构都可以与Primary不一致。
与物理Standby不同,逻辑Standby正常情况下是以READWRITE模式打开,用户可以在任何时候访问逻辑Standby数据库,就是说逻辑Standby是在OPEN状态执行SQL应用。同样有利也有弊,由于SQL应用自身特点,逻辑Standby对于某些数据类型及一些DDL/DML语句会有操作上的限制。可以在视图DBA_LOGSTDBY_UNSUPPORTED中查看不支持的数据类型,如果使用了这种数据类型,则不能保证数据库完全一致。
逻辑Standby的读写打开可以使它做报表系统,这样减轻系统的压力。
除了上述物理Standby中提到的类似灾难恢复、高可用性及数据保护等特点之外,逻辑Standby还有下列一些特点:
(1)有效地利用备机的硬件资源。除灾难恢复外,逻辑Standby数据库还可用于其他业务需求。如通过在Standby数据库创建额外的索引、物化视图等提高查询性能并满足特定业务需要;又如创建新的SCHEMA(该SCHEMA在Primary数据库端并不存在),然后在这些SCHEMA中执行那些不适于在Primary数据库端执行的DDL或者DML操作等。
(2)分担Primary数据库压力。逻辑Standby数据库可以在保持与Primary同步时仍然置于打开状态,这使得逻辑Standby数据库能够同时用于数据保护和报表操作,从而将主数据库从报表和查询任务中解脱出来,节约宝贵的CPU和I/O资源。
(3)平滑升级。可以通过逻辑Standby来实现如跨版本升级,为数据库打补丁等操作。应该说应用的空间很大,而带来的风险却很小(前提是如果你拥有足够的技术实力。另外虽然物理Standby也能够实现一些升级操作,但如果跨平台的话恐怕就力不从心了,所以此项没有作为物理Standby的特点列出),我个人认为这是一种值得可行的在线的滚动的平滑的升级方式,如果你的应用支持创建逻辑Standby的话。
七.Log应用服务(LogApplyServices)
DataGuard通过应用REDO维持Primary数据库与各Standby数据库之间的一致性,在后台默默无闻地支撑着的就是传说中的Log应用服务。Log应用服务又分以下两种方式:
REDO应用:物理Standby数据库专用,通过介质恢复的方式保持与Primary数据库的同步。
SQL应用:逻辑Standby数据库专用,核心是通过LogMiner分析出SQL语句在Standby端执行。
因此物理Standby在应用REDO数据时必须是MOUNT状态,而逻辑Standby则是以READWRITE模式打开并应用REDO数据,不过被维护的对象默认处于只读状态,无法在逻辑Standby端直接修改。
7.1Log应用服务配置选项
默认情况下,Log应用服务会等待单个归档文件全部接收之后再启动应用,如果Standby数据库配置了StandbyRedologs,就可以打开实时应用(Real-TimeApply),这样DataGuard就不需要再等待接收完归档文件,只要RFS进程将REDO数据写入StandbyRedologs,即可通过MRP/LSP实时写向Standby数据库。
7.1.1.REDO数据实时应用
启动实时应用的优势在于,REDO数据不需要等待归档完成,接收到即可被应用,这样执行角色切换时,操作能够执行得更快,因为日志是被即时应用的。
要启动实时应用也简单,前提是Standby数据库端配置了StandbyRedologs。
物理Standby要启用实时应用,要在启动REDO应用的语句后附加USINGCURRENTLOGFIE子句,例如:
SQL>ALTERDATABASERECOVERMANAGEDSTANDBYDATABASEUSINGCURRENTLOGFILE;
逻辑Standby要启用实时应用,只需要在启动REDO应用的语句后附加IMMEDIATE子句即可,例如:
SQL>ALTERDATABASESTARTLOGICALSTANDBYAPPLYIMMEDIATE;
7.1.2.REDO数据延迟应用
有实时就有延迟,某些情况下你可能不希望Standby数据库与Primary太过同步,那就可以在Primary数据库端发送REDO数据的相应LOG_ARCHIVE_DEST_n参数中指定DELAY属性(单位为分钟,如果指定了DELAY属性,但没有指定值,则默认是30分钟)。
注意:该属性并不是说延迟发送REDO数据到Standby,而是指明归档到Standby后,开始应用的时间。
例如:设置LOG_ARCHIVE_DEST_3的DELAY属性为15分钟:
SQL>ALTERSYSTEMSETLOG_ARCHIVE_DEST_3='SERVICE=DavePrimaryARCHVALID_FOR=
(ONLINE_LOGFILES,PRIMARY_ROLE)DB_UNIQUE_NAME=DaveDELAY=15';
不过,如果DBA在启动REDO应用时指定了实时应用,那么即使在LOG_ARCHIVE_DEST_n参数中指定了DELAY属性,Standby数据库也会忽略DELAY属性。
另外,Standby端还可以在启动REDO应用时,通过附加NODELAY子句的方式,取消延迟应用。
物理Standby可以通过下列语句取消延迟应用:
SQL>ALTERDATABASERECOVERMANAGEDSTANDBYDATABASENODELAY;
逻辑Standby可以通过下列语句取消延迟应用:
SQL>ALTERDATABASESTARTLOGICALSTANDBYAPPLYNODELAY;
一般设置延迟应用的需求都是基于容错方面的考虑,如Primary数据库端由于误操作,数据被意外修改或删除,只要Standby数据库尚未应用这些修改,你就可以快速从Standby数据库中恢复这部分数据。不过自Oracle从9i版本开始提供FLASHBACK特性之后,对于误操作使用FLASHBACK特性进行恢复,显然更加方便快捷,因此DELAY方式延迟应用已经非常少见了。
7.2应用REDO数据到Standby数据库
7.2.1.物理Standby应用REDO数据
物理Standby启动REDO应用,数据库要处于MOUNT状态或是OPENREADONLY状态,启动REDO应用的命令相信大家已经非常熟悉了。
前台应用:
SQL>ALTERDATABASERECOVERMANAGEDSTANDBYDATABASE;
语句执行完成后,不会将控制权返回到命令行窗口,除非你手动中止应用。在这种情况下如果还需要对数据库进行操作,只能新开一个命令行连接,在Oracle8i刚推出Standby特性时(那时不叫DataGuard),只提供了这种方式。
后台应用:
SQL>ALTERDATABASERECOVERMANAGEDSTANDBYDATABASEDISCONNECT;
这是现在比较通用的方式,语句执行完后,控制权自动返回到当前的命令行模式,REDO应用以后台进程运行。
启动实时应用,附加USINGCURRENTLOGFILE子句即可:
SQL>ALTERDATABASERECOVERMANAGEDSTANDBYDATABASEUSINGCURRENTLOGFILE;
如果要停止REDO应用,执行下列语句即可:
SQL>ALTERDATABASERECOVERMANAGEDSTANDBYDATABASECANCEL;
7.2.2.逻辑Standby应用REDO数据
SQL应用的原理是将接收到的REDO数据转换成SQL语句在逻辑Standby数据库端执行,因此逻辑Standby需要启动至OPEN状态。
(1)启动SQL应用。逻辑Standby数据库启动SQL应用没有前、后台运行之说,语句执行完之后,控制权就会自动返回当前命令行窗口。
要启动SQL应用,直接执行下列语句即可:
SQL>ALTERDATABASESTARTLOGICALSTANDBYAPPLY;
如果要启动实时应用,附加IMMEDIATE子句即可,例如:
SQL>ALTERDATABASESTARTLOGICALSTANDBYAPPLYIMMEDIATE;
(2)停止SQL应用,如:
SQL>ALTERDATABASESTOPLOGICALSTANDBYAPPLY;
由于是执行SQL语句的方式应用REDO数据,因此上述语句的执行需要等待当前执行的SQL触发的事务结束,才能真正停止REDO应用的状态。
如果不考虑事务执行情况,马上停止REDO应用,可以通过下列的语句来完成:
SQL>ALTERDATABASEABORTLOGICALSTANDBYAPPLY;
注:整理自张晓明《大话OracleRAC》和李丙洋《涂抹Oracle》