oracle rac应急_干货满满!史上超全 Oracle ADG 部署架构、变化及应急处置思路

天下武功,唯快不破!

运维应急处置,唯快不破!

当内外部监管处罚力度,以分钟计算时,应急处置,分秒必争!

要实现快速应急处置,漂亮的将危机转化为赫赫战功,一个好架构设计,及清晰处置思路,会让你无往不胜!

注意,下面要讲的,是史上最全的ADG架构及变化,以及处置思路,全都来自实际生产运维的血泪总结!极具收藏和反复查阅价值!

1. 什么是 Oracle ADG

简单的说,ADG 是 Oracle 的一种容灾架构,可以确保在主站点(往往使用RAC架构)出现异常时,应急处置切换到备用 ADG 站点继续提供服务。

主备站点的距离,可以是同一个机房内、同一个数据中心内、同城、异地,都可以是实现ADG容灾结构。由于ADG往往配置为人工切换,而非自动切换模式。

因此人工切换的效率直接体现了应急处置的效果!

2. Oracle ADG 基础部署架构

以负载均衡+应用服务器+Oracle RAC(ADG)三层结构为例,基础架构如下图所示。

当 OracleRAC 主库出现问题的时候,通过 failover 切换到ADG库,继续提供服务。

但是仅仅一个failover命令是不够的,因为在这个过程当中,数据库对外服务的地址发生了改变,从原来主库的地址IP1改变为adg的地址IP2。

这时候实际上前端的应用服务器连接到数据库是失效的,无法对外提供正常服务。

对于数据库的地址,变或不变,相应带来架构规划上的变化,下面逐一说明。

3. 架构规划变化,及适用场景

变化1,RAC地址与ADG服务地址在同一网段

应急处置操作思路

failover切换到adg库

修改ADG库IP2为主库地址IP1

验证业务是否恢复

注意,这种情况下,如果应用服务器支持重连,那么就不需要再做任何操作,服务就会恢复正常。

如果应用服务器不支持重连操作,那么需要再做一次应用服务器的重启操作。

变化2,RAC和ADG处于不同网段,RAC与ADG,使用同一套应用服务器

应急处置操作思路

failover切换到ADG库

修改应用服务器数据源,修改为adg库的地址IP2

重启应用服务器集群连接ADG库

验证业务是否恢复

注意,如果应用服务器的数量较少,可以较快地完成应用服务器的重启,并恢复业务。

但是如果应用服务器的数量较多,又处于业务高峰期,那么在应用服务器逐个重启的过程当中,高并发的业务量会将已经重启的应用服务器压垮,从而导致服务始终不能恢复正常。

变化3,RAC和ADG处于不同网段,且各自部署一套应用服务器

应急处置操作思路

failover切换到ADG库

业务更换访问地址2

验证业务是否恢复

注意,如果业务人员数量规模较大,难以一一通知到更换访问地址,会影响处置效率。

变化4,RAC和ADG处于不同网段,各自部署一套应用服务器,以负载均衡统一业务访问地址。

应急处置操作思路

failover切换到ADG库

更改负载均衡指向,为ADG库的应用服务器集群

验证业务是否恢复

总结

思维导图如下

你可能感兴趣的:(oracle,rac应急)