|
|
51CTO旗下网站
|
|
移动端

干货满满!史上超全 Oracle ADG 部署架构、变化及应急处置思路

当内外部监管处罚力度,以分钟计算时,应急处置,分秒必争!

作者:田元PAPA来源:高效运维|2020-07-20 15:34

天下武功,唯快不破!

运维应急处置,唯快不破!

当内外部监管处罚力度,以分钟计算时,应急处置,分秒必争!

要实现快速应急处置,漂亮的将危机转化为赫赫战功,一个好架构设计,及清晰处置思路,会让你无往不胜!

注意,下面要讲的,是史上最全的ADG架构及变化,以及处置思路,全都来自实际生产运维的血泪总结!极具收藏和反复查阅价值!

1. 什么是 Oracle ADG

简单的说,ADG 是 Oracle 的一种容灾架构,可以确保在主站点(往往使用RAC架构)出现异常时,应急处置切换到备用 ADG 站点继续提供服务。

主备站点的距离,可以是同一个机房内、同一个数据中心内、同城、异地,都可以是实现ADG容灾结构。由于ADG往往配置为人工切换,而非自动切换模式。

因此人工切换的效率直接体现了应急处置的效果!

2. Oracle ADG 基础部署架构

以负载均衡+应用服务器+Oracle RAC(ADG)三层结构为例,基础架构如下图所示。

当 OracleRAC 主库出现问题的时候,通过 failover 切换到ADG库,继续提供服务。

但是仅仅一个failover命令是不够的,因为在这个过程当中,数据库对外服务的地址发生了改变,从原来主库的地址IP1改变为adg的地址IP2。

这时候实际上前端的应用服务器连接到数据库是失效的,无法对外提供正常服务。

对于数据库的地址,变或不变,相应带来架构规划上的变化,下面逐一说明。

3. 架构规划变化,及适用场景

变化1,RAC地址与ADG服务地址在同一网段

应急处置操作思路

  • failover切换到adg库
  • 修改ADG库IP2为主库地址IP1
  • 验证业务是否恢复

注意,这种情况下,如果应用服务器支持重连,那么就不需要再做任何操作,服务就会恢复正常。

如果应用服务器不支持重连操作,那么需要再做一次应用服务器的重启操作。

变化2,RAC和ADG处于不同网段,RAC与ADG,使用同一套应用服务器

应急处置操作思路

  • failover切换到ADG库
  • 修改应用服务器数据源,修改为adg库的地址IP2
  • 重启应用服务器集群连接ADG库
  • 验证业务是否恢复

注意,如果应用服务器的数量较少,可以较快地完成应用服务器的重启,并恢复业务。

但是如果应用服务器的数量较多,又处于业务高峰期,那么在应用服务器逐个重启的过程当中,高并发的业务量会将已经重启的应用服务器压垮,从而导致服务始终不能恢复正常。

变化3,RAC和ADG处于不同网段,且各自部署一套应用服务器

应急处置操作思路

  • failover切换到ADG库
  • 业务更换访问地址2
  • 验证业务是否恢复

注意,如果业务人员数量规模较大,难以一一通知到更换访问地址,会影响处置效率。

变化4,RAC和ADG处于不同网段,各自部署一套应用服务器,以负载均衡统一业务访问地址。

应急处置操作思路

  • failover切换到ADG库
  • 更改负载均衡指向,为ADG库的应用服务器集群
  • 验证业务是否恢复

总结

思维导图如下

【编辑推荐】

  1. PyTorch官方教程书限时免费!500页内容带你上手最流行框架
  2. 让PyTorch更轻便,这款深度学习框架你值得拥有!GitHub 6.6k星
  3. 防止删库悲剧发生,这里有个Bash脚本测试框架,危险代码一测便知
  4. 架构师最常使用的5种架构模式及其适用场景分析
  5. 2020苹果Core ML框架三大更新:更多层类型、模型加密、基于CloudKit模型部署
【责任编辑:张燕妮 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

大数据安全运维实战

大数据安全运维实战

CDH+Ambari
共20章 | 大数据陈浩

91人订阅学习

实操案例:Jenkins持续交付和持续部署

实操案例:Jenkins持续交付和持续部署

微服务架构下的自动化部署
共18章 | freshman411

186人订阅学习

思科交换网络安全指南

思科交换网络安全指南

安全才能无忧
共5章 | 思科小牛

110人订阅学习

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO官微