Anchnet Logo
云管理服务解决方案平台工具云代理服务客户案例关于我们
    Anchnet Logo
    logo
    关于韦莱韬悦(Willis Towers Watson)
    韦莱韬悦(Willis Towers Watson)初创于1828年,总部设在伦敦,是一家全球领先的咨询、经纪和解决方案公司,帮助全世界的客户将风险转化为增长之路。韦莱韬悦拥有46,000多名员工,为140多个国家/地区的客户提供服务。韦莱在国内Azure上落地CAAC项目,由安畅协助进行CAAC项目的上线实施及运维。
    业务需求和面临的挑战:
    恢复目标明确但窗口有限以满足业务预设 RTO/RPO 为目标,需在突发中断时快速把核心系统恢复到最近可用时间点,并尽量缩短停机总时长。
    演练范围受限本次演练不包含对外部接口的连通性校验(客户环境限制),仍需保证内部系统的端到端可用与可验证路径(应用入口 → 应用 → 数据)。
    数据一致性与最小数据丢失数据库需支持时间点恢复(PITR),选取丢失前最近时间点,在可用性与一致性之间做好权衡。
    应用不可在原生产上直接还原为避免对生产造成风险,容器应用需在新建环境中部署并回切入口流量,确保可回退与可审计。
    入口、解析与访问链路复杂需要在应用程序网关(App Gateway + WAF)重建后端池、后端设置、监听器、规则,并完成 DNS/hosts 验证,确保公网/测试访问路径稳定。
    多团队协作数据库、平台运维与应用交付(镜像构建/配置更新)由不同团队承担,需要清晰的任务拆解与责任矩阵以降低协同风险。
    为什么选择安畅:
    1云灾备方法与模板沉淀具备在 Azure(世纪互联)环境下的 DR/BCP 交付经验,形成了演练步骤模板、切换/回退 SOP、证据留存清单,可直接复用到本次演练。
    2平台 + 应用"两条线并行"熟悉 Azure Database for MySQL 的"备份与还原"与 Azure 容器应用(ACA) 的新环境部署路径,能将"数据恢复""应用重建"并行推进,压缩总恢复时间。
    3入口与安全一体化对 App Gateway/WAF、后端池/设置/监听器/规则等流量治理组件有标准化落地经验,保证回切路径安全可控。
    4证据化与审计友好全过程输出操作记录、截图、时间戳、责任人与演练报告,便于对外审计与内控复盘;与甲方/第三方(如应用厂商)协同机制清晰。
    安畅解决方案
    数据层恢复(PITR)
    使用 Azure MySQL 的“备份和还原” 功能,按业务决定最近可用时间点进行恢复,生成新实例(避免影响原生产)。
    在恢复前后校验参数与账号权限,并输出恢复点、实例信息、校验清单与责任人(示例:屈工/安畅)。
    应用层重建(容器应用)
    在 Azure 容器应用(ACA) 新建目标环境与容器应用(而非在原生产直接还原),并按环境变量/密钥管理对接新数据库实例。
    由应用团队构建镜像并推送至容器注册表(Dockerfile、构建脚本、版本号与变更说明齐全),再在 ACA 编辑并发布新版本(示例责任人:张高/泛微)。
    入口与访问链路恢复
    在 App Gateway 侧依次创建后端池 → 后端设置 → 监听器 → 规则,确保健康探测与会话保持策略按生产标准配置。
    通过 DNS 解析(或临时本地 hosts)完成公网/测试访问验证,出具拨测与健康检查记录。
    配置更新与验证
    由应用团队同步配置改动(如数据库连接串、密钥),并通过蓝绿/灰度方式最小化风险。
    完成应用连通 + 基础功能 + 关键路径用例校验,并记录验证日志与截图。
    角色与分工(RACI 示例)
    数据恢复:安畅(屈工)
    容器环境部署:安畅(屈工)
    镜像构建/配置/应用发布:应用厂商(张震/泛微)
    统一协调与证据汇总:安畅 PM
    配置更新与验证
    《DR 演练步骤与时间线》《切换/回退 SOP》《PITR 恢复记录》《镜像构建与版本记录》《AppGW 配置清单》《DNS/拨测证明》《责任矩阵与签到表》《演练结果报告》。
    架构图
    架构图
    架构图
    带来的收益
    1达成既定 RTO/RPO通过“数据恢复 + 应用重建 + 入口回切”的并行动作与标准SOP,缩短恢复总时长,满足既定恢复目标。
    2最小化业务风险不在原生产直接还原,改为新环境重建→验证→回切,既确保可回退,又避免影响现网。
    3可复制的 DR 执行模板本次演练沉淀出“步骤脚本 + 配置清单 + 证据包”,后续可按相同方法在更多系统/更多环境快速复用。
    4过程可审计、结果可度量从“恢复点选择、镜像版本、入口配置、DNS 验证、责任人与时间戳”到“演练报告与问题清单”,全流程可追溯,支持内外部审计与持续改进。