阿里云 · HDR

背景

备份媒介的损坏、火灾、自然灾害等情况可能导致数据的永久丢失,造成难以承受的损失。

简介

混合云容灾服务(Hybrid Disaster Recovery, 简称 HDR)是一个高性能业务持续性解决方案,为企业关键业务提供低至秒级 RPO,分钟级 RTO 的容灾服务,极大缩短业务宕机时间,减少数据丢失。

核心问题

  • 应用级容灾:在数据中心故障或长时间系统维护作业时,在云上快速恢复应用运行,缩短业务停机时间,极大减少损失,保障业务连续性。
  • 数据级容灾:在数据中心备份数据库、虚拟机、物理机整机,备份数据存储在本地并自动上云,可在自建数据中心发生重大灾害时保障数据安全,同时提供高效的本地和云上的双重恢复。

业务类型

  • CDR:Continuous Data Replication,连续复制型容灾,解决企业关键应用的高标准容灾方案,提供秒-分级RPORTO 容灾。
  • SDR:Snapshot Data Replication,快照型容灾,解决企业核心应用的数据级容灾,可以对数据库、虚机、文件等实现多版本本地备份和自动备份上云,还可以实现应用服务器的小时级别 RPORTO 的整机容灾。

优点

  • 高性能:秒级 RPO,数据实时复制,分钟级 RTO,云上快速整机拉起
  • 低成本:免机房建设,云上只需要极少计算资源,主要消耗云盘
  • 可验证:一键演练,10分钟 完成验证
  • 易运维:全链路监控、故障自动告警

名词概念

概念 描述
故障转移 即容灾恢复,指您的 IDC 应用出现故障时,在阿里云上恢复应用的过程
故障恢复 当您的 IDC 内的环境恢复以后,将应用数据迁回自有 IDC 恢复应用运行的过程
RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量
RTO Recovery Time Objective(恢复时间目标),指故障发生时将应用恢复运行所需要的时间
混合云灾备一体机 阿里云推出具有容灾备份功能的一体机,适用于快照型容灾(SDR)与连续复制型容灾(CDR)
容灾恢复网关 适用于快照型容灾,是在阿里云上按需部署的容灾恢复服务器,它可以根据云上容灾存储中的备份数据,在 ECS 上恢复您的云下服务器整机、文件和应用数据。

GB/T 20988-2007标准:是中国国家标准化管理委员会制定的信息系统灾难恢复规范参考

img

方案

需求分析

数据保护和业务连续性对数据中心的意义重大,关键应用的故障或数据丢失会对您的业务造成重大损失。混合云容灾服务提供了三个层次的能力来保护数据,并确保业务连续性。

  • 本地备份

    混合云灾备一体机可以按照预设策略将服务器整机镜像和文件备份至本地,并在需要时恢复至虚拟化平台和物理平台,物理平台仅支持文件级恢复。

  • 异地备份

    服务器镜像和数据备份后会直接上传至阿里云灾备库,实现高可靠的云上异地备份。稳定的异地备份确保关键数据在本地数据中心发生火灾等极端情况下不丢失,在本地设施修复后恢复至本地。

  • 云上容灾

    为减少因应用故障导致的业务损失,当数据中心出现严重故障无法快速恢复时,混合云容灾服务可以高效地在 ECS 上快速恢复您的应用。

选型

img

CDR

原理:基于磁盘级实时数据复制技术,可以提供秒级-分钟级的 RPO/RTO

方案

img

类型

型号 支持服务器数量
Apsara DR100 < 20
Apsara DR200 < 50

SDR

原理:基于数据定时备份能力,提供了小时级-天级的 RPO/RTO,并且可以与业务网络流量错峰。

型号 支持服务器数量 支持的源数据量 备份恢复吞吐
HDR1000 < 20 < 10 TB 0.5 TB/小时
HDR2000 20~100 20 TB~100 TB 1 TB/小时

对比:

指标 CDR SDR
RPO 秒 - 分钟级 小时 - 天级
RTO 分钟级 小时级
多恢复点时限 30天 不限时长
网络要求 较高 较低
灾备一体机硬件 可选 必选
场景 案例 CDR SDR
关键应用秒级 - 分钟级 RPO、RTO 容灾 企业关键业务允许 5 分钟 RPO,宕机后要求 15 分钟内在云上拉起,恢复业务运行。 ×
重要应用小时级 RPO、 RTO 云容灾 企业内重要应用需要实现 24 小时 RPO、6 小时 RTO 的应用级容灾。 ×
关键应用数据级容灾 (本地+云双备份) 本地 Oracle、SQL Server 数据库,以及一系列重要文件需要实现多版本的本地备份,同时备份数据上云,实现数据级容灾。 ×
跨地域容灾 容灾系统部署在阿里云的两个地域中,当主系统发生故障时,业务系统切换到容灾系统。主系统和容灾系统部署在不同的地域,可靠性更高,有效避免了地域性灾害导致的系统故障。 ×
跨可用区容灾 支持业务的跨可用区(Zone)容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的 RTO/RPO 核心指标。 ×

网络环境

  • 数据中心到阿里云之间的网络:专线 / VPN / 公网
  • 混合云灾备一体机到被保护服务器之间的网络:备份一体机提供了双千兆、双万兆网卡供选择,可以根据备份恢复吞吐要求按需配置。

权限要求

  • OSS 权限
  • 云盘权限
  • VPC 权限

说明:如果用户已直接授予 AliyunHDRFullAccess 权限,则不需要再单独开通 OSSECSVPC 等权限。