数据保护方案的演进

前两天,在KVM虚拟化QQ群/微信群做过一个关于“数据保护方案的演进“的分享,反响还不错,文章发表在盛大游戏G云微信公众号;现整理成下文,方便有需要的朋友阅读

数据是除人以外一个企业最重要的资产,如何保证关键数据不丢失、保证业务连续性,一直是IT部门的重要KPI指标,数据保护自然也备受重视;从传统的手工操作,到之后基于主机的备份,然后是CDP技术、LAN-free,Server-free和Server-less,再到最近兴起的云备份,各种备份技术和概念也层出不穷、日新月异。今天就借此机会和大家一起聊聊各种备份技术,通过下文希望大家能了解各种备份技术的原理,优缺点。

先来看看什么是备份,什么是恢复及其评估指标RPO和RTO

什么是备份

备份是指为防止出现误操作、系统故障、自然灾害等导致数据丢失,而将全部或部分数据从生产主机的磁盘/阵列复制到其他的存储介质的过程。

什么是恢复

恢复是指生产系统发生故障后,用过去某个时间点的备份数据对生产数据进行修复的过程。

RPO和RTO

灾备系统的设计指标主要与灾备系统的数据恢复能力相关,最常见的两个指标是RPO和RTO:

RPO(Recovery Point Object),恢复点目标是指能把数据恢复到过去的哪一个时间点,描述的是企业能容忍的最大数据丢失量。

RTO(Recovery Time Object),恢复时间目标是指生产系统发生故障后“什么时候”可以恢复数据,描述的是企业能容忍的恢复时间。

弄清楚了相关概念和评估指标后,下面进入今天的主题 - 一起来学习下各种数据保护技术的原理和优缺点。

1. Host

将C盘的数据拷贝到D盘、U盘或者移动硬盘上,这种纯手工的备份方式相信大家都使用过,这就是Host备份的早期方式;更高级一点,为了避免手工误操作,可以通过定时任务、脚本实现定时备份;所以Host备份就是将生产服务器上的数据拷贝到备份介质中。

点评:操作简单、备份速度快,但各备份数据相互隔离,不利于共享,管理复杂,不适合现在大型的数据备份要求;RPO较大,RTO随数据量的增加而线性增长。

2. LAN

为解决Host备份的管理复杂性,LAN备份应运而生,在这种备份方式下,每个生产服务器上需要安装一个备份代理,并和备份服务器通过网络连接,备份服务器控制整个备份和恢复过程,备份时负责将数据通过网络传输到备份介质中,恢复时负责将数据通过网络传输到生产卷中。典型的组网方式如下:

数据保护方案的演进_第1张图片

最初的LAN备份仅支持文件系统、数据库等的定时备份/快照(RPO通常是几小时到几分钟),并没有解决RPO太大这一问题;之后一种被称为CDP的持续数据保护技术应运而生,该方案通过在文件系统层或者块设备层安装过滤驱动,实时捕获io,能够实现秒级快照,极大的缩小了RPO;

CDP技术是一种数据备份技术,所以它并没有减少RTO;为了提供更好的RTO,另一种瞬间恢复技术也就产生了,该方案通过iSCSI虚拟磁盘技术将备份介质中的数据直接挂载到生产服务器,供业务使用,能够实现秒级的RTO。

点评: 通过CDP持续数据备份技术和iSCSI挂载恢复技术,LAN备份不仅解决了Host备份中的共享及管理复杂问题,在RPO和RTO两项指标上也有良好表现。然而,LAN备份需要占用较多的网络资源及系统资源,对系统有较大的性能影响。

3. LAN-free

针对LAN备份存在的问题,衍生出了第三种备份模式:LAN-free备份,既然LAN备份需要占用太多的前端网络资源,那备份流量就不走前端网络好了,把备份介质接入后端的存储网络,通过存储网络完成数据备份,这就是LAN-free的由来。在该模式下,生产服务器上需要安装备份客户端(包含备份代理和备份介质管理模块),并和备份服务器通过网络连接,还是由备份服务器控制整个备份和恢复过程。备份时,备份服务器发送控制命令后,生产服务器上的备份客户端会自动将生产数据通过网络传输到备份介质中。典型的组网方式如下:

数据保护方案的演进_第2张图片

点评: LAN-free备份解决了LAN备份占用大量前端网络资源的问题,但是其对生产系统的和备份服务器的压力还是比较大。

4. Server-free

那有没有一种不占用生产系统资源就能完成数据备份的方案? 当然是有的,那就是Server-free。该方案通常与存储快照一起使用。备份时,由备份服务器通知存储创建快照,然后备份服务器挂载该快照卷,接着将快照数据拷贝到备份介质。由于快照时间非常短,所以对生产系统基本没有影响,所以称为Server-free,典型的组网方式如下:

数据保护方案的演进_第3张图片

点评: Server-free备份方式解放了生产服务器,可是备份服务器还生活在水深火热中;那有没有一种更彻底的解决办法呢?

5. Server-less

Server-less备份方式下,应用数据直接在源介质和备份介质之间传输。备份时,备份服务器只需要给生产服务器下发控制命令,源介质就会将数据通过网络传输到备份介质,不再需要备份服务器的介入,即可完成整个备份过程。典型的组网方式如下:

数据保护方案的演进_第4张图片

Server-less是怎么实现的呢? 主要有下面两种方式:

SCSI-3

借助SCSI-3命令,Extent Copy实现自动将数据备份到带库中;但是这种方式兼容性比较差,只能实现卷或者磁盘一级的备份,粒度较大,实际中使用很少。

NDMP

NDMP(网络数据管理协议)备份主要用在NAS设备上,是Server-less备份方案中常用的技术;NAS设备接收到NDMP送达的备份命令后,会自动将数据传输到备份介质。

点评: Server-less备份方案是占用资源最少、最经济的一种备份方式,基于NDMP技术的NAS备份是业界比较流行的一种备份实现方式,然而基于SCSI-3命令的SAN备份由于兼容性差,使用较少。

6. 云备份

到这里,传统的5种备份方案就介绍完了。下面简单聊聊最近2年国内新起的云备份,实际上2008年国外就出现了云灾备的概念,然而由于种种原因并没有普及;2013年左右云灾备开始引入国内,之后随着云计算的普及以及云存储价格的降低,2014开始一波有前瞻性的创业者和传统灾备企业开始涉足云灾备市场,云灾备开始以独立的业务形态出现。

继续之前,先来看看云备份的概念,云备份是指将位于客户主机上的数据通过网络传输备份到云端(存储服务提供商部署的异地数据中心),为恢复数据提供副本。

由云备份的概念,我们可以知道云备份是传统备份方式的延伸,它把传统备份方案中的备份服务器(备份介质)部署(延伸)到了云端,而客户端的备份技术依然有效,所以云备份的部署架构与传统备份方案的架构很很多相似之处,下面是一个例子(摘自Amazon云灾备官网):

更多云灾备的信息,可以参考Amazon云灾备官网, 以及阅读白皮书《使用AWS云服务建立灾难备份系统》

今天的分享就到这里,谢谢大家。

你可能感兴趣的:(rto,云备份,数据保护,LAN-Free,RPO)