1.什么是持续数据保护(CDP)?
连续数据保护技术可像录像机一般,持续记录磁盘驱动器过去每个时间点下的状态,因此可摆脱传统数据保护的还原点概念,提供无限制的还原精细度。该技术打破了传统备份周期概念,消除备份窗口束缚。
2.有哪几类部署架构?
CDP有三种不同的部署架构,分别是主机端部署架构、网络端部署架构、储存端部署架构,三种架构都有其不同的优点,以下仔细为你说明(见第九题答案)。
3. 市场上有哪些CDP产品?
目前台湾市场上最主要的CDP产品便是DataCore Traveller、EMC RecoverPoint、IBM TSM FastBack与FalconStor CDP等4款。
4.上述四款产品有哪些异同?
(1)DataCore Traveller CPR
Traveller的CDP功能,是建立在DataCore SANSymphony储存虚拟化平台上的一种延伸应用,可为前端服务器指定磁盘区提供连续、无还原时间点限制的还原能力。
(2)EMC RecoverPoint/SE 3.0
EMC RecoverPoint可分标准版与SE两种版本,SE版是与Clariion储存设备搭售的版本。依应用环境又可分为针对本地端的CDP、跨广域网络的CRR,以及兼顾本地端与异地端的CLR三种版本,其建置架构弹性大,平台与应用程序支持广泛。
(3)FalconStor CDP
FalconStor CDP原本是复制结合快照的数据保护产品,其最新版本添加了连续数据保护功能,可连续撷取受保护磁盘的写入I/O,并提供不受时间点限制的任意还原能力。
(4)IBM TSM FastBack
TSM FastBack的架构与传统备份软件相同,除了传统的时间驱动排程机制外,还可提供连续数据保护(CDP)功能,提供无时间点限制的还原能力。
5.持续数据保护与传统备份机制异同?
传统的备份机制是一天产生一份复本,还原点是以「天」为计算单位,若原始数据发生损坏,需使用复本还原时,用户必须以「天」为单位来选择还原点,也将损失以「天」为单位的数据量;磁盘快照则可每隔数小时产生一份复本,还原点可达小时等级,用户可以小时为单位来选择还原时间点。
而CDP产品则能持续追踪与记录数据的「每次」异动状态,因此能提供无限制的还原能力,用户可将数据还原到过去任何一个时间点,选择的精细度甚至可达秒以下。持续数据保护(CDP)是迄今出现过还原点选择弹性最大的数据保护产品,摆脱保护周期的既定概念。
CDP 与传统数据保护机制最大的差异,便是启动机制的不同。备份或快照都是藉由时间点来作为启动作业的机制,使用者必须周期性的启动备份或快照,以便制作复本,因此当需要还原时,数据所能回复的状态也会受到备份周期设定的限制,使用者只能还原到启动备份作业的那几个时间点。
而CDP则是以系统的I/O活动来作为启动机制,透过持续地追踪系统磁盘区块的状态,CDP可实时地捕捉并复制应用程序对磁盘区块的每笔写入动作,并记录每个动作的时间,从而完整保存了系统存取变动历程。因此这也允许使用者将数据回复到指定的任一时间点状态,从而完全取消了备份周期的限制。
换句话说,传统备份与快照可比拟成照相机,记录的是数据在某个时间点下的状态,即使多做几次备份或快照,也只是得到数据在一个个不同时间点下的状态;而CDP则类似摄影机的录像,可记录数据在过去一段时间内的「变动历程」,用户可像录像倒带一样,任意将数据倒回任一个时间点。
6.CDP必须具备哪些特性?
根据SNIA的定义,CDP具备以下三个特征:
(1�{数据的更动必须连续的被记录与追踪。
(2)所有数据的变化历程都被保存在与主储存地点不同的独立地点。
(3)资料还原点(Recovery point objectives,RPO)是任意的。
(1)和(3)规定的是CDP基本特性,而且必须先要有(1)的对数据异动的连续追踪与记录,才能达到(3)的任意还原点目的。
(2)则是数据保护产品的基本要求,也就是复本必须独立保存,而不能与主储存放在一起,以免产生连带损失的风险。
7.CDP 会带来哪些效益?
(1)无备份窗口的自动连续数据备份
不需要停机即可进行备份作业,数据的备份在系统执行存取动作时就已自动完成―数据写入磁盘的同时,也被复制到后端,因而消除了备份窗口。除了初始的安装设定外,后续其余的动作均可由CDP产品自动完成,也减轻了管理人员的负担。
(2)极精细的还原选择
用户可将指定的数据,如单一档案、档案夹、逻辑磁盘区(Volumn)或应用程序(如邮件、日志文件或数据库)回复到过去任何一个时间点下的状态。某些CDP产品除可让使用者以时间点作为还原的参照基准外,也可以依照事先定义的特殊事件标记作为还原基准。
(3)快速的还原作业
由于CDP是以磁盘为基础的技术,执行数据复制时是以异动的档案或者是区块来进行,因此只需很短的时间就能完成,还原时也能快速的将数据回存到原系统中。不过快速的备份与还原并不是CDP的主要卖点,其它以磁盘为基础的数据保护产品如远程复制或快照,都能达到类似的效果,因此CDP的真正价值是在于允许极精细、任意的还原点选择方面,这是目前其它技术均办不到的功能。
8. CDP需要哪几个组建的配合?
CDP的基本原理是「复制每笔写入数据,并附加时间标记(copy on write + time stamp)」,另外还要求复本必须独立存放。这样的运作原理将需要以下组件的配合:
(1)独立的复本储存区。
(2)用来监控来源端磁盘状态,并复制任何写入数据的处理机制。
(3)将写入数据的复本送往复本储存区的传输通道。
(4)为每笔数据复本加上时间戳记的机制。
其中(1)(3)是所有产品都相同的,独立的储存区即为CDP系统指定的磁盘区,而数据传输信道则通常是FC或iSCSI的SAN。
至于(4)也是所有产品都相同,每个产品架构中都会有一套负责为数据加上时间戳记,以及设定、管理用的主控服务器。通常是由CDP系统主程序所在的服务器负责,当服务器收到前端送来的数据会,就为每笔数据加上时间戳记,然后送到复本储存区个别存放。
因此会影响产品架构的就只有(2)―数据复制机制。
9.不同的复制机制构成了哪些不同架构的产品?
(1)主机端(Host-Based)
在需要CDP保护的服务器上安装代理程序(Agent),让代理程序负责监控磁盘与复制异动数据的工作。代理程序会捕捉每一笔写入磁盘的数据,复制一份并加上时间戳记后放入缓冲区,再透过网络送到CDP服务器指定的储存位置。
这种架构十分类似传统备份软件,限制也相同,每一台要保护的主机,都需个别安装代理程序,而代理程序除了会影响主机的效能外,还得考虑对不同作业平台与应用程序的兼容问题。
(2)网络端(Network-Based)
即利用储存局域网络设备来执行复制写入数据的动作。某些高阶的SAN交换器提供了复制功能,可将前端服务器经某一个端口写入后端磁盘的数据流,加以复制后,再送到指定的目的端磁盘区。因此CDP产品只要能支持这类SAN交换器的复制协议,如Cisco MDS 9000系列的SANTap、Brocade AP-7600B的SAS协议等,就能持续接收交换器取得的写入数据复本,CDP产品只需再为接收到的每笔写入数据加上时间戳记,并个别存放即可。
这种架构优点是数据复制作业与前端主机无关,无须部署代理程序,因此也没有兼容不同应用程序或操作系统的问题。而且一台交换器就能同时复制多台前端主机的写入数据,只要前端主机是透过这台交换器存取后端磁盘区即可。
但显然的,用户必须拥有这类SAN交换器才能享用这种架构带来的好处,而这类SAN交换器又十分昂贵,实际上导入的用户不多,因此能采用这种CDP部署架构的用户也很少。
(3)存储端(Storage-Based)
即利用储存设备来执行复制写入数据的动作。某些中高阶SAN磁盘阵列,或储存虚拟化平台均能提供复制功能,可为SAN环境的磁盘区建立镜像复本。
建立镜像群组后,磁盘阵列控制器或储存虚拟化平台,便会维持来源端磁盘与镜像磁盘的一致,来源端磁盘的任何写入数据,都会被复制到镜像磁盘上。利用这种特性,只要CDP产品能兼容于这种磁盘阵列或储存虚拟化平台的复制机制,就能充当镜像群组中接收复本数据的目的端设备,持续接收来源端磁盘的复制复本,而CDP产品只需为接收到的每笔写入数据,加上时间戳记并个别存放即可。
这种架构的优缺点与网络端架构相同,均为无代理程序架构,而限制也相同―用户必须拥有支持镜像机制的SAN储存设备,且CDP产品也须能支持这种SAN储存设备才行。
10.当前的CDP产品概况
过去3年来,台湾市场上先后曾出现过至少7款CDP产品,最早的是IBM的CDP for File,接下来陆续出现DataCore Traveller、EMC RecoverPoint、CA XOsoft Enterprise Rewinder、HP的Continuous Information Capture(CIC)、FalconStor的CDP与IBM TSM FastBack。
不过经过几年的发展后,目前市场上只剩下IBM、EMC、DataCore与FalconStor等4家厂商。CA台湾分公司大幅改组后,目前在XOsoft Enterprise Rewinder销售代理方面的状况仍不明朗。另外一些既有的产品也发生了变化,原来EMC第1版RecoverPoint与HP CIC同样都是来自Mendocino的技术,但Mendocino的产品后来被证明存在一些不足,因此EMC实际销售的RecoverPoint第2版以后产品,是改用Kashya的技术为核心,目前已持续更新到3.0 SP1版。
至于HP对CIC的态度仍然不明朗。该公司网站上仍能找到CIC产品讯息,但自从2007年4月发布的CIC 1.4版后,已有18个月没有后续更新。
至于FalconStor CDP原本是一套复制结合快照的产品,但在今年也纳入了CDP连续数据保护功能。而IBM则透过并购FilesX,取得了具备CDP功能的Xpress Restore产品线,补强了IBM原先功能有限的CDP for File。