根据最新的调查报告显示,2014年数据存储和备份收入有望突破44亿美元,越来越多的公司和家庭将采用这项技术。而根据EMC自己的预计,新成立的BRS(备份和恢复系统)部门2010年的年收入将达到15亿美金。显然,正是看到了数据备份恢复市场的广阔前景,和EMC在其中的优势,BRS部门才应运而生。而这一切也是因为收购Data Domain之后,EMC的备份恢复产品线变得相当完善才得以实现。
三步规划组成BRS产品线
据EMC备份和恢复系统部业务开发高级总监Rod Mathews介绍,为了实现备份数据的目的,以前用户是用卡车运送磁带实现迁移,用磁带实现备份目的,现在使用磁盘,用网络存储提供需求。这也是整个行业中备份出现的变化,EMC也随着这样的技术发展,满足用户在备份领域需求的演进。从基础的备份软件Networkers,到以磁盘备份为主涵盖了源端重复数据删除技术的Avamar和目标端重复删除技术的Data Domain,以及主要面向大型机备份领域的虚拟磁盘库EDL,这四大产品线构成了BRS部门以及EMC力图实现的数据保护愿景:当用户进行数据备份时,只需要备份经过修改的数据,重复数据都删除。
EMC备份和恢复系统部业务开发高级总监Rod Mathews
BRS(备份和恢复系统)部门整体规划
通过三步规划:用户需要备份和恢复时,能想到的是消除了重复数据的磁盘存储设备;站点数据需出现问题时,所有的数据在远程站点都有拷贝,当一个站点的数据破坏后,可以使用另外一个站点的数据;不需要用户恢复数据,而是让他们直接使用数据。最终使Data Domain和Avamar都是基于Networker平台之上提供,配合虚拟磁带库EDL形成一个完整的BRS产品线。
EMC力图实现的数据保护愿景
消除重复数据的磁盘存储
观察目前的磁带市场,做磁带的厂商几乎全都宣布在磁带业务方面有所下滑,越来越多用户把原来用磁带的部分改为用磁盘。虽然EMC在大型机的环境下也保留了被称之为虚拟磁盘库的磁盘备份产品EDL作为缓冲,预防磁带可能出现的错误。但是Mathews认为虚拟磁带库也有问题,通过它进行备份的只是最重要的数据,其他的数据仍然存在磁带中,即仍然面临着种种问题。为了能够在磁盘库上保存更多的数据,有些客户引入了重复数据删除技术。
之所以重复数据删除在几年前还属于一个新兴技术,但是现在已经成为主流技术。主要就是因为重复数据删除很好的降低了用户购买磁盘的成本。同时一些辅助技术,方便用户对磁盘管理,甚至对于一些磁盘的转送也提供了更大的便利。但是磁带并不会完全消失。对于一些非常长期的数据存储、保留,磁带还是有其重要性的。但是在数据的备份、恢复领域,磁带的位置在逐渐被磁盘替代。
在Mathews看来,虽然备份领域,几乎所有的存储、备份解决方案厂商都把重复数据删除作为销售产品的一部分,但只有EMC提供的是同类最佳产品,客户端提供Avamar,目标(存储)端提供Data Domain。
Data Domain为市场带来了巨大的变化。它是本地磁盘到远程磁盘的磁盘对磁盘数据复制。其中融入的重复数据删除技术,我们只对变更数据进行复制,从而能做到快速复制。对于用户而言,可以借由他们的广域网来实现从站点A到站点B的磁盘对磁盘的复制。它可以替代虚拟磁带文件库,这使得管理工作更简便,可以实现磁盘管理,而不是像以前那样还有更多的磁带管理。当然这当中还面临一个挑战,因为对于做备份的软件而言,有可能它不能感知到存储设备。EMC把技术进一步向前推,在18个月到两年前,把数据复制功能也融入备份软件。备份管理器能够通过自身的软件功能进行数据复制。它可以做多个远程数据拷贝,如果一个拷贝出了问题,会自动转到另外一个拷贝上。
跨全网络的重复数据删除和复制
从磁盘角度谈到备份软件,但是备份软件仍然是以磁带为中心的运作方式,Avamar所做的就改变了这一方式。Avamar可以在客户端设备消除重复数据,只把更改数据直接传送给存储设备,在这种情况下就不再需要Media Server的存在。所以Avamar可以安装在服务器上,也可以安装在笔记本电脑上,任何可以运行软件的计算设备上都可以运行。要实现客户端复制设备的高效,通过网络只是向存储设备发送修改数据。
所以EMC做的第一步是把Data Domain和Networker结合起来,下一步把Avamar和Data Domain结合在一起,这样就可以实现跨全网络的重复数据删除和复制的过程了。(注:在Data Domain之前,Avamar已经和Networker有了很好的整合)
然而,在笔者看来虽然Data Domain位于目标端,Avamar位于客户端,但基于二者都是从事重复数据删除这一工作,相互的重叠性不可避免,在三个产品整合之后,显然会增加用户的IT支出成本。对此,Mathews解释说,EMC会尽量在产品结构上进行调整。事实上,今天用户分别购买三个产品,有的功能是重复的,需要花两倍的钱购买同一个功能。而三个产品结合起来,应该能够提高用户的经济性。而且未来产品线的调整,也会保证用户现有产品受到保护,这主要是通过新推出的Boost功能来实现。通过Boost把不同的技术整合在一起,它能够把Data Domain上一些重复数据删除功能移到Networker上。现在所做的是把所有的服务器上的数据读写到Data Domain上。通过把这种重复数据删除的工作量,从Data Domain挪到了Networker的服务器上做,这样可以很好的提高Data Domain运转的速度。
使用了DD Boost之后,把一部分重复数据删除的工作量放在Media Server上做,因为上面运行的数据量变小,使得网络链接速度提高。有些用户会担心,把一些工作负载放在Media Server上,是否会导致Media Server过载,这无法避免。我们知道通常在Media Server上有很多CPU是用于做大量数据拷贝工作,如果能够消除重复数据拷贝的工作任务,就可以大幅降低CPU本身的运转负荷。这也就意味着一方面让Media Server承担了重复数据删除工作,另外一方面又降低了CPU工作量。所以可以实现Media Server 30%-40%的使用效率提高。因为削减了网络之间数据量,可以让用户使用千兆以太网,而不需要升级到万兆以太网。在Data Domain和Networker上只需要做软件升级,只是通过软件升级,整个网络,包括Media Server、Networker、Data Domain都可以实现效率的提高。所以DD Boost帮助解决了三条产品线整合可能出现的重叠问题。
增加DD Boost之后Data Domain产品提升备份效率提高50%
推动私有云发展 完整技术布局
然而这一切目前还只是EMC的愿景,据Mathews表示把这些产品(Data Domain、Avamar和Networker)完整的集成在一起需要五年的时间,Networker产品的集成整合将是第一步。目前EMC公司的整体战略重点都是推动私有云的建设,无论是在公共云还是在私有云中数据都需要备份,同时推动私有云建设的巨大动力就是网络。而BRS部门恰好是从这两方面都有力的促进了私有云的发展。
虽然在之前几年,我们发现EMC花费上百亿美金收购了几十家不同类别的厂商,当时看来,他们之间并没有必然的联系,业界更多的是疑惑EMC发展规划究竟如何。现在看来这一切都是有的放矢,几年间通过收购弥补自己在技术上的某项欠缺,从而得以在今天进行完整技术布局。同时,今年五大业务部门重新组建以及最近对Greenplum的收购,都表明这种技术布局并没有完全形成,现在看来的或许也只是EMC在规划自己庞大版图中雏形。