摘要:当前,数据已经成为了企业的核心资产。而如果数据中心发生故障不仅会给企业带来巨大损失,甚至会直接迫使企业走向倒闭。对于企业而言,每一字节业务数据的丢失都是一场重大的灾难!那么,如何保证企业的核心数据资产不丢失,又如何保障业务不会因为灾难而中断服务?在本文中,相信阿里云混合云备份容灾方案能够解答你的问题。
以下内容根据演讲视频以及PPT整理而成。
本文主要分享的内容可以大致分为以下5个方面:
1.灾备建设的必要性
2.混合云灾备解决方案
3.应用场景
4.成功案例
5.混合云数据管理
一、灾备建设的必要性
数据中心宕机损失报告
如今,数据已经成为了企业的核心资产。在企业中,数据也变得越来越重要。根据第三方的统计,数据中心故障每分钟为企业带来损失近9000美元,而且随着时间的推移,数据中心宕机成本还在不断攀升。与此同时,根据Gartner的统计,在经历大型灾难而导致系统停运的公司中有40%倒闭,剩下的公司中也有33%在两年内破产。因为他们丢失了数据,必然的结果就是消失!所以,每一字节业务数据的丢失对企业都是一场重大的灾难!
数据中心安全挑战
可以通过如上图所示的统计报告看到,数据中心所面临的挑战可以说是无处不在。包括病毒、人为故障、人为逻辑错误,以及设备故障包括存储故障、数据中心的硬件服务器等故障,还有一些自然灾害等都有可能导致数据中心出现故障。
灾备的目的和关键指标
那么,为了应对这些故障,怎样才能保障数据中心的数据不会丢失或者损坏呢?这其实也就是灾备建设的主要目的。在完成了灾备建设之后,就能够保证数据的可靠性,同时增强业务的连续性,保证当数据中心遇到灾难的情况下,业务不会因此停止运行。而通过一系列的灾备建设工作,使得数据中心能够应对许多的故障和挑战,这样就能够提升企业的竞争力。而想要实现一个好的灾备方案,则有几个关键的指标,比如恢复时间点目标RPO、恢复时间目标RTO、灾备成本以及管理体系。RPO就是当发生故障时数据所能够恢复到的时间点,对于客户而言,当然是能够找越近的数据越好;RTO就是当发生故障导致业务不能运行情况下,重新使业务运行起来所花费的时间。而为了达到目的,无论是RPO还是RTO,都是与灾备成本是密切相关的,如果想要达到较好的RPO和RTO,那么灾备的成本就要高很多。因此,如何建设具有较高性价比的灾备建设方案也是应该考虑的地方。与此同时,对于灾备方案而言,也需要有相应的管理体系,能够保证在应对重大灾难的时候,业务能够在灾备中心运行起来,因此管理体系的建设也是非常重要的。
传统灾备中心的建设方案
传统灾备中心的建设方案是怎么做的呢?传统的灾备方案中,除了有自己的生产中心,还需要有一个容灾中心。在生产中心会有服务器,可能有一些硬件设备,比如存储、网络设备以及操作系统和数据库等,这时候生产中心就可以运行起来。而为了防灾,很多客户就需要建立一个容灾中心,而建立容灾中心需要实现物理位置的隔离,可能需要将容灾机房建立在同城异地,或者因为用户要求比较高,也可以直接将容灾机房建立在另外一个城市。这样就是建立一个物理的容灾中心,在物理的容灾中心中需要配置一系列的硬件和软件,保证当出现灾难的情况,生产中心不能运行时,容灾中心应该能够及时切换。因此,容灾中心的硬件建设成本以及维护成本就会比较高。
二、阿里云混合云灾备解决方案
混合云灾备解决方案
阿里云混合云灾备解决方案的大致设计如上图所示。图中左侧是用户自己的数据中心,数据中心可能是物理服务器、虚拟化环境、私有云甚至是其他的公共云。此时可以将客户的容灾中心放到客户的公共云上面,使用阿里云的基础设施来为客户提供灾备服务,这就是阿里云混合云灾备解决方案的大致思路。
传统灾备方案 VS 混合云灾备解决方案
那么阿里云混合云灾备解决方案和之前提到的传统灾备方案两者之间存在什么样的差别呢?其实,如果客户自建容灾中心,就需要一个专门的运维队伍,需要相应的物理设备包括服务器、网络以及存储等,而这些设备需要进行采购,之后还需要升级,有时候还需要扩容,这其实是非常复杂的。而将容灾中心放到阿里云上时,基础设施就交由阿里云来进行维护,这对于客户而言,就省去了设备和运维的复杂性。同时,阿里云的基础设施是高可靠的,也是经历了“双11”以及春运购票高峰流量的检验的。另外一个差别就是客户自己建立容灾中心时,可能随着业务的发展,可能数据需要扩容,计算能力也需要扩容,此时对于硬件扩容而言需要一个采购、安装以及调试的周期,这样的周期没有2到3个月是很难完成的。
而对于阿里云而言,无论是存储还是计算能力都是按需使用的,具有弹性的扩展能力,当用户需要扩容时可以直接下单,马上使用,扩容也非常方便。并且因为阿里云后台是很多台服务器以及存储设备形成的资源池,其可扩展性也是非常高的,可以支持海量资源的扩展。而自建容灾中心除了需要购买设备之外还需要建立机房,因此上线的时间是非常长的,而在阿里云上面使用阿里云的服务,从上线到开通服务再到开始使用,仅需要几分钟就可以完成。此外,用户自己实现容灾方案的成本肯定会远远高于阿里云所提供的容灾方案成本,将灾备方案放到阿里云上面可以帮助客户节约70%的成本。其实,建立灾备方案的目的是当发生故障时,希望业务能够尽快切换到容灾中心,或者数据能够尽快地从备份存储中恢复出来,那么可恢复性以及可切换的能力是非常重要的,因此需要定期地通过容灾演练校验备份的数据是否是可读的,此外,当故障发生时,容灾中心能否快速地接管业务,而对于传统灾备方案而言,自己实现容灾演练是非常耗时,而且成本非常大的。而在阿里云上,无论是计算资源还是存储资源都是按需使用的,并且支持海量扩展,因此客户想要使用云上的虚拟机服务器来做灾备演练都是可以的,可以实现按量使用和按需使用。因此,对于阿里云混合云灾备解决方案而言,灾备演练也是非常方便的。
混合云备份服务
阿里云混合云备份服务可以理解为在线备份服务。如上图所示,左侧是用户本地的数据中心,这里有物理机也有虚拟机,中间部分是阿里云云端的备份库,在备份库中可以存放阿里云的备份数据。对于客户而言,使用非常简单,只需要下载一个备份服务的客户端并安装在自己的物理机或者虚拟机上面,就可以实现把数据重新压缩之后备份到阿里云备份库里面。同时,阿里云混合云备份方案也支持将其他云的数据备份到阿里云上面。阿里云备份库依附于公共云的基础架构,天然就是多租户的,并且能够实现集中管控,因为很多的客户端可能分布在不同的城市以及不同的物理地方,而阿里云的基础设施是遍布全球的,而无论在哪里都可以用同一套备份策略实现数据的集中管控。此外,根据应用的不同可以分类备份库,分类备份库的好处就是有不同的业务需求时的策略可能是不一样的。之前提到云下的数据可以进行备份,而其实云上的数据也可以实现备份,因此数据备份是跨越了云上和云下的。还有一点,阿里云的基础设施是跨越了物理位置的,比如在国内就有多个可用区,在国外也有很多数据中心,备份库也能够实现跨区域的复制。而对于数据安全而言,混合云备份服务采用了端到端的数据加密,在源端开始就已经确保了无论是阿里云还是其他的任何人都无法解密用户数据。而且阿里云混合云备份服务所采用的变长重删算法非常高效,该算法可以针对于不同类型的应用数据自适应地得到最佳重删比例,对于目前使用客户而言可以轻松地达到30:1的重删比,这样一来客户上云的带宽限制就已经不再是非常重要的考虑因素了。
混合云备份服务的优势
混合云备份的优势主要有三点,第一点就是简单易用,对于一个客户而言,如果其想要使用混合云备份服务,只需要下载客户端并且开通服务就可以启动机器开始备份了,这样的方式相较于传统方式是非常简单易用的,因为传统的备份模式需要采购备份服务器,还需要管理备份存储和带宽等。而阿里云的混合云备份服务是在线备份服务,用户只需要开通备份服务就可以直接使用,并且备份服务的空间是即买即用的,方便扩展的。依托于阿里云的基础架构,客户能够很轻松地备份PB级别的数据。第二点优势就是高性价比,该方案平均能够达到30:1的重删压缩比,其实在很多客户的实际案例中,重删压缩比能够达到80:1甚至100:1。因为混合云备份是按照客户存储在阿里的混合云备份库里面的实际使用空间来收费的,比如用户有100TB数据,经过备份的重删压缩之后,最后只用了10TB的存储空间,那么就会按照10TB的存储空间来收费,因此较高的重删压缩比能够帮助客户节约使用成本。此外,重删压缩比较高则对于网络的需求也是比较低的,甚至很多情况下无需专线接入,只需要放在公网上就可以实现,因此可以节约网络的使用。而且具有了高效的重删压缩之后,备份窗口就会变得很短,将会大大地缩短备份所需要的时间,这样就能够为客户带来一个性价比极高的方案,并且同时能够实现快速备份。最后一点优势就是安全可靠,其实做数据备份就像是为数据买了一份保险,那么其最主要的目的就是当数据发生了逻辑错误或者物理损坏的时候,能够将数据从备份库里面找回来。如果把数据备份到磁带里面,而随着现代很多公司以及法律法规的要求是需要将数据保存3年5年甚至10年之久。这样一来,如果使用磁带或者磁盘做备份的情况下,对于介质的保护要求却是非常高的。那么如何保证当数据需要恢复的时候,能够从介质里面将数据恢复出来呢?其实阿里云混合云备份方案是建立在阿里云的公共云的基础设施之上的,能够提供高达12个9的备份数据可靠性,采用了端到端的数据加密校验,并且能够轻松实现备份数据跨区域复制保存。
混合云容灾服务
上面所提到的混合云备份服务主要是帮助客户找到备份的数据,如果数据出现了人为损坏、逻辑错误或者机械故障等,想要恢复到上一个时间节点的数据,这是备份的主要目的。而容灾服务则是当机房发生了灾难性故障的情况下,能够帮客户将业务系统在另外一个地方运行起来。将容灾中心运行在阿里云上面其实就可以大致如上图所示。图中左侧就是客户的数据中心,右边是阿里云的基础设施,在阿里云的客户数据中心中可以安装一台阿里云的混合云灾备一体机,当然也可以使用软件版本,直接装在虚拟机上面,这样可以将用户的文件、数据库以及虚拟机操作系统的镜像都备份到混合云灾备一体机里面,这就相当于一个本地的备份了,之后可以将这些备好的文件全部都推送到阿里云的云端灾备库里面。当然了,用户也可以设置策略,选择可以推送上云的文件。这样一来,在本地有一份备份拷贝,同时在云端也有一份备份拷贝。如果本地数据中心真的发生了灾难,那么本地数据中心的所有物理设备可能都没了,灾备一体机也无法工作的情况下,可以在阿里云启动云容灾恢复网关,在云上恢复出整机ECS或者应用数据,将推送到云端灾备库里面的数据库、文件以及操作系统等都调入到ECS里面,这样就能够在ECS里面恢复客户的应用,以此就能够实现当客户数据中心出现灾难性故障的时候,业务依旧能够在云上跑起来。
混合云灾备服务的优势
混合云灾备服务主要有这样的四个优势。首先,备份容灾一体集成,前面也提到了灾备一体机,这个灾备一体机可以是硬件的,也可以是软件的。用户的数据可以备份到灾备一体机里面,这就相当于是一个本地备份,另外还可以根据一定的策略和用户数据的重要性将数据推送到云端的灾备库,这样就有了一个云备份。此外,一些用户对于数据的要求是存储5年甚至10年以上,用户可以选择在混合云的灾备一体机里面将数据保留6个月,超过6个月之后就可以将数据保存到云端,以此来满足对于数据5到10年的保存需求,这是因为云端存储是海量扩展的,这就一个相对完整的数据备份方案。当数据中心受灾的情况下,用户可以在云端启动混合云容灾网关,能够将操作系统、数据库以及相应的数据恢复到ECS上面,并且将业务重新运行起来,这样就实现了整机的云容灾方案。此外,还能够实现客户的应用系统到云端的迁移,也就是将操作系统等直接备份到灾备一体机上面,灾备一体机能够接触到云端的数据库,这样就能够在ECS上面将操作系统全部恢复出来,这样实际上也是一个迁移的过程。综上所述,混合云容灾服务其实具有容灾、备份和迁移这三方面的功能。第二点就是支持多种主流平台,支持Windows和Linux操作系统,支持VMware、Hyper-V以及物理机,并且支持SQL Server、Oracle等数据库。与此同时,因为将容灾中心放到了阿里云上面,所以第三点优势就是性价比高,只需要传统容灾方案成本的30%,并且不需要对于容灾机房进行建设,并且当不使用或者不进行容灾演练的时候,云端的ECS是无需付费的,客户完全无需关心这部分费用,因此就能够降低很大的成本。此外,混合云灾备方案既支持硬件也支持纯软件部署。并且支持高效重删压缩,能够省空间,也省专线。最后一点优势就是安全可靠的,包括了数据加密以及容灾数据的多副本保存。此外,云端数据能够很方便地做演练和验证,确保容灾和备份数据在需要的时候能够及时恢复出来,所以也是一个高度安全可靠的方案。
阿里云与合作伙伴集成灾备方案
与此同时,阿里云也与一些合作伙伴传统的灾备方案进行了集成。因为企业的IT能力可能已经发展了很多年了,因此之前可能就已经有了一些备份和灾备方案,而如今公共云也发展得越来越成熟,因此可以将合作伙伴原有的灾备方案或者软件和阿里云公共云的资源进行结合,目前也已经和合作伙伴的技术方案打通了,这样一来客户无需改变自己的使用习惯,直接将灾备数据推送到阿里云上面即可。借助阿里云与合作伙伴集成灾备方案,用户不需要改变使用习惯,与此同时,计算等资源都是海量扩展的,可靠性也非常高。
混合云灾备解决方案
通过上述的介绍,大家也可以看到,阿里云整个混合云灾备解决方案能够应对很多的场景,包括云下数据到云上的备份,云下的应用到云上的容灾甚至迁移。此外还包括云上数据的保护,比如阿里云或者其他云上数据的虚拟机数据都能够实现跨云的保护;云上应用还可以实现跨区域的容灾,同时也能够实现跨云的应用和数据灾备。综上所述,阿里云的混合云灾备解决方案是非常完备的,在各种场景下都能够适用。
三、应用场景
混合云备份:云服务器数据备份
对于混合云备份而言,可以首先做云服务器的数据备份,包括阿里云上面ECS虚机的备份,也包含其他公共云的跨云备份,在这种情况下,备份的策略是非常非常灵活的,对于单个文件、单个目录都可以进行备份,因为业务需求不同,那么对于数据保护的要求也不同。比如有些业务的数据变化非常快也非常重要,因此需要每天进行备份,而另外一些业务数据变化不是很快,也不是很重要,因此可能仅需要每周或者每月做备份,对于云服务进行备份可以实现细颗粒度的备份和管理。此外,混合云备份的安装和使用都非常方便,对于云服务器而言,在云上面直接下载就可以将数据备份到本地灾备库,并且在阿里云的云服务器上面进行备份的速度是非常快的。而又因为具有高效的重删压缩算法,所以即便是跨云的数据备份也是非常快速的。
混合云备份:分支机构数据备份+跨区域备份容灾
混合云备份的另外一个常用场景就是分支机构的数据备份。比如企业有很多连锁店,这样如何实现数据的保护呢?这是很多中小型连锁机构所需要面对的问题,很难对于每一个分店都实现一个备份方案,很多门店的现实情况可能是使用U盘拷贝数据,这样一来数据的安全性就是一个很大的问题。对于分支机构的场景下,使用阿里云的混合云备份方案也是非常方便的,可以实现集中备份,也就是将各个分支机构的数据集中地备份到阿里云上来,这样就能够保证数据的可靠性,并且保证每次数据备份服务都能够进行集中的监管,进而提供高可靠的数据安全性,同时也能够降低备份管理的复杂度,实现统一的备份管理,还能够实现备份数据的跨区域容灾和复制。
混合云容灾:本地备份+云上容灾
混合云容灾的第一个常见使用场景就是本地备份+云上容灾。比如客户具有一个本地数据中心,而有多个应用系统,针对这样的场景,可以在本地数据中心里面安装一台混合云灾备一体机,这样就可以将应用系统的操作系统、数据库以及数据文件等都备份到灾备一体机里面,之后再将这些数据复制到云端的数据灾备库中,这样就实现了本地和云上双备份。当数据中心发生了灾难,就可以在云上启动备份网关以及ECS,然后将应用系统从ECS上恢复出来,在云上面将业务运行起来,也就是相当于将用户的数据中心切换到了阿里云上面,这样就是本地备份+云上容灾的解决方案。
混合云容灾:大数据容灾
其次,目前混合云容灾也会经常用于大数据容灾的场景之下。比如用户在云下的Hadoop集群中建立了5个应用,而相应的应用阿里云的基础设施也能够运行大数据应用,当本地大数据中心出现了灾难性故障的时候,能够将运行在本地Hadoop集群的应用切换到云上去,这样一来5个应用都能够在云上跑起来,使得RPO能够接近0,这就是混合云容灾的大数据容灾解决方案。
四、成功案例
案例1:混合云备份服务 某广告公司
某广告公司在华东区有不少的分店,分布在上海、杭州、苏州以及南京等城市。因为其有很多广告视频数据需要保留下来,同时在必要的时候还需要进行查询,而因为广告涉及的文件是非常大的,首先本地存储一般都放不下,另外还需要存放多版本的历史文件,因此需要一个集中的备份方案。
如上图所示的就是阿里云为该客户设计的混合云备份方案。客户的各个分店可以将数据文件以及虚拟机镜像等都就近地备份到相应的备份库中去,一些很重要的数据还能够实现跨城市、跨区域备份库之间的复制。而广告公司的业务扩展是非常非常快的,因此数据增长也非常快,而由于数据备份方案是基于阿里云的存储池的,因此具有海量的存储空间,还可以实现按需扩容。客户在使用阿里云的备份服务之后,重删压缩就能够达到30:1,而实际上某些备份作业的重删压缩比能够达到非常高的数值,比如80:1甚至100:1,这样就能够帮助客户节约很多成本。
案例2:混合云容灾案例 某制造业工厂
这个案例是对一个上海的制造业工厂所做的混合云容灾解决方案。这个工厂一方面有自己的财务系统、CMI系统以及生产线,并且具有一个本地的机房。当机房出现了问题的时候,一方面自己的业务系统就无法运行,另外一方面其生产线也会受到影响。对于这样的制造业工厂而言,生产线每停止一分钟,其损失成本是非常大的,因此阿里云帮助客户做了如下图所示的混合云容灾的解决方案。
在客户的数据中心部署了一台灾备一体机,客户的CMI系统以及财务系统等的信息都将直接备份到灾备一体机里面,这些数据经过重删压缩之后加密传输到云端的灾备库中。因为客户位于上海,因此根据物理地理位置的隔离要求,因此为其选择了位于青岛的华北区数据中心,这样就能够实现了异地容灾。当客户本地的数据中心出现了问题,那么还可以通过青岛的阿里云数据中心来将客户的应用启动起来。
案例3:混合云容灾案例 某连锁酒店
最后一个案例就是阿里云为某连锁酒店做的混合云容灾案例,该连锁酒店在全国大约有200多家分店,其系统包含了多种应用,比如Oracle数据库以及酒店管理系统等。对于酒店而言,实际上非常依赖于其IT系统,尽管在其IT系统中,数据量可能并不是很大,但是对于其业务而言却是至关重要的。对于具有200家分店的连锁酒店而言,单独对于每一家分店都做容灾是非常复杂的,管理成本也会非常高。
阿里云帮助客户做了混合云的容灾方案,帮助客户在阿里云上面建立了容灾中心。这样一来就通过混合云的灾备一体机将数据复制到了阿里云的云端灾备库,平时客户在云端只需要付云端灾备库的费用即可,包括计算资源以及虚拟机等都不需要支付费用。如果某一个分店想要进行容灾演练就可以在云上启动ECS虚拟机,然后就可以将云灾备库里面将该分店的信息都在ECS上恢复出来,这个分店就可以直接使用阿里云上已经恢复好的系统来进行业务运营。这样就能够实现分店集中容灾以及集中管控,并且能够做一体化集成,并且快速进行容灾演练,并帮助客户节约了很多成本。
五、混合云数据管理
如下图所示,左侧可以看做是用户的数据中心,右侧可以看做是阿里云。在客户的数据中心中可能有各种各样的服务器以及应用。如果客户的文件服务器面临着扩容以及数据迁移,就可以使用闪电立方的数据迁移服务,实现海量数据的快速迁移;此外,阿里云还提供了混合云存储阵列,能够安装在客户的数据中心,无论是数据库应用、文件应用还是其他应用,都可以直接使用混合云存储阵列,首先混合云存储阵列是高可用的,同时带有本地存储空间,客户的业务可以直接运行在混合云存储阵列上面;其次,混合云存储阵列的后端可以直接与阿里云的公共云存储连接起来,能够实现云空间的扩容,这样就能将数据推送到阿里云的公共云存储上面来,能够实现分级存储,并且实现数据级的容灾。并且云端的存储空间是按需扩容的,随着业务的增长,使用的云端存储空间可以快速扩容。还有一个产品是混合云存储网关,因为企业的IT基本上都有几十年的历史了,很多应用也已经开发好了,之前使用的存储可能是文件存储以及块存储,而在公共云上使用的则是对象存储,而之前开发的一些应用可能不能直接使用对象存储,针对这样的情况就可以使用混合云存储网关来解决,其能够将对象存储协议转换成客户之前所使用的各种存储协议,这样就能够实现云端的加速访问,并能够实现数据共享等上云的功能。除此之外,还有前面提到的混合云容灾和混合云备份两个产品。这样就构成了混合云存储数据管理的整体方案,而最终的使命就是让企业能够充分使用阿里公共云的便利性,把企业的数据与阿里公共云之间建立无缝连接。
阿里云存储产品大图
阿里云存储产品家族如下图所示,其实有非常多的产品。除了适用于各种不同业务需求的存储产品之外,阿里云还提供了很多数据分析处理的能力,比如批量计算、函数计算、图片处理以及视频转码等,这些能力能够与存储相结合,为客户提供各种各样的业务解决方案。
目前,阿里云的多款云存储产品限时促销中,促销力度也非常大,而且混合云备份服务还可以免费试用,大家可以直接扫描二维码进入促销页面。