亚马逊EC2故障后 云SLA需求明晰

亚马逊的企业级云服务EC2上周发生的故障,给了众多的企业CIO们在签署云服务级别协议(SLA)的时候一个明智的建议:“别把所有的鸡蛋都放在一个篮子里面”。对于企业的CIO们来说,在采用外部云应用的时候必须考虑到供应商提供的云服务的安全性、性能以及冗余性这些至关重要的关键点。

  “在采用供应商的这种云服务的时候,必须要明白不是所有的企业应用都可以被云服务实现,”美国科罗拉多州郎蒙特市的Ptak, Noel & Associates LLC的合伙人及首席分析师Audrey Rasmussen这样评价。

  Rasmussen进一步建议在采用供应商们提供的云服务之前,企业的CIO们应该仔细的调查研究这些云服务的基础架构设计及技术细节,并且一定要在签署云的服务级别协议的时候,把自己需要的功能作为服务需求列明其中。相比一般的业务应用,重要的业务系统对更高级别的冗余性及故障切换能力的依赖性显然更高。当然,高级别的服务协议开销相对而言更为昂贵,所以IT需要在开销、风险以及收益之间做出明智的选择。

  云服务级别协议的挑战

  至少对于IT的执行者而言,这种挑战是需要付出相当的勇气。

  一家纽约的财务服务有限公司,Baron Capital的网络技术部经理Henry Mayorga认为“去寻找百分之百的可用性就像找传说中的圣杯一样不现实”,因为“当你越增加冗余性设备到你的系统的时候,那么你的系统复杂度会越来越高。如果一切设备以及配置都确实被正确的连接并设置到位,那么理论上的高可用性是存在的。但是,一旦错误设置了系统中的任何一个部分或者任何一个组件没有按预期工作,那么发现错误原因的困难度会成倍数的增加并且恢复系统的难度也同样成倍数的增加爱”。

  但即便如此,出于对风险管理的麻烦之处,洛杉矶的一家信息律师事务所的合伙人Tanya Forsheit,一名云服务的专家,依然认为IT执行者依然必须坚持采用更高级别的保护措施,而放弃考虑那些不能真正满足企业需要的方案。 “企业的需求并不尽相同,所以每一个企业的每一个需求都需要经过谈判确认后量身定制,而不是去接受那些大部分云服务供应商提供的千篇一律的服务模式”。

  在签署云服务级别协议之前,必须明确故障对自己业务的影响程度

  一家专注于系统集成咨询方案的科技公司首席技术主席,Phil Kramer,认为企业的CIO必须事先对云服务供应商所提供的服务,一旦发生中断后造成的影响以及损失做出评估。

  Kramer举例到:“除非服务器也同时死机了,如果仅仅是用户的服务器列表目录一晚上没有被执行备份,这是一个很低风险的故障;但如果是用户的珍贵信息呢?在没有备份的情况下存储该信息的服务器崩溃了,后果可想而知。如果你的供应商的云服务级别协议不能确保你的数据访问,这绝对是一个非常错误的选择。”

  “如果你所采用的云服务仅仅用于测试和程序原型开发,那么高级别的冗余性就不是那么重要”,位于麻省诺福克市的Hurwitz & Associates LLC咨询公司的总裁兼首席运营官Judith Hurwitz这么认为,“但如果公司采用供应商提供的云服务来支撑面向客户的企业服务,那么公司就必须确保该服务有正确的备份策略和业务连续性解决方案”。

  一旦公司明确了每一个应用程序对于可靠性级别的需求,那么就可以开始寻找相应的解决方案了。新泽西州的一家网络基础架构服务提供商,Vector公司的数据服务产品经理Vinoo Jacob提醒道:“有一系列方案都可以选择,包括传统的站点内备份恢复到在多个供应商之间做快速故障切换以保障业务连续性”。

  亚马逊的云服务故障事件迫使客户对他们的服务提供商提出更高的需求,Jacob认为“虽然只是一个短时间的故障,但这有助于在未来澄清云服务的定义和评价;这不是关于是否决定采用云服务的问题,而是关于如何评估并采用基于云方案后如何设计系统架构的问题”。

  事实上云服务和服务级别协议已经改变了CIO们的角色,Ptak, Noel's Rasmussen认为“不再像以往那样仅仅管理他们的企业内部提供的IT服务,现在CIO们必须同时监管内部以及外部提供的IT服务,并且确保业务所需的必要功能及相应的服务级别都得以无缝对接”。

  有关于签署云服务级别协议时建议考虑的几个问题

  云服务不可用的情况下你将如何得到通知?服务是否可以自动重启?

  你的云服务供应商如何确保服务质量以保障你的业务?

  供应商是否提供负载均衡或者可靠性保证?

  你对供应商的RPO(数据恢复点)和RTO(服务中断时长)的要求是什么?

  供应商可以提供什么方式来让你管理你的应用程序性能以及解决故障?

  译者注:Amazon的EC2 (Elastic Compute Cloud) 服务类似于Google的Instance虚拟企业云服务,是一个让用户可以租用云电脑运行所需应用的系统。EC2借由提供web服务的方式让用户可以弹性地运行自己的Amazon机器镜像文件,可以在这个虚拟机上运行任何自己想要的软件或应用程序。

  用户可以“弹性”使用EC2所提供的服务,随时创建、运行、终止自己的虚拟服务器,按使用时间计费。EC2让用户可以控制运行虚拟服务器的主机地理位置,这可以最大化的降低业务延时,例如,为了让系统维护时间最短,用户可以在每个时区都运行自己的虚拟服务器。

 

你可能感兴趣的:(职场,休闲,亚马逊,需求明晰,云SLA,EC2故障)