近来,周围的人都有同样一种感觉:提到或谈论云的时候少了。其实,这种趋势是对的,说明云计算已经过了概念炒作的阶段,大家都在努力将“云化成雨”,让云实实在在落地。其实,不管你是不是把云计算挂在嘴边,云计算都已经进入了我们的工作、生活,也深深地影响甚至改变着我们的工作、生活,而且这种影响和改变是潜移默化的。笔者的一个IT圈的朋友告诉笔者,他的父母虽然不懂IT,但是每天从各种新闻渠道看到或听到很多关于云计算的利好消息,然后便会对自己的孩子说:“云计算有很好的发展,你们公司也很有希望。”
对于IT来说,云计算彻底改变或者说颠覆了以往的传统IT架构,它在社交化、移动化、大数据化的浪潮中成了中流砥柱。
云是转型契机
这个世界每天都会产生2.5ZB的数据。数据洪流、社交化趋势、大数据洞察……这些新兴的技术和应用模式压得传统IT架构透不气来。
传统的IT基础架构都是针对可以预测的工作负载构建的,而为每个应用新建一套系统的习惯已经充分暴露其劣势:容易形成信息孤岛,造成数据不流通,系统不兼容,资源共享难。在传统数据中心里,基础架构层面的软硬件紧耦合的模式已经不能满足新兴的云计算对灵活应、可扩展性和经济性的需求。
云计算正在改变企业对技术的部署方式,这毋庸置疑。有相关数据显示,55%的CIO表示,到2020年,他们的所有关键应用都将运行在云中;企业通过使用云计算,可以节省41%的基础架构成本。云计算的优势正逐渐显现,也被越来越多的用户所认可和接受,并利用它改造IT基础架构。
从私有云开始,到公有云,再到混合云,随着对云计算知识的进一步了解,人们慢慢地对如何运用云计算改造传统IT基础架构有了更深入的认识和信心。虚拟化、弹性、智慧、软件定义等这些词语越来越频繁地出现在IT基础架构改造的过程中,当然也包括存储。作为云数据中心基础架构的重要组成部分,存储近几年的改变可谓天翻地覆。在云计算中,传统存储的以硬件为核心、基于控制器的架构正受到分布式、软件定义存储架构的越来越严重的挑战。传统“高大尚”的存储会不会被基于分布式、横向扩展和PC服务器架构的更低成本的存储解决方案替代呢?以网格存储的特性为人们所熟悉的IBM XIV,已经在云存储方面做出了探索,其横向扩展的架构,以PC集群模式形成的企业级存储的高性能、高可靠性正在实践中经受考验。
从云计算的发展趋势来看,混合云已经得到了大多数据厂商和用户的肯定。Gartner预测,到2015年,约70%的企业用户会采纳混合云的模式。混合云的交付必须匹配企业业务的发展需求:混合云环境必须是可以动态管理而且是安全的;混合云在交付模式的选择上必须是灵活的;混合云必须构建在一个开放的标准之上,可以实现更好的互操作性。这些也是对IT架构,特别是存储变革提出的新的衡量标准。
混合云可以增强企业对IT架构的辨识度、控制力,让企业认清主要有哪些资源、工作负载和服务,然后通过有效的控制和管理手段,把控制风险、降低成本,并进一步提升IT基础架构的自动化水平。现在,用户遇到的主要问题是,IT解决方案的选择很难与云系统的要求完全匹配。一个专业集成的云就绪的解决方案应该具备以下特点:具有经过优化的计算、存储和网络;基于开放的标准建立;完全由软件定义的环境;适合的虚拟化平台和操作系统。IBM通过丰富的企业产品线,包括服务器、存储、软件和一体化解决方案,可以帮助用户建立一个与云所需的能力相匹配的IT基础架构。此外,IBM还有许多适用于云的工具,比如,IBM拥有可以简化混合云管理的SoftLayer、可以快速开发云应用的BlueMix、包括200多个SaaS应用的Marketplace等。
IBM的一个使命是让用户认识到混合云的价值所在。因此,IBM在此领域已投资超过70亿美元,用于数据中心扩展的投入达到12亿美元,并且拥有超过4万个云专家。这些投资对于加强IBM在云计算方面的创新,提升服务交付能力起到了至关重要的作用。
接受云计算的挑战,再造业务的交付能力,是对每个企业提出的新要求,也是促进企业业务转型发展的良机。
满足云需求是第一位的
云计算改变了IT基础架构的方方面面,包括计算、网络、存储和管理等。在这里,主要想谈谈云计算给存储带来的变化。
“云存储”这个名词刚一出现,就引起了广泛争论。有人认为,云存储代表了一类新的存储产品类别。也有人说,云存储并不是指某一类产品,而是只要能满足云计算需求的存储都可以称之为云存储。云计算带来的最大改变,不仅仅体现技术层面,云计算的本质是一种服务,是一种新的消费观念和商业模式,在这种新模式下,IT可以作为一种可衡量的服务交付给客户。从这个角度上说,只要能够满足云计算应用需求的存储都应该有资格被称之为云存储。
除了满足高性能、高可靠等指标以外,云计算最鲜明的特点是分布式、高可扩展,云资源可以自由伸缩,能够以更优的成本满足用户的需求。因此,云存储也必定要具备这些特质。宣布拥有云存储产品或解决方案的厂商不在少数,由于对云存储的理解不同,所以各厂商推出的云存储产品从功能或市场定位上也是千差万别的,不过厂商总会找到自己的云存储的卖点。综合来看,区别于传统存储的纵向扩展(Scale-up)方式,云存储最本质的特性之一就是可以实现横向扩展(Scale-out)。包括IBM在内的许多主流存储厂商也都是在横向扩展能力的基础之上再作新文章。
2013年3月,IBM在一次主题为IBM智慧云存储的高峰论坛上,首次提出了企业构建云存储的方法论,即通过效率优化、管理优化和安全与服务优化三个阶段,最终构建起高效、安全、灵活的云存储架构。按照IBM提出的云存储实施方法论,企业用户从现有的存储架构开始,经过效率优化、管理优化和安全与服务优化三个阶段,就可以循序渐进地完成云存储的部署。第一阶段,效率优化。在这个阶段,用户需要做的是实现虚拟化和存储架构的整合。第二阶段,在构建起一个高效、灵活的存储平台之后,用户要做的就是实现存储平台的自动化以及管理的优化。在这个阶段,用户最需要的就是一些高效的管理工具。第三阶段,用户可以把主要精力放在安全与服务的优化上。
IDC的统计报告显示,云存储是云服务中增长最快的一个细分市场。未来,企业将把更多的预算用于开展新业务上,而云存储的有效部署可以帮助企业更灵活地调配预算,也可以更好地支持企业决策,以实现业务的革新。IBM希望通过递进式的存储策略,帮助企业轻松开启云存储之旅。
在IBM丰富的存储产品家族中,XIV系列无疑是能够完全体现云存储价值的产品。2008年初,当IBM成功完成对以色列存储厂商XIV的收购后,可能也不会想到在云计算日益盛行的今天,XIV能够独树一帜。
网格存储铺平云道路
提起XIV,笔者想到了几年前的一次经历。如果没记错的话,也应该是在2008年,当时IBM在法国举行了一次全球性的存储新产品发布会,其中收购XIV是最重要的话题之一。当时,笔者就在发布会现场,亲眼见证了XIV的加入。在发布会后举行的一次晚宴前,在夕阳西下的一个美丽的湖边,笔者巧遇一位美丽的以色列中年女士,交换名片后才得知,它就是被IBM收购的XIV公司的市场总监。虽然笔者的英语水平有限,但是就在连笔划带说的磕磕绊绊的交流中,笔者与这位XIV的市场总监竞然交谈了快一个小时。我当时真的不知道是如何坚持下来这场“特殊的采访”,可能是因为双方都感兴趣的XIV的话题,才让交流变得如此顺利。
XIV当时并不为大众所知。笔者也是后来查资料得知,以色列的这家XIV公司,是2002年由被称为EMC高端存储Symmetrix DMX之父的EMC原首席技术官Moshe Yanai创立的。有传说,可能是因为商业上的原因,EMC不希望对Symmetrix DMX进行变革,而Moshe Yanai却希望在技术上有新的突破,正是在这种情况下才新创了XIV。XIV最大的卖点就是“网格存储”,这在当时来说还是一件新鲜事。Moshe Yanai当时研发XIV的初衷是不是与Symmetrix DMX唱对台戏,还是要在高端存储上立新标,我们不得而知。不过从现在的眼光看,XIV也许是“歪打正着”,为云存储当了铺路石。从这一点上,笔者不得不佩服Moshe Yanai的远见卓识。在传统的集中式存储控制器架构一统天下的时代,XIV特立独行,以PC架构集群的方式,解决了高端存储在性能、可靠性和可扩展性等方面的问题。它为后来的存储创新和对传统存储方式的替代开了一个好头,找到了一条新的路径。
XIV在被IBM收购后,一下子被推到了舆论的风口浪尖,有人说XIV是具有革命性的新一代高端存储,还有人说XIV将重新定义存储。XIV确有其特色,它在应对海量存储方面的能力,让它在诞生后不久就即在金融、电信、政府等领域大显身手。而对于希望以更优的成本满足大规模数据库、数据仓库、邮件存储、数字归档、Web 2.0应用等存储需求的用户来说,XIV提供了一种区别于传统存储的新方法。据说,XIV刚研发出来后,只在以色列销售了40多套。截到2009年底,IBM收购XIV仅一年时间,XIV在全球已累计销售超过2000多套,其中在绝大部分的案例中,都是客户利用XIV替换了原来的高端存储产品。
XIV的技术核心是大规模并行网格计算技术,它可以实现横向扩展。传统的存储架构是集中式管理和基于控制器的,因此在扩展时容易因为前端控制器的性能瓶颈,而无法根据用户的需求实现性能与容量的线性扩展。XIV具有横向扩展的能力,它不依赖于任何的主控制器,而是基于将计算与存储能力紧耦合的一个个平等的网格单元,因此只要增加或升级网格单元,就可以轻松实现整个存储系统性能与容量的同步线性扩展。而这种横向扩展的能力正是云存储所必备的。
XIV中的每个数据模块都包括紧耦合的CPU、缓存、磁盘等,并通过网格单元的高速互联和堆叠,形成集群式的计算和存储能力。从这个角度上,很多人喜欢用“动车”来形容像XIV这样的具有横向扩展能力的存储系统。传统的火车只依靠车头的牵引,而动车不仅有火车机头的牵引,每节车厢也有其自主的动力,因此整体速度更快。
XIV最吸引用户的特色可以概括为“三自一省”:自恢复、自优化、自管理、省成本。正是因为这些优势,XIV成了IBM在高端存储上的又一枚重要的棋子,与原有的IBM DS8000形成了互补。
不断变革中的XIV
在2009年以前,IBM一直拥有一条完整而脉络清晰,且十分稳定的存储产品线――DS系列,包括高端的DS8000、中端的DS5000和低端的DS3000等。IBM收购XIV是一道分水岭,从那时开始,IBM的存储开始了第二次创业,也为在云时代继续领先奠定了基础。为了顺应云计算的发展潮流,IBM在DS产品线之外开辟了“第二战线”,也就是以XIV网格存储(当时云计算的概念还没有像现在这样普及)为代表的新一代存储,还包括后来的集群NAS产品SONAS和IBM Storwize V系列产品等。
XIV一直被定位为新架构的高端存储,所以很多人会质疑,XIV与IBM传统的高端存储DS8000有冲突。IBM自己却十分坦然,将IBM DS8000与XIV根据客户群进行了明确区分:需要大容量、高性能、高稳定性和高扩展性的存储产品的大型用户会选择IBM DS8000,而选择IBM XIV的用户更看重存储产品的虚拟化功能、网格功能和云计算方面的功能。IBM DS8000与XIV的技术发展路线泾渭分明。其实现在,我们根本没有必要再去纠缠高端与否这个问题,只要能够满足用户的需求,这样的存储就是有长久生命力的。XIV除了是独立的IBM的一条高端存储或者说云存储产品线以外,XIV的技术思想和设计特色也渐渐融入了IBM整个存储产品线的开发和设计之中,这也是XIV技术长青的一个重要体现。举例来说,IBM新的中端存储经典产品IBM Storwize V7000就在界面管理上借鉴了XIV的图形用户界面功能。
随着用户需求的变化,特别是云计算出现后,XIV一直没有停下创新和发展的脚步。从大的版本上看,XIV现在已经是第三代产品。2013年6月,市场分析公司ESG对IBM XIV存储系统的客户性能体验进行了一次客户调研,受访客户整体上对XIV的应用体验感到非常满意,这其中就包括拥有3年XIV体验、现有XIV容量已经超过3PB的大型用户。
受访企业看重XIV的原因主要可以概括为以下几方面:第一,XIV的前期购置成本(CAPEX)及总体拥有成本(TCO)极具吸引力;第二,XIV的GUI得到了普遍认可;第三, 易于管理(实际上XIV系统根本无需管理),并且能够降低后期运营成本(OPEX);第四, XIV具有卓越的可靠性和可用性,达到了极高的性能水平;第五,XIV具备的全面的高级功能,比如快照和复制等,也获得了用户的广泛好评。
在2013年的2月和6月,IBM对XIV进行了两次改进,增加了许多新的功能,并扩展了其适用范围,使其更适合云的交付。比如,采用10GB iSCSI,可将聚合阵列吞吐量提高5倍,通过处理能力的增强可将顺序读取速度提升至13.7GB/s,通过Android和iOS设备可以动态监控XIV,并通过扩展对OpenStack的支持帮助用户获得全面的云管理解决方案等。OpenStack是当今获得广泛认可的开放的云基础架构标准,IBM XIV对OpenStack的持续、深入支持,使得XIV在云存储方面处于更加主动的地位。
为了提升存储的性能,现在各厂商都在仔细研究闪存在企业级存储解决方案中的应用。从XIV Gen 3开始,IBM也将闪存加入其中,采用与XIV架构的共生方式,因此在保证易操作和易维护性的同时,大幅提高了系统整体的性能。在IBM XIV中,闪存并不是一个存储层,而是用于扩展和改进现有缓存,因此能够跨越整个系统来提高带宽和响应能力,从而有助于提高XIV的总体性价比,并可有效扩展XIV的应用范围。
简便性、弹性和可预测性是三大方向
IBM Edge2014大会的核心内容之一就是帮助用户灵活地存储云中数据。IBM XIV为保证数据在云中高效、可靠、安全地存储而做出的改变,再次引起了业内的广泛关注。
我们正处于由传统架构向云架构过渡的转型期,在这样一个特殊的时期,传统架构与云架构会长期并存,两种架构之间的“友好相处”,特别是数据的无缝迁移、交换就显得十分重要。存储基础架构必须满足这一需求。比如,对于传统工作负载来说,它需要的是精简的基础架构,通过提高虚拟化和自动化水平来获取成本效益,同时实现数据的可控增长。而对于新型的负载来说,它需要支持大规模的数据快速互动,加速获得业务洞察力,并依赖数据的弹性,让数据和应用运行在标准化的商业化的硬件之上。
行业客户希望通过灵活高效的存储解决方案,达到以下三个主要目的。第一,解决数据复杂性问题。数据的种类繁多,且持续增长,这给存储架构造成了极大压力,消除存储孤岛,减少容易出错的手工操作,实现更高程度的自动化处理是用户追求的目标。为解决上述问题,存储的简便性就显得非常重要。IBM XIV具有管理简化、自恢复和自优化的突出能力,可以更好地满足用户对存储自动化、自助服务和自己认知的需求。第二,实现高可扩展性及可用性。由于用户数量、事务处理数量和数据类型越来越多,存储需求的不可预测性大大增加,在这种情况下如何继续保持存储的可控和始终如一的高可用性和可接入性对用户来说是一大挑战。只有提高存储系统的弹性,才能保证存储系统始终可用,避免数据丢失,提升安全性和可靠性。IBM XIV的应对之策就是虚拟化的能力和横向扩展的优势。IBM XIV是一个软硬件高度集成的产品,不仅在硬件资源上可以实现横向扩展,而且许多软件的高级功能也嵌入其中,无需额外购买。第三,快速一致的响应能力。企业需要加快业务运营速度并且处理新型工作负载,同时还要在外界需求变化时立即做出响应,为用户提供一致性的用户体验。若想达到此目标,提升存储系统的可预测性至关重要。IBM XIV在长期服务云计算客户的过程中,其一致的性能、服务水平的可选择性和无缝集成的能力已经得到验证,并受到了用户的好评。
综合来说,由于IBM XIV本身所具有的简便性、弹性和可预测性,使得IBM XIV在服务企业级客户时显得游刃有余。IBM XIV改变了传统的存储交付方式,并且充分发挥自身的灵活、高效、可靠、简单等优势,满足了云计算应用对数据经济性的要求。举例来说,在实现存储的简便性方面,花旗银行仅使用1名全职的员工就可管理全球各地的14个IBM XIV,而云服务供应商 Academica Oy通过使用IBM XIV将IT部门的工作量减少了30%;在实现存储的弹性方面,NaviSite Time Warner基于IBM XIV实现了99%的资源利用率,并且履行了最严格的客户SLA,而另一个客户Anadolu Bank则利用IBM XIV缩短了快照时间,将读/写延迟缩短超过90%,并且能够确保一致的服务交付;在实现可预测性方面,Pelephone仅通过3台IBM XIV便替换了竞争对手的16台存储设备,降低了管理成本,节省了超过80%的电力和场地成本,实现了无需调试的简便性及可预测性。这些成功案例充分体现了IBM XIV在云存储方面的竞争力。
为了更好地服务云计算客户,IBM还推出了专门面向服务供应商的IBM XIV云存储解决方案。IBM XIV的推出一些新的增强功能,通过REST API及容量报告功能的增强特性可以进一步提高IBM XIV的简便性;通过增加多住户、多站点镜像功能,可以增强IBM XIV的弹性;通过与VMware vCloud套件相集成,IBM XIV的可预测性也将大大增强。
提高简便性、弹性和可预测性将成为IBM XIV在适应云计算转变方面的努力方向。