2008年初,当IBM以3.5亿美元收购了名不见经传的以色列XIV公司时,并未惹起太多的喧嚣。
但后来,但人们了解到,XIV的董事长不是别人,正是传说中被很多人称为EMC旗舰存储阵列Symmetrix之父的Moshe Yanai后,一场关于XIV产品的争论也随之展开。
XIV曾一直被认为是IBM进入Web 2.0和数字媒体领域等新兴市场的一块基石,但当时IBM并没有透露针对XIV的具体计划。
两周前,IBM在中国终于对外发布了XIV系统,这也终于让我们有机会揭开了XIV产品的神秘面纱。
网格化的XIV是什么?
对XIV而言,其跟传统存储系统最大的区别在于采用了粒度非常细的网格结构,数据通过这种粒度很细的网格结构,在系统里采用大规模并行计算。
在XIV存储系统里面,没有任何集中的模块,它是由一个一个粒度很细的网格组成的,每个网格都叫数据模块,整个存储系统内部是由很多这样的网格堆积而成,再用高速互联的方式、交换的方式联系在一起。
通过这种方式,在底层的用户数据分布上采用的是粒度很细的数据分布的方式。而将来用户整个前端的应用服务器的数据其进来之后,通过大规模并行的方式,把所 有的数据通过均衡的方式会分散到后端所有的网格结构之上,同时也会分散到所有的物理驱动器之上,所以通过这种粒度很细的数据分布,再通过大规模并行处理的 方式,让后端所有的网格单元,所有的磁盘驱动器并发响应前端应用的需求,实现存储产品的性能、可靠性方面的改进。
IBM系统与科技事业部中国区XIV技术专家王晓冬表示,相对于传统的架构,在XIV系统中,没有集中化的内存,也没有集中化的大型控制器,取而代之的是 一个一个小的模块组成的,它是把原来在用户传统的集中式存储架构中松耦合的内存、CPU和磁盘紧耦合在一块,做成一个一个小的网格单元,通过网格单元高速 互联、堆叠,形成群集计算或者群集存储相应能力。而每一个网格单元都可以看成是紧耦合的CPU处理能力、缓存能力加上磁盘存储能力的结合。这里面任何一个 网格都是完全对等的结构,通过细粒度的数据分布,通过大规模的并行实现系统的高速的吞吐。
传统存储数据存储模式
网格存储数据存储模式
XIV带来了什么?
扩展性
这种结构网格带来的好处显而易见,最大的好处在于扩展性,它对整个系统未来的扩展带来了非常大的灵活性。对用户而言,只增加新的网格单元就可以,因为网格 单元之间是通过全交换的方式互联在一块,在增加到一定程度以后,一个机架不够,使用第二个机架,甚至使用第三个、第四个。
而任何一个网格单元来讲,由于采用的是业界标准的组件,实际上就是Intel+Linux,因此任何新出来的CPU技术、磁盘的技术或者是内存的技术很容 易地通过网格单元的方式,增加到系统架构里面去,将来整个系统更新换代也好、扩展升级也好,可以把业界最新的技术很容易地应用到这个环境之下。不需要像传 统存储一样,要设计新的控制器,设计新的内部的背板,等等这样一些复杂的,产品周期需要24个月或者更长的时间。
“IBM把这种扩展结构叫做Scale Out,意思是向外扩展”,IBM系统与科技事业部中国区XIV技术专家王晓冬表示,“传统的存储结构,叫‘Scale UP’的概念,原来的高端系统性能不够的话,我们会把它的控制器重新设计,用更快的CPU,用内部设计更新的背板的结构,通过更快的控制器,通过更大的缓 存做性能和容量的提高。在这里面,我们作为任何一个Data module处理能力很有限,但是在扩展的时候,通过大规模网格单元并发扩展的方式实现整个性能的提高。所以这也是它的设计理念上,我们叫向外扩展的概 念。”
IBM系统与科技事业部大中华区产品部总经理侯淼
IBM系统与科技事业部中国区XIV技术专家王晓冬
稳定性
作为XIV来讲是全虚拟化的系统,最核心的思想就是用户将来所有的数据是通过XIV智能的算法,自动地均衡到后端所有的磁盘上。核心的设计理念是平衡或者 叫做恒定均衡的概念。任何一个前端并发的I/O过来,会同时用到的后端所有的网格单元的计算中,用到后端所有的磁盘来并发地来存储,这样后端达到平衡的状 态,这种平衡的状态即使系统发生变更的时候仍然可以得到保持,比如增加新的网格单元,或者把一些旧的网格单元因为生命周期结束需要从环境中拿下等等,任何 系统发生变更的时候,后端所有的网格单元会参与这个数据的重建,所有的磁盘单元也会参与这个数据的重建。
王晓冬谈到,“实际上,XIV是通过很多小的模块并发运作的方式实现整个系统的可靠性和稳定性。目前在用户的存储环境里,有些控制器很忙,有些控制器很 闲,而有些磁盘可能很忙,有些磁盘不忙,这些都是存储系统中的热点问题,而这些热点的存在对用户的IT环境有隐患,而通过这种平衡的方式,可以实现所有的 部件、磁盘、所有的网格单元不出现热点的问题,达到整个系统的可靠性和性能的优越性。”
简单性
按照IBM的测试,由于在整个系统里面采用大规模并发及恒定的均衡实现自恢复和自优化,在系统里采用1TB的SATA磁盘驱动器出现故障的时候,整个系统 恢复1TB数据只需要将近30分钟的时间,这30分钟的时间是指整个数据系统完全充满的情况下,如果用户数据没有充满的话,整个1TB单盘驱动器出现故障 恢复的时间只需要15分钟甚至更短。即使跟今天高端的FC存储系统去比的话,可以看到整个的恢复时间大概相当于目前主流的光纤驱动器的1/10甚至更短, 这方面整个的大规模并发的结构对于整个系统的可靠性提供了一个全新的概念。
对于XIV产品的特点,IBM系统与科技事业部大中华区产品部总经理侯淼自然是相当得意,“XIV的管理很简单,以至于我们没有什么多说的地方。因为它整 个的系统将来设计完之后,用户看到的就是80TB的存储池。然后用户做的工作很简单,基本上就是两步的动作,设计“Volume”,让主机看到 Volume,只需要选一个名字再加上你的大小就可以了。所以管理在虚拟化的管理环境之下真的非常简单,非常方便。用户不需要再像传统的存储一样,是做 RAID5还是RAID1,再做相应的一系列设置。整个安装的时间、调整的时间都是上周甚至更长的时间,这个系统安装可能就两个小时完毕,用户使用半个小 时供给一下卷,下午就可以on production。这是高端存储和企业存储里面在SAN环境下革命性的理念,就是它的管理真的非常简单、非常的方便。”
更省钱的解决方案
由于XIV后端采用恒定均衡的方式,整个系统实现了自动性能优化,也就是在这个系统里面,用户不需要买任何所谓的存储优化软件,不需要任何的后端磁盘均衡的软件,系统已经自动通过算法的方式帮你实现了,也就是整个系统是一个非常恒定均衡的方式。
更绿色的产品
能耗问题――在现在看来,对商用产品而言,这个似乎是个不能不谈的话题,在这里,按照IBM的解释,XIV表现得同样很优秀。
侯淼表示,“作为存储产品的能耗,或者空间、机房的占用,已经越来越成为大家关心的因素”,“当突然到了TB级规模的时候,大家开始意识到存储 产品也是个高能耗、高排放的产品,这种情况下,XIV是绿色IT非常好的体现,最重要的原因是,XIV内部采用的是最节能的SATA的磁盘驱动器,通过大 规模并发的方式,虽然我的单磁盘驱动器的性能没有FC驱动器快,但通过并发的方式,可以实现整个系统性能的提升同时在能耗和占地方面有很大的节省,相对于 传统高端的FC驱动器来讲,能耗或占地可能只相当于几分之一的概念,所有很多用户对于基础设施因素非常关注的时候,实际上给他们提供很好的选择了。”
从Scale up到Scale Out
用做PC的架构,或者说用x86架构来做存储一直都是一个选择,对于厂商来说,这样的架构容易获得,研发成本极低而产出则非 常不错,当然,基于x86架构的产品的价格也更能够让用户接受,但是,与更专业的专用控制器的架构相比,更高的出错率与更少的模块化设计很难令这些产品走 进高端市场,很多厂商曾经尝试过在x86架构上把存储做的更高,但是好象没有人成功,原因就在于:我们可以把性能做的更好,但是架构上的劣势让MIPS仍 然是英特尔难以企及的控制器处理器竞争对手――无数的用户都不那么相信英特尔能够比MIPS做得更好,而且,事实或许也是如此。
因此,当业界出现像XIV这样产品时,恰好给了PC架构一个机遇,那就是去迎合集群,用集群的方法保证其性能和容错性能,用侯淼的话说就是:“从 Scale up 到Scale Out。”―他谈到,“我们有两种可以扩展存储系统的方法,一种是Scale out,一种是Scale up。Scale up的出发点是,我怎么样通过提升CPU、内存的性能来提高我的整个系统的速度。这种方式实际上带来的好处是,当CPU赫兹从1giga到4giga确实 能够提高整个的处理速度,但是磁盘和缓存包括和CPU之间有非常大的处理的速度的差别,这个差别在过去几年,并没有减少,反而在增大,所以Scale up的好处在于当你有一些类型应用的时候,像在线处理的时候,可能Scale up是一个使用方式,但是针对比较密集型的大型数据块来讲,Scale Out反而是比较好的处理方法。”
王晓冬认为,XIV的出现能够弥补DS8000的一些“力所不能及”的事情,他表示,“在一些特殊的情况下,比如一些新的应用,或者Web2.0的应用, 它的容量的增长,性能要求会有非常高速、快速的增长,用传统的Scale up方式的话,很难匹配相应的增长速度,所以这种情况下Scale out更能适合这种类型应用的发展,基本上是面向两种不同类型的应用,两种不同类型的技术出来。”
侯淼认为,IBM的XIV的核心竞争力在于算法,“Scale out技术的含金量在于算法,非常依赖于算法和软件,所以大家可以看到其实像XIV它的硬件平台并不奇怪,就是几个完全的标准组件建在一起,但其算法是通过算法把整个负载平衡,这不是所有厂家都有的。”
集群的好处在于:越多的扩展造就更高的性能,当然,安全性也就越高,不过,必须要关注的是,XIV的可扩展性,无论是性能还是容量抑或是容错性,其代价都 是源于对容量的损失――XIV内部有180块1TB的磁盘,数据做的是镜像的保护,是80TB的可用容量,当然,这就是XIV,以集群的方式将数据复制两 份,并分布存储,对于这样的概念,或许不用多讲了。
XIV真能重新定义存储系统?
实际上,XIV系统唯一的弱点在于其性能的实现需要大量的冗余设备,而过多的冗余有时候对用户而言的确是一种浪费,不仅是磁盘,连交换机也需要冗余,这也 注定了XIV这个产品的本身,定位在了高端用户的应用。这一点,侯淼也坦然,XIV适用于那些未来2-3年数据增长很快的应用,这时候XIV就是一个很好 的产品。而对目前众多的中小企业来说,由于该产品的价格昂贵,因此只要采用服务器+存储的NAS结构就可以了。
在侯淼看来,建议用户采用XIV设备的原因有三:
1、数据增长速度相当快;2、物理的扩展已经到达了上限,现有中端或者高端的存储设备已经无法再进行扩展,而且需要数据移植;3、混合的数据负 载,由于数据类型的多样化,造成存储产品所提供的数据服务无法保持一致的性能,以保证它所服务的对象提供一个高质量的数据响应服务。
在这三种情况下,XIV就是一个非常好的选择。
“用户在混合的负载情况下,同时在数据量成长非常快的情况下,怎么能保持一致的性能,这点也是我们去推荐一个XIV产品的关键的考核点,它数据量很大的时 候,它的应用有很多,怎么保证它所服务的对象提供一个高质量的数据响应服务,这点XIV就是一个非常好的选择。”
能否挑战EMC的分级存储?
众所周知,在IBM单个存储系统的内部,是不存在分级存储的概念的,而这与EMC的产品有很大的差别,EMC存储系统内部,有SATA盘、FC盘、SSD 盘等等能够混插,不同的盘阵则提供不同的存储应用,这也是EMC所提出的分级存储概念,而对XIV而言,由于设计的理念就是讲究的均衡,因此,在XIV系 统里是不分成TIER1和TIER2的,XIV更加趋向于混合的负载。
侯淼认为,“实际上XIV设计的出发点已经很明确了,它认为所有的负载应该是一致的,而且是混合的,所以在XIV这个系统里面,是不分成TIER1和 TIER2的,没有这个概念,当你两个存储器的定位,像8000,就对那些客户对自己的应用很了解,知道哪些是TIER1和TIER2,能够管理数据未来 成长的趋势。”
实际上,在收购XIV之前,IBM缺少存储市场两个重要的组成部分:低价的PC架构存储系统和可以从小变大的集群存储系统,虽然IBM一直拥有从 DS3000到DS8000等一整套系列的存储系统,但IBM的用户们仍然面临着一个选择:是选择其它供应商的更便宜的PC架构存储,还是去继续选择 IBM的控制器架构的存储系统――这不仅仅是钱的问题,而关系到扩展性、灵活性以及整个企业存储架构的未来选择。
通过XIV,IBM为用户的两种选择都提供了答案,或者说,IBM提供了一种可能性:如果你需要可扩展性强而又价格低廉的存储系统,你可以选择XIV,而 无需花费昂贵的钱去购买DS系列的产品,当然,获得高扩展性和低价格的XIV也是需要付出一定的代价的――这需要另当别论,因为这个话题的答案从来都只有 平衡和舍弃,而不是十全十美。
采访后记: 关于新数据中心的结构发展,最近一年来一直众说 纷纭。尽管名称五花八门,例如按需计算、实用工具计算、网格计算等等,但它们都指向同一个理想:一个动态响应用户需求的虚拟数据中心资源池。这个理想是如 何形成的并不是秘密,任何IT经理都知道,在传统数据中心内形成的标准操作程序是一件多么枯燥的动手工作。而存储领域对于简单和自动化的迫切需要无疑是最 为明显的。在IBM的XIV上所体现出的网格存储技术,也许并不能代表着下一代数据存储技术的发展方向,但至少我们可以看到,存储设备迈向整合和虚拟化的 趋势已经起步,而它是由对效率和响应能力的实际业务要求所推动的。