XIV改写高端存储定义(存储时间)
人物
主持人:张广彬 ZDNet存储频道主编
嘉宾:吴东寰 大中华区XIV业务总监 IBM系统与科技事业部
访谈内容:
主持人:给自己赢得时间?
吴东寰:对,给自己赢得时间。但是其实我们可以看到在阻止的同时,几乎我们整个行业内的主流的存储厂商都没有停止对高端的磁盘阵列进行底层虚拟化研发的脚步,实际上没有停止。那我们其实也可以看到从市场各个厂商的产品的技术发布,包括一些并购的动作,我们可以看到这样一个信号,很明确的一个信号。
主持人:我觉得听了您前面说的这些,我相信大家对于高端存储系统市场上的变化有一定的了解,您能不能再给概括一下,因为就是说,毫无疑问XIV的出现改变了大家以前对传统的存储系统的定义,那现在这个新的定义该怎么写,您能不能给出一些简单的几个要点。让大家在以后的应用和采购中能够来进行辨别。
吴东寰:对,刚才还有一个问题,就是关于市场上还有一些说法,传统的关键业务要放在fiber channel盘、光线盘上,那么SATA盘只用来做二级存储,或者非关键业务。实际上第一这个说法不是完全准确的说法,因为过去在XIV这种虚拟化的存储技术出现之前,在一定程度上这个说法是可以被市场接受的,也被好多用户所接受,因为过去五年十年大家都是接受这种说法和教育。但是它的主要原因是过去SATA盘作为一种大容量、高密度盘的盘,它的转速低于fiber channel盘,它的转速低就意味着它的效率就低,但是在传统技术中这是不可解决的问题,所以它被用为二级存储。但是XIV这中全局并发、分布式的算法它已经解决了这个问题,这种分布式算法能够使整个系统所有的资源,包括CPU、磁盘能够并发运作,这种分布式算法使得及时采用高密度的插盘,它的整个系统的性能优化,达到了非常好的一个水平,它的可靠性和性能也达到了过去采用FC盘所达到的水平。所以从这一点来看这不是一个理由,就是过去采用SATA盘作为二级存储是因为技术的局限,无法来解决这个问题。而XIV呢,它的技术可以很好的解决了这个问题,同时又能给客户提供更大容量、高密度的磁盘的情况下,又不牺牲它的性能和可靠性,这就很完美的解决了现在市场上信息化、数据迅速增长,在有限的占地、能耗这些资源的情况下,能在单位有限的资源上提供更大的可用的资源给客户提供了很好的机会,所以这个是一个方面。那么回过头来看,实际上客户的关键任务也好,核心应用也好,文字游戏在这个细节上扣也没多大意义,刚才你也提到这里。那实际上对于高端的应用,它主要的客户考虑,从过去到现在没多大变化,主要考虑到除了性能、可靠性、高可用性之外,实际上还有客户它是否具备企业级管理的功能、它的总体运用成本如何,基本上就是这五大方面。这个是整个行业过去五年十年一直到今天没发生很大变化,这也是整个行业不管是厂商还是用户都共同认可的一个概念。也就是说,高端的企业级的磁盘阵列,用户在选择和考虑这个技术的时候它最原始的出发点就是基于磁盘阵列的可靠性、可用性,基于它的性能、基于它的功能、基于它的可管理性,以及基于它的运营管理成本,从这五个方面来考虑。那XIV技术实际上是用它的技术来实现,用网格的架构,用他的分布式算法,使它的磁盘阵列技术天生的就具备全局虚拟化的特点,这种特点就抛弃了过去,没有使用过去的REID这种在磁盘内部所有的逻辑卷和它的物理空间进行一一映射的分区的概念来部署的,所以它就使所有这五个方面的获得变得更加高效、快捷和简单,那就同时提供了更好的综合运用成本和客户体验,它非常完美的提供了所有高端用户的需求,同时提供了更加高效、简便和更好的PCO。
主持人:那我想听了您的这五大要求之后,用户能够更清晰,拨开一些迷雾,去寻一些更本质的东西。但是尽管如此,我们听说XIV在进入国内后业务今年比去年增长了300%,那这个数字仍然让人感觉有点出乎意料,我们想知道这是怎么做到的。
吴东寰:OK.它主要是这样,应该说最主要的是IBM公司的销售团队和它的售前支持团队比较精准的把握了国内的主流高端存储用户的痛点。这个痛点正如我们前面提到的,实际上用户在采用无论是它已经适用的传统的高端磁盘阵列,还是即将考虑在采用做数据整合、数据集中,在它的关键业务上做这样的动作时,很多客户都已经面临或者即将面临这样的一些痛点。包括过去的传统技术它所采用的是私有的研发组件,相应来说它整体的运用成本偏高,尤其它在存储的部署阶段,这个存储我们知道,买来之后要花费一点时间,买方和卖方坐在一起,要做研究和部署,这个部署就涉及到它把所有的客户的业务,这个逻辑卷,要一一分配给磁盘阵列内部的对应的物理空间,这就是一个分区的概念,这种分区都是人工来做的,分区做完之后还要根据各种业务要求、级别,给不同的逻辑卷给READ10或READ5,做各种READ保护的机制,部署在里边。所有的部署完以后还没有结束,因为这个企业级的磁盘阵列,它既然作为企业级的,它都是核心关键的业务,同时它也是对中型规模以上的机构它往往不是单线程、单应用的业务,它往往是多应用、甚至是跨平台的业务,都在一个集中的磁盘阵列当中。那么在部署完成之后,在一个系统平台上,它的性能不言而喻可以说是谈不上什么性能的,紧接着做的动作还要进行优化,对整个系统进行性能的优化,这个优化也是手工做的,要在系统的内部做调带化,根据你的业务的要求,手工的去tuning你的performance。调带化之后、tuning之后、优化之后,系统才有好的性能而言。那么所有这些动作,由于是分区的,由于在内部是它的逻辑卷都是跟它的不同的逻辑卷、不同的应用是跟不同的物理空间是一一映射的关系,那这样全局的业务必然是不均衡的,不均衡就意味着系统始终存在着性能热点,这些性能的热点就会导致、出现各种各样的问题,包括性能的一些瓶颈,包括热点盘将来可能会坏掉,那么一旦出现坏盘,我们知道数据仍在,因为有REID技术在保护,但是如果。。。
主持人:性能会下降?
吴东寰:第一,性能会下降;第二,风险会急剧提高,它需要人工、手工的去恢复这种防护机制、恢复这种状态。同时,如果你做扩容,扩容之后,你新的磁盘插进来之后,这个系统不会自动的把这个业务分配进去,还需要人工将所有刚才说的的事情重做一遍,这是相当复杂、繁琐的事情,同时它对客户而言也蕴含着一些潜在风险在里边。那么还有过去的一些企业级的存储软件,它的这种算法,它实际上也涉及到将来无论是你扩容,或者是系统发生了变更,这种算法和这个软件在提供的时候,无论是它的部署和它的收费标准都会存在着一些很大的变化,所有的这些变化都通通的导致在管理上,对客户而言,感觉比较复杂和难以控制。那么客户就不得不去跟厂商共同去考虑、干预,乃至于不得不去介入它在底层的东西、后边的一些东西。而这个XIV这种技术实际上是在磁盘底层分布算法进行了全局的虚拟化,客户再也不用担心业务在后段式怎么分配的,你只需要在你的客户端把你的所有的业务分配给它一个名字、给它一个空间,这样就完成了。所有的性能的优化、磁盘的部署,系统全部是自动的、在后台完成的,不需要客户使用者在前端去关心这些很复杂很专业的问题,那么客户只需要把时间和精力更多的投放在自己的业务方面。
主持人:那听了您的这个描述呢,我相信其实这也是有很多用户会选择XIV的一个原因。但是可能大家还是比较希望能有一些比较具体的例子,比如说有哪些行业,我觉得有两个典型的行业,比如说金融行业,它是习惯了原来那种私有的架构,它如果转换为XIV,那么打动它的主要是那些因素,它能不能顺利转变过来。另外一个行业,像医疗行业,按以前的定义来说,它是不能算作高端存储系统的用户的,它可能也用到XIV了,那对于它来说,它用XIV又做了什么应用,他们又是看重了那些方面,您能不能先跟我们介绍一下主要是在哪些行业,还有以这两个行业作为典型的行业来给我们做个更具体的说明。
吴东寰:可以的。首先我们看一下,其实XIV这个存储在中国的销售,在过去将近的两年,不仅在金融和医疗,在其他好多行业,包括电信、交通、政府、工商企业,都已经采用了我们的产品和技术,而且客户体验的话呢,几乎所有使用到XIV这个存储技术的客户的反映都是非常的好,而且这里边已经出现了好多第二次、第三次的重复购买,而且甚至出现了第四次重复购买。那么我们首先看一下,刚才您希望提到金融行业。这个金融行业,我们知道,这是一个在各个行业中很关键的、典型的高端存储的客户。在金融行业中,实际上XIV在国内的银行、以及一些大的政策系统已经有了很多成功的案例在里边,包括招商银行,包括一些城市银行,包括 国泰 君安、证券这些金融机构已经采用了XIV存储,而且有一些金融机构已经进行升级、扩容和二次购买。应该说金融行业它是典型采用传统的磁盘存储技术是最长时间、历史最久远的机构,这种新的向外扩展的网格存储技术的出现,在金融行业相对于其他行业还是需要一点时间。
主持人:已经习惯了。
吴东寰:对,这个还是有使用的习惯。而且尤其是金融行业,它的IT部门,它的使用水平、管理水平还是偏高的。但是尽管如此,我们发现在银行这个领域,包括我们跟银行界的IT管理人员,包括IT部门的经理、银行界的CIO在沟通时,实际上他们在过去的十几年甚至二十年的使用当中积累了丰富的经验,在企业级磁盘阵列上。但是我们沟通过的几乎所有的用户,他们都有共同的体验,都提到了一个问题,非常一致的,说OK,过去传统的高端阵列表现,从它的service level上,从服务水平上、从磁盘阵列的可靠性上,从它的性能上也还不错,但是太复杂了。它的部署,就像刚才我们所提到的,这个部署是需要大量的时间来沟通,所有的业务、所有的卷的部署,他不得不坐下来,跟厂商的技术人员和部署人员坐在一起,将用户所有的应用要从头到尾翻一遍,仔细的去研究如何去在磁盘阵列内部为这些业务去画卷,去部署它一一对应的物理空间。那么这些动作还都需要做各种级别的保护,保护后为了得到性能,还要去进行调带化和优化。这些动作我们说过了,一旦出现了各种系统热点、盘的损坏,或者是将来业务的变更,全要人工干预,甚至是重新来过。那么这一点给客户带来了大量的效率阻碍,甚至潜在的业务风险,包括它复杂的使用。这些问题,我们遇到的在金融界所有的用户都提到了,尤其是那些技术相对,有深切体验的,这些从它的使用者和管理者出生的这些人,他们有深切的体验。这也是为什么,我们在国内有很多的金融机构已经率先的采用了我们产品和技术。可以相信哦,在不远的将来,会有越来越多的银行会采用这个技术。因为在北美,他们做得比我们早做一年,像美国银行、摩根银行这些大的金融机构,已经有很大比例的都采用了我们XIV的技术,这是在金融领域的一个表现。那么刚才还提到在第二个行业,在医疗行业。医疗行业我们可以看,它的信息化在早期,相对于金融行业,还是慢一点的。
主持人:对,差距还是比较大的
吴东寰:对,还是有差距的。因为在早期我们医疗大部分都是手工作业,它的所有的病例、所有影像的诊断大部分,其实现在在国内我也走访过很多医院的CIO或者是他的IT的manager,他们在跟我沟通的过程中也提到,其实现在我们国内的医疗行业IT的发展水平也是处在一个进展过程当中,这就意味着什么呢,你没有实现这种信息化,你用手工化就谈不上什么高端中端,甚至连中端都没有还何谈高端呢。但是进入到现在,进入到这几年,其实现在已经发生了很大的变化。第一个呢,这个国家非常重视我们的民生,实际上整个医疗,是民生很重要很重要的一个部分。
主持人:对,咱们每个人都有医保卡,哈哈。
吴东寰:对,哈哈。这是民生非常重要的一个部分。包括医疗领域的看病难等等这些问题甚至惊动了中央领导,实际上现在医疗的信息化也是排到了几乎大部分的这些主管院长,或者是医院的CIO、IT经理和管理人员的日程表上。那在我们在这两年之内所接触的医疗行业当中,实际上我们发现医疗行业它的HIT系统、PAX系统对整个在院级进行整合的时候,或者是有些非常大的三甲医院做局部整合的时候,实际上它在磁盘阵列使用的要求上已经接近或者达到企业级阵列这样的要求。我们看,一个三甲医院,基本上就是,一旦进行全院PAX整合,一旦用信息化手段对PAX进行信息化管理的时候,它的容量都会达到一个很高的级别。第二点就是医疗信息化,包括它医疗用项全部进行信息化、数字化管理,这种要求一旦提到日常议程,那么它对整个IT信息化的部署,乃至于后台的磁盘阵列的使用,都会达到相对比较高的水平。所以从这个角度而言的话呢,实际上在医疗行业,尤其是我们这些大中型的医院,他们对这种存储采购的要求已经逐步的提高而且达到了新的一个水平,这就是说我们应该用动态的眼光来看现在市场的发展,而不是用过去五年以前这样的眼光,说医疗行业一定就没有什么所谓的关键应用的要求。这是其中一个变化,应该说是这个行业的一个变化和趋势。同时,我们发现,医疗行业专业性比较强,应该说这个非常鲜明,跟其他行业会有很大的区别。那么作为医疗行业的IT部门,实际上我们发现,无论是大医院还是中小医院,它的IT管理人员的数量不是特别多,那么IT维护人员的精力也是有限的。所以这样对医疗行业的TI管理部门和管理人员它更加有一个要求,就是不能使前面那种传统的技术复杂的东西,让过多的来干扰用户的业务,让医疗行业的这些IT管理人员承担更大的负担和潜在风险。实际上从这个角度来看,恰恰这种新的高端的磁盘阵列的技术,像XIV这样的技术的话呢,它使得你的后台无论多复杂的管理要求用相对更加高效、简洁的技术来实现,这恰恰满足了医疗行业在PAX和HIT系统之间整合的这种高端的要求。
主持人:恩。那您刚才多次提到有用户采购第三、第四次套系统。那我们知道在传统的磁盘阵列购买,采购多套系统其实对用户不是一个很享受的过程,因为它、会形成一个一个的存储孤岛,他可能宁愿在一个系统加尽可能多的磁盘来满足容量的要。那么从XIV的角度来讲,如果用户选购好几个系统以后,比如说第三、第四套,它就超过一个机柜,好几个机柜了,那它在管理上面,是不是能够简化,不像以前那么复杂,或者这个用户怎么避免向以前那种传统的系统的困扰。
吴东寰:ok。我想这里边我们可以简单分析一下这个所谓的孤岛的问题。其实孤岛问题,它不仅仅是体现在两个物理机柜之间,由于是两个机柜不是一个机柜,这就形成了一个孤岛。同时我们可以看到,就像我们刚才所谈到的,其实传统的磁盘阵列的技术它部署的方式是分区的方式,它不同的业务、不同的逻辑卷,它实际上即使是在一个机柜当中,它也是分布给不同的物理空间,那么无法避免的,它必然形成很多的孤岛空间。
主持人:很多小岛。
吴东寰:很多小岛,对,这种孤岛空间是不可见的,也是不可用的。那么这个不同的分区之间它们就会不均衡,因为你业务的要求是不一样的,有点业务非常的繁忙,有的业务就相对的不是那么繁忙,那必然整个系统也会存在除了孤岛之外还会出现存储热点。那等等这些问题的存在,实际上恰恰是我们过去的技术没有解决的问题,这才是本质的孤岛。应该说这个孤岛,最重要从用户端看起来,是它使用起来是不是更加方便、简便和容易,如果用起来系统相互之间是割裂的,是不能进行统一管理的,这个实际上是孤岛的体现。我们可以看到,实际上像XIV这样的存储技术,它在一个机架当中,它实际上是没有什么孤岛的,它全局一体化的。
主持人:但是在机架之间呢?
吴东寰:在机架之间是这样的,因为我们知道,像XIV它现在一个机架从20几个PB的可用容量一直可以到达160几个PB。从这样一个区间,它实际上满足了现行市场上绝大部分单个客户的数据集中的要求,应该从20几个PB到160几个PB,满足了绝大部分。那么如果超过这个范围之上,XIV可以用多机架来部署。从过去的经验来看,一个从XIV本身的销售,尤其我们在北美,那XIV的PB级的club这样的用户已经超过几十个,包括美国银行、美国波音、美国在线、blackberry,它都是通过一台两台的采购,最后使用起来觉得非常简便和高效,同时又有很好的运维成本,那基本上部署都超过二三十台以上。由于XIV这种单个机架,它的管理呢,没有采用过去REID这种复杂技术,那么新的分布式的虚拟化技术使它的管理变得非常的简单,所以从逻辑上看,基本上多个机架的话它的管理也是非常的简单,这是从XIV本身来看。那么从多个机架级联来看,我们产品的研发路线、研发图,我们是在明年的晚一点时间也会有多个机架进行级联的这样的road map,那so far呢,我们还没有release出来。那么其实第二角度,从现行的市场来看,就算是传统的这种可以扩大到几千个盘的体系架构、这种磁盘阵列,实际上我们可以看到,在中国的电信、大的银行这些领域,大部分用户在数据量大到几十个P以上的时候,他们也没有完全采用一个机架扩展到几千个盘的方式,也是采用了好多个传统的磁盘阵列、很多个机架这种方式,这是一个现实。
主持人:反正它的内部管理也很麻烦,多弄几个也一样。
吴东寰:是
主持人:那因为我们刚才提到很多,就包括我们从传统经验来说,XIV其实是一个会计的存储,其实现在数据量这么爆炸,包括您刚才提到的那个医院啊,什么扫描影像,其实都是文件形式的。
吴东寰:是的
主持人:所以呢这种分结构化数据的增长,其实成为增长的主力。那么包括我们刚刚提到的IBM的SONAS,我们也听说XIV也可以把SONAS作为后端的存储来使用。这跟SONAS原来配备的存储相比,XIV有什么优势?还有什么样的用户会选择这样的搭配?
吴东寰:我们可以看到SONAS它是一个NAS的产品,这个产品的定位是一个中端偏高这样一个中高端的水平,那XIV是一个聚散的磁盘阵列,它的市场定位是一个高端的市场定位。这两个产品可以很好的搭配在一块,就是XIV加上一个NAS的网关既可以为用户提供块级的存储要求,又能满足文件存储的要求。在市场上如果有这样的用户他基于SON的核心应用采用了XIV,同时又有文件共享的应用,那么XIV加上SONAS就为客户提供了很好的选择。而且可以活的横向扩展到很大的容量。这取决于客户基于块级存储的要求,并附加文件及要求。如果客户仅仅是文件共享的要求,那么SONAS单独提供也可以满足客户的要求。
主持人:刚刚吴总对今天谈的内容做了一个很精辟的总结,那么我相信大家看到这里也会对以XIV为代表的横向扩展,包括以网格为虚拟化的高端存储系统有了很全面的了解。我们也很高兴吴总今天花宝贵的时间来详细剖析这些。希望有新的XIV升级的时候您能够为我们做新一轮的普及。谢谢您!
更多精彩内容请关注:
IBM存储官方微博
IBM存储官方网站