从用一个存储箱子解决一个应用问题,到用多个存储箱子满足不同应用的需求,这个看似简单的问题,却是中科蓝鲸从2001年起唯一专注的事业。当云计算、大数据、闪存等这些可改变存储结构的因素出现后,中科蓝鲸的存储创新之路要如何继续呢?
2014年2月,英特尔投资宣布与天津中科蓝鲸信息技术有限公司(以下简称中科蓝鲸)签署注资协议。在英特尔构建的云计算、大数据生态圈中,专注于存储的中科蓝鲸别具特色,它十多年如一日地专心做好一件事―集中存储,既为其赢得了众多客户,也获得了业内知名投资者的青睐。
中科蓝鲸总经理许鲁在接受本报记者采访时表示:“与大多数传统存储厂商只关注用一台存储设备满足一种应用需求的模式不同,我们从2001年起就一直致力于用多台存储设备聚合满足多个不同应用的需求。”也许正是看中了中科蓝鲸存储理念与产品的独特性和其专注的精神,英特尔投资才选择注资中科蓝鲸。
解决多个存储箱子的问题
传统的存储阵列,通常都是考虑如何构建或者优化一个存储硬件箱子内部的结构,比如采用双控制器的架构提高单一存储的可靠性和可用性。而中科蓝鲸在成立之初就把研究的方向定为如何更好地发挥多个存储箱子的作用,这也是国外许多存储厂商致力于解决的问题。在应用相对简单的年代,一台存储设备只为一个应用设计,存储的边界,包括存储的容量、性能、可用性等都是十分明确的。但是到了现在,在多种应用并存的环境中,存储资源已经被池化,存储的边界不再被硬件所限定,而是要根据应用的需求由软件来界定。
“我们的技术基础其实就是三个集群,包括底层存储设备集群、文件系统集群和NAS集群。”许鲁介绍说,“从硬件设备上看,我们一直采用的是标准化且成本低廉的x86架构。x86架构可以充分满足存储系统对性能、可靠性和成本的要求,而且x86平台本身具有良好的自我发展能力。我们的技术优势体现在软件上。在硬件方面,我们采用的是‘搭车’策略,比如我们准备推某款新产品,就会询问英特尔是否有现成的硬件平台可以直接选用,而不会让英特尔专门为我们定制一个平台。”中科蓝鲸的硬件绝大部分都采用标准且性价比比较高的硬件,这更利于缩短产品开发周期并降低成本。
中科蓝鲸已经拥有了比较成熟的云计算解决方案。在大数据方面,以前中科蓝鲸的解决方案可以很好地解决大文件的存储问题,而现在它们则将产品开发的重点放在如何解决海量小文件的访问上。许鲁强调说:“从2001年起,我们只做一件事,就是集中存储,它与现在的云计算、大数据存储可谓异曲同工。”
软件定义存储是分层次的
业界有一个趋同的认识:软件将定义一切。但具体到软件定义存储,业内还存在很多争论。有人认为,软件定义存储早已有之,因为存储天生就是被软件定义的。也有厂商专门推出了新的软件定义存储平台。还有的厂商将一体机做成了软件定义存储的承载平台。“软件定义存储其实是分成不同层次的,不同的人关注的层次不同,因此造成了人们对软件定义存储不同的描述和定义。比如,有的人就将软件定义存储与OpenStack联系在一起,关注中间的协调层是如何运作的。”许鲁表示。
许鲁认为,软件定义存储的概念与以前人们常常谈起的网格的概念十分相似:“软件定义存储有必要继续细分下去。我们不能拿一个层面的软件定义存储去否定另一个层面的软件定义存储。我们更关注的是存储最底层的技术。”
许鲁仍旧以一个存储箱子和多个存储箱子来举例。“为了满足不同应用的需求,我们将多个存储箱子整合成一个系统,它打破了原有的存储界线。一个存储箱子很容易定义,因为它只面向一个应用。而多个箱子面向的是多个应用,每个应用如何实现对存储资源的控制和使用是一件相对复杂的事情。在这种情况下,明确哪些硬盘容量、缓存、带宽是承载哪些应用的,这才是用户所关心的,也是存储开发必须解决的问题。”许鲁解释说,“在云计算或集中存储的环境中,如何才能让多个存储箱子服务于多个应用,并且让管理员灵活地调度这些存储资源呢?这就必须实现存储的‘共产主义’,即存储的合理共享。我们必须从应用的角度出发,对存储资源进行明确的定义。”
软件定义存储的一个典型特征是:存储资源不再由硬件来界定,而是由应用或者说软件来区分和判定。
谈到一体机的流行,许鲁认为,在某些特定的应用环境中,一体机是有其优势的。“但是一体机并不是万能的,在一些非标准化的应用中,一体机也不能解决所有问题。就像Hadopp一体机,它虽然在处理某些非结构化的数据时可以体现出‘短平快’的优势,但是有些复杂的存储问题还是要放在存储系统中去解决。”许鲁表示。
一体机将计算、存储、网络等资源重新聚合在一起,这从形式上看似乎又回到了网络存储出现前的那个时代―服务器与存储融为一体。但是一体机的这种融合并不完全等同于以前那种服务器与存储不分的情况。从技术上讲,一体机相对于以前的融合是一种技术上的螺旋式上升。
“一体机的流行从一个侧面说明了,存储技术的发展没有跟上应用发展的脚步。”许鲁表示,“存储系统应该去解决自己范围内的事情,而不是依靠应用。”如果存储系统也能像Hadoop一体机那样高效地解决大数据应用的问题,那人们怎么会放弃存储而去搞一体机呢?
存储架构的改变
近两年在存储领域称得上革命性的技术并不多,这让闪存技术在企业级存储领域的应用一枝独秀。有人提出了质疑:因为大厂商技术创新乏力,所以才故意放大了闪存的作用,闪存的应用热潮有炒作之嫌。那么,未来存储的变革之路将通向哪里呢?
“存储的结构肯定会有创新。另外,存储在一些细节上的创新将像‘蝴蝶效应’那样推动IT应用的发展。”许鲁谈到了云计算,“一位在国外的云计算公司工作多年的朋友曾向我表示,在国外,云计算真正兴起要在两年以后。现在,人们谈论云计算更多的是一种市场行为,还没有到技术和应用实现真正转变的时候。”
不过,许鲁相信,云计算肯定会带来需求和技术上的很多变化,只是人们现在还不太了解这些新的变化。“存储的结构会因云计算有更大的变化。现在有许多需求和技术其实是人们臆想出来的。我们认为需求应该是这样,产品形态应该是那样。但是这些技术和产品能够真正解决用户的应用问题吗?”许鲁也在反思,“一些新的技术最先在互联网企业得到了应用,并取得了良好的效果。但是这些成功经验和技术都可以移植到企业级的存储应用中吗?互联网企业与商业企业在存储的复杂度、规模、性能和延迟等方面有很大不同。”
具体到闪存,许鲁认为,闪存对于存储系统,尤其是存储结构的影响可能是巨大的。以前,存储系统一般都是基于机械式硬盘的应用需求而设计的,而硬盘与SSD(固态硬盘)的最大差别在于,硬盘是串行访问,而SSD是随时访问方式。这种不同可能会导致存储结构甚至是文件系统设计的改变。“闪存的重要性并不仅仅体现在更换了一种新的存储介质,而是这种变化可能带来的存储系统设计基础的改变。”许鲁向记者表示。
许多厂商在推出基于闪存的存储系统时纷纷宣称,其产品是为闪存设计和优化的。但实际上,一些混合式的存储阵列甚至全闪存的阵列,只是增加了SSD而已,并没有对存储系统的结构进行全新设计。因此,“为闪存设计和优化”到目前为止还没有完全落地。