关键字: 全面 解析 文件 虚拟化
文件虚拟化技术把物理上分散存储的众多文件整合为一个统一的逻辑视图,极大方便了用户的访问,提高了存储管理员的效率。因此,在日益复杂的文件管理方面,“务虚”将成为一种新思路。
技术:GNS带动文件虚拟化
GNS(全 局命名空间)技术是文件虚拟化的核心。实施全局命名空间是有效和高效管理分布式文件存储的关键:它对于文件存储的作用就好像是DNS对于网络的作用一样。 全局命名空间使客户端在无须知道分散文件位置的情况下,直观地访问这些文件(就像我们访问Web站点而并不知道IP地址一样)。它还让管理员能够在一个控 制台上管理分散在不同位置处的异构设备上的数据。
文件虚拟化方案能够轻松建立和管理任何大小的全局命名空间。在部署文件虚拟化方案以后,用户访问文件的方式发生巨大变化,从原来访问物理文件存储设备转换成为一个统一的逻辑视图。用户可以拥有自己的文件夹,也可以访问权限可达的通用文件夹。
全局命名空间是位于客户(用户和应用)和文件系统之间一个逻辑层,提供了一种独立于文件物理位置的文件察看和访问方法。其结果是,管理员能够使用一个命名空间逻辑的排列和显示给用户,不考虑数据的实际位置。
有 了逻辑的全局命名空间,管理员就能够以取得最佳的性能和容量使用的方式存放文件,用户则能够通过命名空间访问文件。当增加或者整合存储设备以及文件被移动 或者改名时,客户端将被自动指引到新的文件存放位置,并不知道文件已经被移动。在重新配置存储设备时,不需要对桌面电脑进行重新配置,重新分配盘符,或者 修改登录脚本。
目前在市场中也存在一些具有监测功能的工具,可以提供大量有关存储环境状态的信息,但是,这些工具都属于被动的类型,无法进行主动 的数据管理工作,而文件虚拟化则可以。总体来说,文件虚拟化可以大幅度简化存储管理、提高灵活性并降低成本,它主要通过认证和分析来优化网络存储,从而解 决在容量、性能以及分级存储等方面问题。
容量管理:文件虚拟化方案在NAS或文件服务器、卷或者计算机配额树(quota tree)级别自动识别超额配置情况,进而进行纠正。控制台按照问题的严重性将所有容量问题列出,管理员可以迅速了解整个存储环境情况,并可以方便地确定 NAS或文件服务器、卷以及目录等各级别问题。鼠标点击可以获得更加详细信息并且根据需要即时解决问题。容量管理功能识别并解决任何容量问题,运行容量负 载平衡,优化存储的使用。
性能管理:确定NAS或文件服务器CPU、卷以及目录处理的性能瓶颈,通过自动的压力平衡机制重新分配数据内容解决该问题。性能管理应用系统识别并解决性能问题,消除瓶颈和热点问题。
分 级存储管理:分析各类数据的访问方式,把数据存放在最合适的级别;确定在线存储中最不经常访问的数据,把其迁移至近线存储;确定近线存储经常被访问的数 据,把其迁移至在线存储;所有迁移工作都支持服务水平协定,不会对存储系统造成任何影响。分层存储管理利用了迁移功能,通过使用访问频率数据来识别非结构 性数据,重新定位到低成本近线存储,使机构在一级存储硬件中的投资效益最大化。
同步镜像:文件虚拟化方案可以跨越多厂商的存储环境进行同步数据镜像,从而可以提高那些不能容忍任何丢失的数据的安全性。同步IP复制功能通过在IP 网络上同步复制,提高了对重要文件和文件系统的保护。把数据镜像到远程站点,还可以在灾难发生后迅速进行恢复。
难题:存储管理日益复杂
与日益增长的存储需求相比,用户目前采用的管理工具和方法根本无法保持步调一致。IDC称,存储管理员的生产能力每年必须提高60%才能够控制好存储容量的增加。
在 文件存储管理方面,通常有以下几个难题。在容量方面,存储设备的平均利用率为35%~50%;每TB的管理成本没有改善;容量超额配置成本太高。在性能方 面,缓慢的响应时间影响用户生产力;I/O带宽限制应用吞吐量。分级存储方面,与在线存储相比,近线存储拥有巨大的成本优势,但是同时对在线存储和近线存 储进行自动化管理常常受到限制。在存储整合方面,公司组织方面的要求给存储整合增加了难度,安全以及访问设置需要用户在存储整合时重新存放数据。
因此需要一种新方法来简化网络存储的管理,这种新方法不应该增加存储管理的风险,同时不会影响用户原有的操作流程,对应用则应该是透明的。
存 储虚拟化被认为是解决上述管理难题的有效方法。我们也对该技术做过多次详细介绍,但是,此前介绍的存储虚拟化都侧重在SAN存储系统层面。最近兴起了文件 虚拟化技术。顾名思义,文件虚拟化主要解决的是基于文件的存储管理问题,因此应用领域是基于IP的存储设备,也就是NAS设备。
文件虚拟化使存储管理员能够支持异构的存储环境,优化来自不同厂商的产品平台,从而提高灵活性降低总拥有成本。
动态:存储巨头争先恐后
博 科于今年3月斥资6000万美元收购了NuView,把后者的产品归入其Tapestry软件家族中。NuView的主要产品是StorageX,这款产 品利用全局命名空间来帮助管理不同NAS系统上的文件。NetApp也销售StorageX,但是重新命名为Virtual File Manager,NuView超过70%的收入都是来自NetApp。NeView还销售数据安全软件、基于策略的数据管理软件和业务连续性软件。
思科在文件虚拟化创业公司NeoPath的最近一轮融资中投入一笔资金。一位熟知NeoPath的人士透露,思科的投资额介于1200万美元至1500万美元之间。此外,还有人传言思科与 NeoPath签署了OEM协议,并且拥有NeoPath的优先购买权。NeoPath的产品利用虚拟命名空间和负载均衡,可以将存储在多个不同NAS系 统上的文件作为一个大的存储池来管理。NeoPath于2004年末首次推出自己的产品时,当时其主要竞争对手有Acopia Networks、NuView和Rainfinity。相比对博科,NeoPath对思科的意义更大,因为思科拥有庞大的以太网交换机业务。思科将Actona的产品用于远程办公室,而在NeoPath的产品在数据中心能解决扩展问题,离NAS最近的当然是以太网交换机。
去 年8月,EMC以9000万美元收购了Rainfinity。EMC Rainfinity全球文件虚拟化平台,改善异构网络附加存储环境中的信息管理。新发布的EMC Rainfinity全球文件虚拟化包括两个重要的新功能——全球命名空间技术管理和同步IP复制,为客户在其信息的生命周期里,大大改善了所有基于文件 的信息管理和保护功能。
4月份,Acopia Networks发布了最新的2.4版本文件虚拟化软件,该软件运行在该公司ARX系统交换机上,提供文件虚拟化和全局数据管理功能。其亮点包括多协议全局命名空间、异构数据保护、高级信息生命周期管理策略以及项目水平策略认知等。
存储巨头对文件虚拟化创业公司的收购狂潮从2003年11月份就开始了,而首先预见文件虚拟化技术将成为趋势的是NetApp,当时NetApp公司以3.6亿美元将Spinnaker Networks纳入旗下,从交易金额来看,目前也是最大的一笔。
与SAN存储虚拟化技术一样,文件虚拟化也分为带内、带外两种实现方式。其中,博科的产品StorageX属于带外方式,而Acopia、NeoPath以及Rainfinity的方案属于带内方式。
应用:存储环境轻松整合
Ameren 公司日前采用博科公司Tapestry StorageX软件,实现对企业文件数据的高效管理。借助Tapestry StorageX,Ameren成功地将文件数据从Novell NetWare平台迁移到Windows Server 2003平台,并简化了异构分布式存储环境下的文件数据管理。目前,这家公司服务于密苏里州和伊利诺斯州的240万电力客户和近100万天然气用户。
Ameren 公司最初使用博科公司的解决方案来管理从Novell到Windows的迁移和服务器的初步整合。Ameren公司架构专家Craig Yale认为,“我们决定把5TB的文件数据从Novell平台迁移到Windows平台,是因为我们已经有了一个Exchange Server的域结构,而且以后将不用继续负担维护两个平台的费用”。使用Tapestry StorageX软件之后,Ameren公司从原先的50个使用Novell NetWare系统的远程站点,降到如今的37个使用Windows Server 2003系统的远程站点。“对于这项工作,Tapestry StorageX软件是完美的。”Craig Yale 评价说,“我们迅速地把5TB的数据从Novell系统迁移到了Windows系统,在这个过程中服务器并没有发生停机故障,我们的用户也能正常地使用, 一切都跟原来一样。”
为了推动从Novell到Windows的系统迁移及服务器的初步整合,Ameren公司实现了StorageX的全局命名空间,建立在微软分布式文件系统(DFS)之上,它能把文件命名空间环境虚拟化。这让公司的IT管理员能通过一个单一的、包含所有文件数据的视图访问多个路径。
根 据Novell到Windows的系统迁移工程,Ameren公司打算继续使用Tapestry StorageX软件来管理他们的远程站点数据备份到中央数据中心,这样能让高级用户在服务器停止运行或者发生错误的时候启用备份数据。“一旦我们完成了 丛Novell到Windows的系统迁移,我们会继续使用Tapestry StorageX的全局命名空间和Tapestry StorageX的文件复制策略。经常把远程站点的数据备份到我们的中央数据中心。”Craig Yale解释说,“这将改善Ameren公司备份数据的可靠性,并减少了我们主要远程站点备份服务器和磁带机的数量,这样能在改善数据完整性的同时,节省 更多的费用。”
Tapestry StorageX软件也能让Ameren公司维持高效的商业连续性策略。“在实现Tapestry StorageX管理策略之前,修复一台因停机或者是别的原因损坏的服务器的时间,可能花费我们多达40个小时。” Craig Yale说,“现在,通过使用Tapestry StorageX全局命名空间和Tapestry StorageX的紧急修复策略,我们可以完美,可靠地管理整个故障转移的过程。在一次停机故障之后,服务器将迅速地切换到之前的数据备份,这样用户就能 继续访问他们的数据并继续工作。Tapestry StorageX是一个通用的,高效的综合程序组件,它能帮我们完全地控制我们的存储迁移、合并、备份和紧急修复的过程。这个产品将给我们的投入带来显著 的回报,这种回报将随着我们的使用持续增长。Tapestry StorageX的可靠性和高效性将影响到我们公司的业务,同时提高我们的生产力和收益率。”
挑战:发展道路稍有坎坷
尽管文件虚拟化技术为存储管理员带来了巨大便利,但是从目前情况来看,其仍然面临着诸多挑战。
首先从技术层面来讲,文件存储虚拟化技术所面临的最大绊脚石就是不够成熟,IT经理尤其盼望这项技术的进一步发展。文件虚拟化目前还不能完全脱离后端操作系统,这就意味着存储是“聚合的”而不是真正“共享的”。换句话说,文件虚拟化功能的实现目前还必须依赖NAS/文件服务器操作系统。这也是NetApp为何要开发具有文件虚拟化功能的新操作系统的原因。按照NetApp的想法,如果文件虚拟化技术可以整合到NAS操作系统之中,则可以提供直接的快照、迁移、高可用等高级数据管理功能。
而 对于国内的市场情况而言,文件虚拟化的推广显然要面临更多困难,其中最重要的就是,国内的NAS应用还不够成熟。许多用户言之必称“SAN”,仿佛SAN 就是存储的代名词。SAN的优势在于提供高可用的在线服务,而NAS则为数量众多的客户端提供文件级别服务。由于众多用户对此认识不够到位,导致了许多原 本应该使用NAS而采用SAN的情况,这样的存储环境,文件虚拟化功能就很难发挥出全部优势,因而用户对其部署的迫切性不高。
此外,部署文件虚拟 化的最重要的一个好处是提高管理员生产力,或者减少对管理员人数的需求。但是,与欧美等发达国家相比,我们的存储管理员成本普遍偏低,为用户节约大量管理 成本的优势表现不很突出。举个例子来说,某用户部署文件虚拟化方案之后,可以轻松地减少两位管理员。但是两位管理员一年的薪水不过几万元,如果部署文件虚 拟化方案则需要五十万元左右,那么就需要几年以后才能获得回报,可是谁知道几年之后会发生什么样的事情呢?
NAS更需提高管理水平
由于SAN存储设备主要为服务器服务,因此,在一个典型的SAN环境中,服务器数量不会太多,有统计数据表明,绝大多数用户环境中,一个SAN网络中的服务器数量不超过6台。
与 此相比,一个NAS网络中经常需要向数百客户端提供服务,而且由于NAS部署在IP网络中,扩展极其方便,一个大型NAS网络中NAS设备数量经常超过数 十台。这样就给NAS的管理员提出了更高的要求:不仅需要管理众多NAS设备以及存储的文件,还要管理大量的用户。由此可以说明,NAS比SAN更需要高 水平的管理。
高端NAS产品提供商,比如NetApp和EMC在NAS设备的管理方面,早在几年前就实现了统一的方便管理。但是管理仅局限在设备层面,对文件的管理情况就相差许多,直到出现了文件虚拟化技术。
文 件虚拟化首先通过全局命名空间实现了对文件的统一管理,除此之外,与用户权限管理结合在一起,它还可以让管理员跨越多个服务器分配用户配置文件,用户仅能 看到他们有权使用的目录。如果一名工人从一个部门调动到其他部门,他不需要改变配置文件,而是被自动分配根据新的权限直接访问。
这就使得存储管理水平上升到一个新的阶段,因为不仅简化的众多文件的管理工作,还在安全性方面得到提高。权限管理确保重要文件不被无权访问的用户获得,用户还可以对文件访问情况进行审计。
采 用文件虚拟化提高存储管理水平,不仅可以提高存储利用率、方便用户的文件访问,更大的好处还在于可以更好满足法规遵从的要求。在没有部署文件虚拟化之前, 要求NAS管理员提供一份文件/用户管理权限的报告将是一项不可完成的任务,显然无法满足法规遵从,而文件虚拟化则大大简化了这项工作。当然,目前此项任 务在Windows环境中实现较为顺利,而Linux和Unix环境受到一定限制,这也是文件虚拟化需要即时解决的问题。