作者:崔昊 - DOIT传媒执行总编,七年IT媒体从业经验,关注服务器、存储和信息化领域
数据广泛存在于企业的IT系统中,是企业发展的核心,一切的IT系统发展都有赖于数据,并服务于面向企业业务的数据管理需求。随着IT行业的发展以及企业对数据管理要求的不断进步,数据管理的“智能”趋势已经锐不可当,智能的数据管理正在成为所有企业所追求的共同发展目标。
本文是《数据管理的智能趋势》系列文章的第三篇,在本篇文章中,您将了解到,为何我们必须要考虑虚拟化所带来的影响,以及在智能数据管理理念中虚拟化——尤其是存储虚拟化——所占据的特殊地位。同时,在虚拟化成为必然发展方向的态势下,我们应该如何付诸行动:在虚拟化的环境里实现智能数据管理,通过存储虚拟化将数据管理变得更加智能,是本篇文章希望传达给您的信息。
而在下一篇文章中,我们将重点介绍“数据保护与支出成本的两面性”,帮助您了解,是否更好的保护一定意味着高昂的成本,以及无缝扩展和领先的自动分层技术对数据保护的意义,敬请期待。
通过上一篇文章《数据管理的智能趋势(2):如何实现高效的数据管理》,相信您已经了解到实现高效的数据管理并不仅仅意味着提高效率,它包括从成本经济性、服务水平管理、业务敏捷性等方面对数据管理所进行的要求和改变,高效数据存储的概念早已经超越传统的效率话题,成为数据存储的基础需求,并作为智能数据管理的重要组成部分,担当起基础的重担——智能数据管理首先应当是高效的数据管理。在上一篇文章中,我们也给出了部分实现高效的数据管理的要点和方法。
着手实现高效数据管理,达成智能数据管理的过程中,外部环境的变化影响甚至决定着我们所采用的手段和方式,因此,我们必须要同时注意IT系统的建设、运维和优化所处的整体环境与氛围的变化,否则,我们将难以根据不断变化的实施情况,实现真正的高效的、智能的数据管理。
信息技术行业往往按发生重大技术创新的时代来定义,例如PC时代、移动计算时代和互联网时代。随着虚拟化技术的日趋成熟,我们已从互联网时代的随时随地连接,前进到了虚拟化时代。
图释:我们已经进入了虚拟化时代,未来的IT基础架构,大部分将是基于虚拟化的。
充分挖掘虚拟化时代这一新时代的全部潜能,正在成为IT系统的发展目标之一,但在这一目标之下,又会对数据管理产生什么样的影响?虚拟化技术、虚拟化的数据中心,又是如何深刻的改变着数据存储?在数据存储领域,存储虚拟化的出现,会对虚拟化环境下的数据管理产生哪些影响?又如何应对?
虚拟化数据中心对数据存储的挑战:I/O、管理、自动化、数据中心架构
虚拟化的收益显而易见,原有分散的系统被聚集起来,统一管理并充分利用硬件资源,因此,虚拟化技术首先在服务器系统上应用,数据中心内的服务器被快速的通过虚拟化进行整合,减少了资源浪费,并能够以庞大的资源池运营较大的业务系统,或快速建立、消除和迁移业务系统——在虚拟化的平台上。
图释:存储虚拟化(Storage Virtualization)让数据从物理设备上进入虚拟空间,虚拟磁盘(Virtual Disks)可以加快配置磁盘、卷的速度,但正如图示,通过服务器虚拟化(Server Virtualization)少量的物理服务器被虚拟出大量的虚拟服务器(虚拟机,Virtual Machines),带来大量复杂的I/O需求。
但虚拟化并非没有问题——即使是只在服务器系统上进行虚拟化,服务器虚拟化通常会增加连接到每台物理服务器的存储环境的I/O资源需求。在虚拟化之前,大多数服务器在运行一个应用程序时,常伴有大量的处理和存储I/O资源分配。通过服务器虚拟化,我们将许多应用程序负载到一个主机上,并各自运行在自己的虚拟服务器上。我们将增加比过去乘以10倍或更多的潜在存储I/O1。
同时,由于虚拟化资源池内所运行的业务种类增多,I/O 类型开始出现差异,且I/O资源是大量随机的,所有这些应用都独立的运行在共享物理主机的虚拟机上。应用程序很少会检查是否有其他应用正在占用存储资源,它将跨过虚拟化管理程序去获得所需要的带宽,而虚拟化管理程序需要调整这个应用到确定的端口运行并获得可靠的带宽。
接下来,管理和紧接而来的自动化成为难题,虚拟化系统的管理与传统的物理系统不同,我们无法利用在物理世界所积累的经验,去解决绝大多数虚拟世界所遇到的问题——仅虚拟化系统就包括有VMware、微软Hyper-V、Citrix虚拟化与Red Hat等虚拟化平台,每种独具特色,与物理世界统一于X86或RISC不同,拥有不同的管理和自动化适应性界面。
数据中心的架构也随之转变,我们会逐步发现,数据中心的核心开始由服务器——计算设备——转向I/O设施,其中包括存储系统和网络交换架构。当I/O设施成为数据中心的核心,数据中心的重点也就继而转向了管理I/O设施的智能数据管理平台,因为我们需要利用智能的、高效的数据管理平台管理存储着的静态的数据或是流动的在网络交换设备中的动态数据。
虚拟化的发展还有一个潜在问题,那就是“虚拟机蔓延”,为了临时业务应用所建立的虚拟机,以及应用之后被停止但长期未删除的虚拟机,将造成数据中心被大量的虚拟机所填满,也带来存储容量的极大浪费。为了应对这个问题,按照传统的方法只能够在初期采购时,购买远超当时需求的存储容量——更多的磁盘意味着更昂贵的价格,但谁都知道磁盘价格的下降速度正在不断加快——虚拟机的“蔓延”的问题,需要更好的、更智能的数据管理,具有极大的根据虚拟化要求而弹性应变的能力。
智能数据管理作为一种趋势的重要性被再度加强,我们需要智能数据管理来承载静态的或动态的数据,由于负责传输动态数据——有一种观点认为网络交换设备也是存储系统——的网络交换设备相对而言负责更为简单的过程,单个数据存在其上的时间较短,因此,重点也就落在了存储系统上,其必须要针对虚拟化的外部环境做出及时的响应。
什么是合格的虚拟化存储:自动化、简化管理、虚拟化管理程序与应用整合、利旧
如何评价虚拟化存储合不合格呢?根据性能还是别的什么?为什么我们会看到在高性能的存储系统加入数据中心之后,存储基础架构仍然会成为制约服务器虚拟环境发展的障碍——事实是,至今,许多IT专业人士还没有找到根本解决服务器虚拟化所带来的存储问题的解决办法。
存储系统的性能、容量和价格已经不再是制约存储系统应用的桎梏,在单位容量或单位性能上所需要花费的成本随着IT技术的发展已经越来越低,摩尔定律很好的诠释了这一切,但是,这些更大容量、更高性能、更便宜的存储仍然难以满足虚拟化对存储的需求。
按照虚拟化对I/O设施所提出的新需求,合格的虚拟化存储应具有以下特征:
1、 自动化:虚拟机的数量、I/O吞吐量、部署及迁移需求都是巨大的,虚拟化存储需要自动化的管理而非传统机械式的人工干预。
2、 简化管理:随着服务器虚拟化带来的虚拟机的增多,以及多种虚拟化平台互不兼容的问题,一个简单、易用的虚拟化存储部署、配置界面将极大地简化不同虚拟化平台接入存储系统的复杂性
3、 虚拟化管理程序与应用整合:应用不再基于物理设备,而转向虚拟设备,无法与应用整合,仍然以物理方式管理虚拟化架构的管理程序对于系统管理将是低效率的。
4、 利旧:虚拟化的重要性之一在于不同类型、不同年代的IT设施可以被很好的利用起来,虚拟化存储需要拥有非断代升级、对旧有设备的融会贯通的利用能力,而非“喜新厌旧”需要“替换”而非“整合”旧有的设备,造成IT投资的浪费。
5、 精简卷:自动精简配置将解决虚拟化“蔓延”的窘境,在虚拟机被停止进而删除后,回收空间,或在虚拟机激增时快速按需扩容。
图释:以Compellent的高级精简配置*为例,数据被预先配置,随后根据需求扩充卷容量(如为不断膨胀的虚拟机),而一旦需求缩小,容量可以被回收(如虚拟机被删除后,之前所占用的容量可以被回收)。
*该技术的理念是:在初始配置存储系统时,配置较少的实际容量,但为数据卷虚拟配置远超于此的容量,在数据量激增后,虚拟配置新的物理空间到卷中,满足用户需求;同时,当用户不需要部分容量后,可以将物理空间分配给其他的卷或应用程序。从而减少初期的容量购买,并避免容量浪费。
虚拟化数据中心与云基础架构的要求:流动的虚拟化
虚拟化带来了三大受益:提高系统利用率(多个物理系统整合成统一的资源池,提升利用率)、整合异构环境充分利旧(多种不同的异构环境形成统一资源池,利于资源调配和利用旧设备)、快速的部署和迁移虚拟机/应用(部署上线虚拟机和将虚拟机在不同的但已经统一在资源池中的设备间进行迁移)。
在这三大受益中,虚拟化的用户们在享受了前两点带来的好处后,正在进入快速的部署的新阶段,同时开始从物理设备上迁移系统平台与应用,而这也正是目前最为热门的话题。
快速的部署与迁移虚拟机/应用解决了困扰企业IT系统应用的一个老大难问题:如何根据业务灵活、动态、随需而变的设计、部署和分配企业IT计算和存储资源,而也因为虚拟化的这一优势,大量企业将虚拟机迁移作为重点应用开始尝试,根据不同的业务负载和响应速度,虚拟机及其所承载的业务在不同资源池上迁移流动,形成了流动的虚拟化。
随着流动虚拟化的深入,虚拟化的数据中心必然走向私有云、公有云或是混合云,这三大云的形态代表着很多用户虚拟化进程的终极目标,意图实现IT架构即服务、按需付费、多租户、灵活异构平台多应用等不同的应用模式,但用户需要从现有虚拟化架构,平滑迁移到私有云、公有云或是混合云的能力,尤其是针对数据、信息,没有数据与信息的平台架构无法直接支持业务发展,只是承载测试数据进行模拟的平台注定只能作为企业业务的陪衬。
总的来说,在满足虚拟化存储的需求之后,虚拟化数据中心与云基础架构提出了新的要求,需要Ready for Cloud而数据也要流动起来,我们必须要看到,如何管理从虚拟化平台、虚拟化数据中心,到私有云、公有云或是混合云的数据,将是智能数据管理所面对的下一步挑战。
戴尔新一代SAN存储:Compellent、EqualLogic为虚拟化时刻准备着
为虚拟化而做的准备中,改变存储架构是你能做的最快的事情,但是否只是简单的更新换代?比如说,在光纤通道(FC)环境中,这意味着可以升级到8Gb/秒光纤或10Gb/秒以太网光纤通道(FCoE)。对NAS或IP-SAN环境来说,这通常意味着从多个1Gb连接升级到10Gb以太网。如果用户还在进行融合项目的话,也可以选择FCoE方案,它可以×××能升级以外的其他好处。
但这是可行或是能够持久的解决之路么?事实上,单纯通过带宽上付出的开销所获得受益已经越来越少,而选择面向未来的流动虚拟化、流动数据(Fluid Data)的Compellent 多协议SAN存储和已经为云准备就绪(Ready for Cloud)的IP-SAN EqualLogic存储系统,或许是你可以借鉴的方式。
虽然Compellent与EqualLogic身处FC-SAN与IP-SAN的不同领域,但是他们“同是游戏规则的颠覆者”,在分层管理、横向扩展方面都具有优异的性能,帮助每个存储管理者能够管理更多额的存储容量,并打破了传统的破坏性及“断代升级”式的扩展与升级方式,减少了企业对存储的管理及总拥有成本(TCO)。
作为戴尔存储的“左膀右臂”,Compellent和EqualLogic拥有惊人的共同点,这两者共同拥有的自动精简配置(精简卷)和自动分层存储彻底解决了虚拟机“蔓延”的情况。
事实上,虚拟机“蔓延”的情况将在自动精简配置应用后将得到极大的缓解,自动精简配置将为快速增长的虚拟机动态扩容卷容量,同时Compellent还可在虚拟机被删除时回收已经不再利用的空间,从而节省大量的,因临时生成的虚拟机及虚拟机“蔓延”所造成的容量浪费。
自动分层存储则为戴尔的两大存储系统实现了高效的“流动数据(Fluid Data)体系结构”——在合适的时间将数据放在合适的位置,将已过时的或对性能要求不高、未运行高负载应用或干脆是弃置不用但必须要保留的虚拟机放置在大容量低价格的磁盘上,并调整高负载的活跃虚拟机进入类似SSD的高速空间,从而实现以合理的成本满足最大的需求。
但这两者也拥有不同的特质:Compellent来说, Compellent Storage Center这一贯穿整个Compellent架构的平台既是其统一管理平台又是其扩展与面向虚拟化服务的保障,其能够在简化虚拟化环境下的存储管理的同时,保证所有的Compellent磁盘阵列系统能够简单的融合到一个单一的存储池中,提供统一的存储I/O、设备连接、容量管理接口,并支持包括:Windows, Solaris, HP-UX, Linux, AIX, Netware, Mac OS X, Tru64, Open VMS, VMware在内的所有的操作系统与虚拟化平台。
同时得益于这一平台在接口、设计及二进制方面的兼容性,Compellent提供了随用户需求而增长的性能随容量线性增长的模式,同时提供的“永久软件许可证设计”,支持断代——从第一代、第二代到最新的一代——产品的融合在统一存储池中,并提供块与文件的混合访问形式与异构操作系统的文件共享,随着虚拟化程度的加深,虚拟机数量的增加,Compellent在容量和性能上都可以获得充分的满足。
统一管理平台之上所构建的软件组合:自动精简配置、自动分层存储(自动迁移不活跃的数据到低成本的SATA硬盘或近线SAS)、智能自动化(Enterprise Manager软件提供多设备、多资源类型的管理并自动优化性能、容量规划、分配卷、提交报告和设置灾难恢复)等技术以及基于Enterprise Manager软件的智能自动化,让Compellent成为适当的虚拟化数据中心存储系统。
而具有在磁盘和RAID 组之间实现自动负载均衡及SSD与SAS磁盘分层等自动化分层功能的EqualLogic系统在被戴尔收购之前,作为独立存储系统供应商的建立初衷与市场竞争点就是“为虚拟化而设计(Design for Virtualization)”,提供了“1小时内为虚拟机提供网络存储”,刚刚获得了InfoWorld(信息世界)2011年最佳存储系统技术奖,被评为“虚拟化服务器环境中排名第一”的存储系统。
但EqualLogic显然拥有进一步深化的能力,我们知道,云基础架构要求一个真正的“虚拟的,能自动调优的存储”平台,这意味着一个“Ready for Cloud”的存储平台,需要满足至少三个条件:自动分层存储/自动化管理、面向虚拟化以及为云基础架构的连接方式做出准备,甚至已经有报告显示,有部分电信用户主要使用EqualLogic解决方案,来实现存储整合、存储虚拟化和数据保护等用途2。同时,它不仅本身就设计自云基础架构的最广泛的连接方式:IP网络,而且已经支持未来技术DCB(Data Center Bridging)连接及数据中心无损以太网(增强型数据中心以太网),实现了对新一代以太网的支持。
谁都知道,无论是私有云、公共云还是混合云,以太网从10Gb到40Gb,再到100Gb的高速发展模式让它成为必然的未来垄断的网络连接方式3,事实是,Compellent这一曾根植于FC-SAN环境的设备,现在也已经进化为FC-SAN+IP-SAN+NAS的统一存储系统。
总结:智能数据管理服务虚拟化时代
从上文可以看出,虚拟化正在深深的改变数据管理的传统方式,而智能数据管理也必将随着虚拟化的普及与深入,产生更多、更细和更复杂的变化,但万变不离其宗,智能数据管理在四个维度“经济节省、服务水平管理、业务敏捷及系统与业务相结合”的引导下不断的发展和进步,加之与VIS的紧密整合(可以参见 戴尔技术中心社区精彩文章《云计算模式和 Dell 的虚拟集成系统架构》)——相信通过存储虚拟化与虚拟环境下的数据管理,所有的问题都将迎刃而解。
在本系列的下一篇文章《数据管理的智能趋势(3):保护与成本的两面性》中,您将了解到,数据保护的目标到底何在?是不惜成本的不断冗余数据还是能够用更轻松的方法巧妙地化解数据保护与支出成本之间不断增长的矛盾?保护与成本的两面性又体现在何处。
相关资料:
1 《在虚拟环境中的存储性能挑战》,Storage Switzerland创始人George Crump,2011年
http://storage.doit.com.cn/article/2011/0324/295143.shtml
2 《ESG实际使用评测报告:Dell EqualLogic企业级虚拟存储设备(中国用户使用评测)》 ,ESG分析师周家术 ,2011年
http://www.esg-sino.com/research_PDF/chinese/ESG_Field_Audit_Dell.pdf
3 《IDC 全球每季度企业网络跟踪报告》2010年第二季度:2010年第二季度万兆以太网交换机销售收入同比增长87.9%,季度端口出货量首次突破100万个。万兆以太网的应用是由数据中心、云计算和园区网络建设推动的。
4 戴尔智能数据管理网站:加速您的数据管理策略
http://www.dell.com.cn/idm
5 IDM与VIS的紧密整合 (戴尔技术中心社区精彩文章)
http://zh.community.dell.com/techcenter/b/weblog/archive/2011/03/14/cloud-computing-models-and-dell-s-virtual-integrated-system-architecture.aspx