谈到服务器虚拟化,x86平台以其开放的架构和优异的性价比无疑最受企业信息部门所关注。一项由51CTO发起,数千位企业IT主管参与的调查亦表明,不仅四路以上的高端机架和刀片服务器持续被看好,而且有四分之一强的用户认为处理器的更新换代使得双路服务器的性能也有了显著提升,同样适用于搭建虚拟化平台。
被缚的Nehalem-EX
有鉴于此,新一代多路至强7500(代号“Nehalem-EX”)早在面市之前就受到业界广泛关注。作为至强7400的继任者,Nehalem-EX在硬件虚拟化支持能力上再上层楼,不仅核心增加到8个,而且每个核心支持两个线程;使得一台四路服务器可以具备多达32个核心,64个线程,可以分配的计算资源大大增加。
全新的QuickPath互联架构亦给至强7500打通了多路连接的“奇经八脉”,在以往的四路平台中,CPU之间的通讯需要经过前端总线和北桥;而在QuickPath架构中,通过四条高速的QPI总线,每颗至强7500处理器可以和其他三颗实现点对点的互联,使得内存和I/O带宽获得前所未有的提升。
毫无疑问,“根正苗红”的至强7500处理器在发布时受到了各大服务器厂商众星捧月一般的支持。但上市一段时间以来,虽然至强7500服务器凭借优异的计算性能在高端领域斩获颇丰,整个市场上更出风头的却是“同门师弟”至强5600(Westmere-EP);而且,采用至强7500整合大量应用的虚拟化案例并未此起彼伏地涌现。一位客户的道出了关键,“我所有的问题都处在内存上”。
众所周知,内存的速度和容量是制约服务器运行数据库等关键应用和划分多个虚拟机的瓶颈。若从参数看,Nehalem-EX在内存支持能力上已着力加强——集成内存控制器的至强7500可以支持16个DIMM/CPU,如果采用单条16GB的内存,那么每颗处理器可以支持的内存容量可以达到256GB,而一台四路系统的内存总量可以达到1TB……
然而问题就出在这里。首先,单条16GB的FB-DIMM内存迄今尚未大量供货,而且价格及其高昂。其次,至强7500每个内核能访问的DIMM数与前代相比并未提升,只有两个,如下表所示:
处理器 至强7100 至强7300 至强7400 至强7500
发布年份 2006年 2007年 2008年 2010年
每CPU内核数 2个 4个 6个 8个
频率 3.4GHz 2.93GHz 2.66GHz 2.26GHz
内存DIMM数/核 2个 2个 4/3个 2个
这种情况下,一台满配的四路至强7500固然是“大块头有大智慧”,计算资源足以灵活分配,整机性能所向披靡,甚至还可以向上扩展到八路。但如果用户希望根据应用需求采取精打细算、分步实施的策略,就难免会遇到“想扩内存必须先添加处理器”这样的难题。
被内存问题“束缚”的至强7500让不少希望在虚拟化应用上掌握更多灵活性的用户心有所向却难以入手。
MAX5性能加速箱给至强松绑
如前文所述,内存容量和带宽对虚拟化应用的重要性不言而喻,单个虚拟机获得的内存分配量直接决定其响应速度,关系其性能。因此要想让Nehalem-EX处理器充分发挥性能优势,将新一代至强服务器灵活部署在各种应用场景,就必须先从内存上“松绑”。
方法有了,服务器厂商要将之实现却殊为不易。目前看来,隶属于IBM X5服务器家族,名为MAX5的独立内存扩展单元堪称“四海一家的解决之道”。称为“性能加速箱”的MAX5的用途是配合IBM X5系列服务器,实现内存容量多达32个DIMM的“外部扩展”。举例而言,一台双路的System x3690 X5机箱本身就可以容纳上下两块,各带16个DIMM槽的内存板,如果再配上MAX5内存扩展单元(上有32个内存DIMM),即一台x3690 X5可以扩展到64个DIMM。而如果通过QPI线缆将两台x3690 X5连接形成四路系统,支持的内存DIMM数就可以达到128条!

 

MAX5内存盒给至强松绑 IBM X5架构继往开来_第1张图片 
MAX5 实物图

MAX5带来的好处显而易见。对于高端用户来说,更大限度地扩充内存有利于支持更高要求的应用,并且可以通过增加虚拟机数量提高服务器利用率。对于中端用户而言,双路服务器由此取得了在数据库应用上媲美四路服务器的机会,性价比大幅度提升。而且,MAX5还集成了探听过滤器,可以协助处理器进行内存管理,提高内存访问的整体性能。
由于服务器上运行的软件大多是按照处理器数量计算许可证费用(例如VMware ESXi和微软SQL Server),精明的CIO甚至可以通过部署MAX5省钱。经IBM测算,MAX5可以帮助 X5系列服务器在相同数量的许可证下多运行82%的虚拟机。
 

 

继往开来的第五代X架构
MAX5独树一帜的功能固然引人注目,但隶属于IBM X5架构(第五代X架构)的它并非孤立的存在。
X架构又称EXA,全称“企业级X架构”(Enterprise X Architecture),是IBM专门为英特尔至强系列处理器开发的服务器平台架构。围绕XA-64e芯片组技术上的创新,EXA的每一代产品相较同期英特尔推出的原厂平台都有显著的功能扩展和性能提升。比如基于第一代EXA架构的x440服务器,突破性地实现了16插槽的扩展能力;第二代产品x445更是通过级联实现了32路扩展,而当时英特尔的原厂平台只能支持到四路。发展到第三代,EXA平台加入了轮询过滤缓冲(Snoop Filter)设计,有效降低了多路处理器之间进行数据轮询的延迟,提高了多路服务器的企业级应用性能,同样的设计直到两年后才在英特尔平台上出现。
第四代EXA平台继续将AS/400、RS/6000、S/390等主机上经过市场充分验证的关键技术移植到x86架构上,不断刷新计算性能记录的同时,大大加强整个系统的可靠性, 推动产品进入企业核心应用领域。由于摒弃了在能耗、延迟方面广受诟病的FB-DIMM(全缓冲内存),代之以技术成熟的高主频DDR2内存,IBM System x3850 M2/x3950 M2服务器的内存延迟比其他品牌的至强7400服务器低至少40%,而内存带宽相应提高了60%。作为彼时的“当家花旦”,8路的System x3950 M2服务器在TPC-C基准测试中为x86架构首破120万TPM(Transactions Per Minute,每分钟交易处理数)大关。
历时5年,耗资8亿美元的X5架构无疑担当了继往开来的重任,以至于被IBM大中华区董事长兼首席执行总裁钱大群称为“过去十年以来IBM 最重要的发布”。它的典型新功能包括:
MAX5——通过外置 MAX5 内存机箱实现前所未有的内存扩展,使得服务器内存与系统处理器之间不存在耦合关系,从而有助于优化服务器性能,支持更多虚拟化应用;
eXFlash——基于独特的闪存技术,通过替换温彻斯特硬盘阵列和相关线缆,eXFlash可以使存储成本下降多至97%;
FlexNode——提供物理分区能力,使一台系统既能“一分为二”也能“合二为一”,这将允许用户在同一系统上白天运行基础架构应用,夜间进行批处理作业,从而带来卓越的资产利用率;
可扩展性——支持所有的eX5 服务器进行级联扩展,继续加强“随增长付费” 能力
工作负载优化系统——利用 IBM 的行业专业知识,最大程度地缩短投资回报周期
重新定义工业标准服务器的游戏规则
到访中国时,IBM系统与科技部System x全球总经理Adalio T.Sanchez曾宣称:“X5的发布将重新定义工业标准服务器的游戏规则。”
除了以上言及的各项新技术,Adalio所谈的还包括X5服务器的多样化形态和普适定位。过去X架构仅用于构建System X系列中四路、八路这样的高端机型,而X5架构将普及到应用更为广泛的双路服务器和刀片服务器中。在X5架构的支撑下,内存容量的提升使得每台物理服务器所能托管的虚拟机数量也可以成倍数增加,同时降低了每个虚拟机承担的能耗和制冷成本,中端用户不再需要仅仅为了更大的内存容量去购买价格高出一大截的四路服务器。
目前,四路的System x3850 X5,两路的System x3690 X5以及全新的IBM BladeCenter  HX5已渐次登场,不论是内存密集型还是计算密集型的工作负载,用户都可以根据需求的不同自由选择,灵活搭配——这不正是企业在云计算时代构建IT基础架构的最佳选择么?

 

  

X5 架构System X全家福