在高端关键服务器领域(4插槽或以上级别),自从IBM出售了其x86服务器业务之后,与英特尔决绝交锋的意味也就更加明显了,而2015年5月6日正式发布的至强E7 v3处理器家庭,无疑是这场交锋中最新的入局者。
有关高端服务器发展的必要性,我想在此已无需多言。虽然Scale-Out的架构获得了广泛的认同,但不得不承认,在某些应用场景下,Scale-Up系统仍然有其存在的必要性。当越来越多的应用和数据在云时代不断向后台集中时,对于当前很多关键业务,尤其是对响应速度、准确性、关联复杂度有较高要求的负载,是否真的是廉价的双路服务器配以Scale-Out架构就能搞定的呢?显然不是,这就好比HPC(高性能计算)领域中的OpenMP(单系统)与MPI(集群)架构之分,理论上讲机器内部的通讯速度与响应时间永远要好于分布式的互联,这种本质上的区别也预示着单靠其中一种架构都不可能独霸天下。事实上,也正是因为信息处理量的急剧提升,也让关键业务服务器在大规模即时数据分析与在线交易等应用中的地位更加突显。
也正是基于这样的应用需求,英特尔与IBM都不会放弃这一市场,反而会不断的对这一级别的服务器进行创新、变革。而最终的交锋对象就是E7与POWER8(在主流的应用服务器市场,IBM也希望用POWER来对抗英特尔至强E5,但这不在本文的讨论范围)。
在去年4月,笔者就当时发布的E7 v2进行了性能分析,可以看出E7的性能有了明显的进步,在与POWER8的竞争中,已经有了比肩的可能,而时隔一年之后,E7 v2的接班人的表现又会怎样呢?今天我们就来看一看!
至强E7 v3的主要改进和规格提升
E7 v3相对于E7 v2的提升之处(图中蓝色字部分)
相对于E7 v2,E7 v3重点提升部分的优势说明,这里有必要提醒大家关注一下TSX(Transactional Synchronization Extensions),在我看来,这是其最主要的功能性改进之一
E7 v3属于英特尔TOCK级的产品线,即核心架构进行了较大的改良,代号Haswell-EX,而E7 v2则是TICK级产品(代号IvyBridge-EX)。相较E7 v2,E7 v3的主要提升在于:
l 处理器核心数量从15个提高到18个
l 支持第二代AVX指令集,双精度浮点处理性能提升一倍
l QPI速率从8GT/s提升到了9.6GT/s
l 支持DDR4内存,最高速率1866MT/s
l 内存缓冲速率从2667MT/s提升至3200MT/s
l 新一代RAS(可靠性、可用性与可维护性)设计:第二代MCA架构(eMCA 2.0)/多列内存备用/DDR4地址与命令信号校验与恢复/关键内存区镜像等
l 一些核心与电源管理的增强设计(如虚拟化方面的支持)。
E7 v3不再有面向双插槽系统的2800系列,而且4800与8800系列也进行了结合,按照一个统一的“系统平台空间”(基础-标准-高级,而非严格按照插槽数量)进行型号的划分,也因此相较E7 v3,主流型号(SKU)少了一半,同时新增加了4款面向HPC(高性能计算)的型号
E7 v3家族所有成员规格列表
有关于E7 v3非常细节的技术设计(比如崭新的内部双环互联架构),并不是本文的重点,有兴趣的读者可以自行找资料深入了解。不过有一点我觉得有必要重点说一下,那就是TSX,即交易同步扩展指令集(Transactional Synchronization Extensions)。
其实,TSX本来就是Haswell的一个新能力,但发布之后即发现了Bug,所以立刻在芯片内部禁用,至强E5v3亦受到此影响而取消了这一功能,如今这一问题在E7 v3上得以修复,正式投入使用。
TSX的目标是针对传统“内存锁”的,所谓的内存锁,是一种防止不同线程操作相同内存区域的机制,以防止数据发生同步问题,这一点在交易处理中非常重要。在实际的应用中,单一时间段里,内存锁赋予单一线程锁定内存的能力,在这一状态下,其他线程不可以访问相应的内存数据,即使是读取也不可以,所以在并行处理中,其他线程要等到内存锁才能获得内存访问的权限,显然这个设计对于线程关联较为紧密的应用效率是有很大阻碍的。而TSX则打破了这种传统的束缚,可以让软件在开发者不用再担心如何利用内存锁,而应用的实际效率也获得了明显提升。我个人认为,TSX可算是E7 v3带给应用开发者最大的礼物,在某种程度上讲,它所带来的性能收益要远高于硬件规格本身的提升。
英特尔TSX的说明,分为硬件锁省略(HLE,Hardware Lock Elision)和受限事务内存(RTM,Restricted Transactional Memory)两种模式
紧逼POWER8——E7 v3的性能表现
相对于E7 v2,英特尔给出了较为详细的E7 v3基础性能的表现,总体上来看,其与核心数量的提升基本是吻合的。
相对E7 v2的主要型号,E7 v3所对应型号的性能表现,可以看出整数性能提升最高达到了56%,而顶级型号之间的差距则并不明显
为了更好的考查E7 v3在整体市场里的实力,还是按老规矩,我搜集了SPEC与SAP官方面的性能测试数据,来看看E7 v3的实力到底如何。以下测试成绩,均选择相关CPU/系统最好的成绩,采集日期截止至2015年5月20日。
整数计算性能测试
在整数性能测试中,4插槽平台,可以看出相较E7 v2-8890,E7 v3-8890提升了18.9%,比英特尔给出的数据要高,而在8插槽平台方面,则较E7 v2提升了19.3%,虽然具体的机器不,但也可以看出8插槽的E7 v3的实力,比8插槽的IBM Power E870高了13%。由于企业级应用中,整数性能远比浮点性能重要,所以这个反超对于E7乃至x86平台均有重要的意义。
浮点计算性能测试
在浮点计算测试中,由于没有加入AVX,所以还是实打实的CPU本身核心性能,E7 v3比E7 v2提高了15.6%,不过这个成绩与POWER8比还是有比较大的距离,当然如果能充分利用AVX 2.0的话,浮点性能将会提升两倍,与POWER8也就基本可比了。
SAP ERP性能测试
在SAP ERP测试中,4插槽平台,E7 v3较E7 v2提升了24%,8插槽平台提升了19%,而8插槽的E7 v3已经超越12插槽的POWER7+,这同样是一个有意义的事件,不过8插槽的POWER8仍然强悍,较E7 v3仍然有明显的优势。
借助E7 v3平台的TSX扩展指令集,SPA HANA性能较E7 v2平台提升5.9倍
然而,我们之前介绍过英特尔的TSX指令扩展对于企业级应用的可能价值,SAP的另一款著名的应用HANA则给我们一个有力的参考,在支持TSX后,SAP HANA的性能比E7 v2平台有了明显较上述传统测试更明显的提升,这也表明了TSX对于应用性能的影响是巨大的,如果优化得当,所获得的性能提升要远远高于E7 v3本身物理规格的增强。
8插槽E7 v3平台与Power E870的4年生命周期TCO对比,这里不仅仅包括了硬件的初始采购成本,还包括供电、制冷、设备维护、软件与操作系统的授权/支持费用等,根据英特尔2015年2月份进行的一次内部测试,4年TCO核算下来,E7 v3平台比E870降低了85%之多
另一方面,从整体平台的综合应用来说,x86平台的性价比的优势则非常明显,与E870相比,8插槽的E7 v3在综合性能表现上是可以比拼的(对于企业应用更重要的整数性能高出了13%),能耗性能比方面,领先了60%,而在总体拥有成本(TCO)方面则节省了85%。
总结:POWER8的日子将更不好过了
毫无疑问,E7 v3将会给IBM POWER8带来更大的压力,除了硬件规格本身的进步外(包括性能容量与RAS),对于应用的优化支持可能更为关键。从上文的测试数据中可以看出,E7 v3给ISV提供了除硬件规格之外更为有效的应用性能优化的途径,相信过不了多久,支持TSX的企业级应用就将迅速增多,并带来用户体验的整体提升。这一点又将引出E7以及x86平台的另一个优势——生态环境的吸引力。
尤其是当与POWER的能力(包括性能与RAS)基本可比之后,x86平台的性价比优势将进一步带动其生态环境的发展,而这也会进一步带动传统用户的迁移。事实上,虽然很多传统关键业务领域的主流应用都是基于RISC+UNIX平台开发的,但近几年,已经越来越多的移植到x86平台,POWER平台所独占的应用几乎绝迹,在这样的情况下,也就不难想象双方未来竞争对决的可能趋势。虽然POWER8平台也在力主开放,可是从整体的生态环境建设来讲(不仅限于关键业务应用,也包括主流与前端应用平台),目前仍然不能与x86相比,况且现在性能又不占绝对强势,性价比也不占优,在这样的基础设施平台的大环境中,POWER关键业务平台孤军奋战的感觉也将越来越明显。
根据IDC的市场调研报告,在4路及4路以上高端服务器市场,x86平台的占有率已经从2013年的81%提升至2014年的94%,而传统的RISC系统则从约18%下降至约4.6%
从市场的趋势中,我们也能明显感受到POWER这类的传统RISC系统的逐渐势弱,但这并非市场对于高端服务器的需求迅速下滑所致,因为它们所丧失的市场大部分被E7平台所继承,即它们的下滑伴随的是E7市场占有率的提升。这背后的逻辑就在于E7平台自身性能与RAS不断进步,以及系统设计的成熟(比如HP将其UNIX小型机的架构移植到了最新的Superdome X 16插槽E7服务器上),带动了其性价比的不断攀升,从而吸引更多的生态伙伴的加盟,并最终带动了整体市场的变迁。就这一点,我们也可以看出市场对于E7这类平台的需求是有市场基础的。
伴随着英特尔OEM伙伴们的E7 v3服务器的陆续出货,IBM POWER家族显然将会体会到更大的紧迫感,也许到了POWER9发布时才会有所缓解,而到那时,E7也将迎来第四代甚至第五代掌门人,双方的较量还会继续下去,是POWER逐渐扭转颓势,还是E7会乘胜追击,就让我们静观其变吧