学科前沿技术(高性能计算机)

高性能计算机:

       二十世纪八、九十年代是高性能计算机丰富多彩的时期,各种体系结构的系统争奇斗妍。进入二十一世纪,高性能计算机产业逐渐成熟,用户面大大扩大,技术也不断聚焦。工业界认为,现在主流体系结构收缩成三种,即SMP, CC-NUMA, Cluster。其他如MPP, Vector, Mainframe 虽有存在的价值,但不具有商业活力。在产品上只有两类产品具有竞争力。一是高性能共享存储系统,如IBM690, SUN Enterprise15000, SGI Origin3800;二是工业标准机群,包括以IA(Intel architecture)架构标准服务器为节点的PC机群和以RISC SMP标准服务器为节点的RISC机群。传统的超级计算机,在满足国家特定的应用需求上,依然存在它们的身影。这些系统的用户更关心性能而不十分在乎价格,如NEC SX6 Vector系统、Cray X1 MPP系统、IBM BlueGene-L MPP系统、定制节点的ASCI超节点机群系统。它们虽在产业中不能成为主流,但在技术上能成为HPC研究的驱动力,对产业有技术辐射作用。
  对高性能计算机产业影响最大的就是"工业标准机群"了,反映了标准化(Standardization)在信息产业的巨大杀伤力。工业标准机群采用量产标准化部件(volume commodity)构成高性能计算机系统,极大提高了性能价格比,从科学计算开始逐渐应用到各个领域。其中,推动了这一趋势形成的三个核心技术是Intel Xeon处理器、Linux操作系统和Myrinet互连网络。今天,我们从下面这张列表中可以买到搭建系统所需要的一切。

  •   CPU: Xeon/Opteron/Itanium;
  •   Memory: SRAM/DDR;
  •   I/O: HyperTransport/PCI-X/PCI Express;
  •   Storage: SCSI/FC/SATA/iSCSI;
  •   Network: Myrinet/Quadrics/Infiniband/G-Ethernet;
  •   Boxing: Chassis/Cabinet/Cable;
  •   OS: Linux/GNU Compiler/Java/Luster;
  •   Protocol: GM/VIA/Verb/MPI/PVM/uDAPL;
  •   Library: MKL/ESSL/ACML/Scalapack/Gauss;
  •   Management: CMS/PBS/LSF/Vampir;
  •   Application: Paradiam/LS-DYNA/Cerius/MM5/Blast/Oracle RAC;
  •   Integration: LinuxNetworx/Scali;

  高性能计算机的产业现状对中国学术界的最大影响是"Are We Lost?"(我们是否迷失了?) 。其中we = 系统研究者。以前,工业界不能给国家、关键行业、科研教育合理地提供所需要的高性能计算设备,提供一台可用"系统"是HPC研究的主要目的,就像为两弹一星,为石油勘探提供计算工具那样。这样情景一直持续到不久的过去。“我们”突然发现在提供多少多少亿次系统的能力(capability)这一衡量标准上面,和研究生们,工程师们相差无几。在企业面前,"我们"也似乎失去了存在的价值。"我们"的研究结果将我们自己逼到了墙角。在世界范围,这种情况同样存在。从ISCA会议有关系统的文章逐年直线下降可以印证。
  就工业标准机群而论,是否已经完善,再没新技术可供研究了呢?显然不是。这一技术路线只解决了方便廉价地组合系统这一问题,未解决的问题很多,下面将会阐述。现在的困惑是:以前是"三角形"技术路线,部件在下面,顶端是系统,用峰值或Linpack就能清楚地表述结果;现在是"放射状"技术路线,不同的技术解决不同应用的问题,多目标,将系统做为一个整体,缺乏新的衡量指标(尽管有 HPCS,尚停留在概念阶段),缺乏象龙芯-2 CPU研制提出的" [email protected] + SpecCPU2000=300"这样简洁的目标。拿一台系统和另一台系统相比,变得很难公平合理地衡量。从系统的整体这个角度,你看不出大学师生搭的系统和IBM销售给企业的系统之间的区别。说的软硬件部件都是同样的名词。不管你说什么,每个人都可以说"me too"。必须将系统的每个部分细节地进行比较,才能显出差别和优势。这些说明HPC研究在技术突破上处于停滞状态。
        网格计算机(Grid Computer)代表了我们在计算机系统的组织和部件技术的研究方向,是我们在"广"这个方向上的努力。研究动机是,网格的理念与特征是否可应用于计算机系统呢?即在网格环境下的计算机系统在部件和组织上应有所创新,如同网络改变了计算机系统一样(如NFS )。现有的IA架构服务器的技术被标准化了,大到每一个部件,小到机箱的尺寸,开槽的位置,在网格的推动下,应有所突破。

你可能感兴趣的:(学科前沿技术(高性能计算机))