并行计算机系统结构
中国首台千万亿次超级计算机“天河一号”(北京时间2010年11月17日,国际超级计算机TOP500组织正式发布了第36届世界超级计算机500强排行榜,“天河一号”以相当的优势排名世界第一,成为世界运算速度最快的超级计算机。“天河一号”夺取世界冠军的消息吸引着全球媒体的眼球,也引发了人们对超级计算机的关注。)
B(Bridge)是存储总线和I/O总线间的接口,
DIR(Cache Directory)是高速缓存目录,
IOB(I/O Bus)是I/O总线,
LD(Local Disk)是本地磁盘,
MB(Memory Bus)是存储器总线,
NIC(Network Interface Circuitry)是网络接口电路,
P/C(Microprocessor and Cache)是微处理器和高速缓存,
SM(Share Memory)是共享存储器。
1) 单指令多数据流SIMD(Single Instruction Multiple-Data)
2) 并行向量处理机PVP(Parallel Vector Processor)
|
Cray C-90、Cray T-90、NEC SX-4和我国的银河1号都是PVP。系统中包含了少量的高性能专门设计定制的向量处理器VP(Vector Processor),每个至少具有1Gflops的处理能力。系统中使用了专门设计的高带宽的交叉开关网络向VP连向共享存储模块,存储器可以M/s字节的速度向处理器提供数据。
这样的机器通常不使用高速缓存,而是使用大量的向量寄存器和指令缓冲器。
3) 对称多处理机SMP(Symmetric Multiprocessor)
|
IBM R50、SGI Power Challenge、DEC Alpha服务器8400和我国的曙光1号等都是这类型的机器。SMP系统使用商品微处理器(具有片上或外置高速缓存),他们经由高速总线(或交叉开关)连向共享存储器。这种机器主要应用于商务,例如数据库、在线事务处理系统和数据仓库等。重要的是系统是对称的,每个处理器可等同地方问共享存储,限制系统中的处理器不能太多(一般小于64个),同时总线和交叉开关互连一旦做成也难于扩展。
4) 大规模并行处理机MMP(Massively Parallel Processor)
Intel Paragon、Cray T3E、Inter Option Red和我国的曙光-1000等都是这种类型的机器。MMP一般是指超大型(Very Large-Scale)计算机系统,他具有如下特征:
①处理结点采用商用微处理器;
②系统中有物理上的分布式存储器;
③采用高通信带宽和低延迟的互联网络(专门设计和定制的);
④能扩放至成百上千乃至上万个处理器;
⑤它是一种异步的MIMD机器,程序系由多个进程组成,每个都有其私有地址空间,进程间采用传递消息相互作用。
MMP的主要应用是科学计算、工程模拟和信号处理等以计算为主的领域。
5) 分布共享存储DSM(Distributed Shared Memory)
Stanford DASH、Cray T3D和SGI/Cray Origin2000等属于此类结构。高速缓存目录DIR用以支持分布高速缓存的一致性。DSM和SMP的主要差别是,DSM在物理上有分布在各个节点中的局存,从而形成了一个共享的存储器。对用户而言,系统硬件和软件提供了一个单地址的编程空间。DSM相对于MPP的优越性是编程较容易。
6) 工作站机群COW(Cluster of Workstations)
Verkeley NOW、Alpha Farm、Digital Trucluster等都是COW结构。在有些情况下,机群往往是低成本的变形的MMP。
COW的重要界限和特征是:
①COW的每一个节点都是一个完整的工作站(不包括监视器、键盘、鼠标等),这样的节点有时叫做“无头工作站”,一个节点也可以是一台PC或SMP;
②各节点通过一种低成本的商品(标准)网络(如以太网、FDDI和ATM开关等)互连(有的商用机群也使用定做的网络);
③各节点内总是有本地磁盘,而MPP节点内却没有;
④节点内的网络接口是松散耦合到I/O总线上的,而MPP内的网络接口是连到处理节点的存储总线上的,因而可谓是紧耦合式的;
⑤一个完整的操作系统驻留在每个节点中,而MPP中通常只有一个微核,COW的操作系统是工作站UNIX,加上一个附加的软件层,以支持单一系统映像、并行度、通信和负载平衡等。
现今,MPP和COW之间的界限越来越模糊。机群相对于MPP有性能/价格比高的优势,所以在发展可扩放并行计算机方面呼声很高。
总结:
属性 |
PVP |
SMP |
MPP |
DSM |
COW |
结构类型 |
MIMD |
MIMD |
MIMD |
MIMD |
MIMD |
处理器类型 |
专用定制 |
商用 |
商用 |
商用 |
商用 |
互连网络 |
定制交叉开关 |
总线、交叉开关 |
定制网络 |
定制网络 |
商用网络(以太、ATM) |
通信机制 |
共享变量 |
共享变量 |
消息传递 |
共享变量 |
消息传递 |
地址空间 |
单地址空间 |
单地址空间 |
多地址空间 |
单地址空间 |
多地址空间 |
系统存储器 |
集中共享 |
集中共享 |
分布非共享 |
分布非共享 |
分布非共享 |
访存模型 |
UMA |
UMA |
NORMA |
NUMA |
NORMA |
代表机器 |
Cray C-90 Cray T-90 银河1号 |
IBM R50 SGI Power Challenge 曙光1号 |
Inter Paragon IBM Option White 曙光-1000/2000 |
Stanford DASH Cray T 3D |
Berkeley NOW Alpha Farm |