随着计算机中CPU核数目的增加,传统的UMA(unifonn memory access)架构由于对关键硬件(如中央内存控制器)的竞争加剧出现了性能上的瓶颈,即扩展性不强。而NUMA架构则以其良好的可扩展性,逐渐成为多核系统的主流架构。本节主要介绍一下目前三大主流的架构体系。

 

在传统的PC机上我们的CPU和内存是这样互联的:

CPU与内存互联的架构演变_第1张图片

CPU和内存之间的交互,中间通过北桥芯片进行转发和交互,如图,途中显示了一个CPU的情况下和内存的连接架构图。

在最初的时候,我们的电脑都单颗CPU的,随着我们工艺的进步和我们应用的越来越复杂,我们发现单颗CPU以及无法承载我们的计算能力,那么解决的办法就是多来几颗CPU,只要在我们的电脑主板上多加几个CPU插槽,就可以增加CPU的数量,当然这样加CPU不能随便在主板上找个空地插上吧,计算机底层全部都是基础电路,所以对于他的体系结构设计就显得很重要,所以在进过一众高手的理论和实践之后,出来了一种如下所示的架构:

CPU与内存互联的架构演变_第2张图片

如图,我们这里显示了4颗CPU,每个CPU 4核心,组成一个多处理结构。当然这里面还有很多的技术细节,但是在这里我没法一一呈现。我们知道,在CPU当中,每个CPU有几个核心,就表明同一时刻可以有多少个进程可以运行。如图,如果一颗CPU的核心数是4核心的话,那么他就支持在同一时刻同时运行4个进程,开启了超线程技术之后,就可以同时运行8个进程。所以在上图中,我们的计算能力就是4x4=16,如果开启超线程就是4x4x2=32。

 

SMP架构

 

在上图中间,CPU的处理能力增加了,内存的存储容量提升了,但是这个时候瓶颈就出现在了北桥芯片上,于是那掉中间的北桥芯片,让CPU直接和内存进行交互。如下图:

CPU与内存互联的架构演变_第3张图片

这就是SMP架构,SMP(Symmetric Multi-Processing),对称多处理结构的简称,是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和其他的主机资源。以上这段介绍摘自百度百科。

SMP模式将多个处理器与一个集中的存储器相连。在SMP模式下,所有处理器都可以访问同一个系统物理存储器,这就意味着SMP系统只运行操作系统的一个拷贝。因此SMP系统有时也被称为一致存储器访问(UMA)结构体系,一致性意指无论在什么时候,处理器只能为内存的每个数据保持或共享唯一一个数值。很显然,SMP的缺点是可伸缩性有限,因为在存储器接口达到饱和的时候,增加处理器并不能获得更高的性能。SMP系统有时也被称为一致存储器访问(UMA)结构体系。

 

MPP架构

 

由于SMP的缺点,人们开发出了另一种架构来试图避免这种缺点,这种架构就是MPP架构,其结构如下图所示:

CPU与内存互联的架构演变_第4张图片


MPP是一种分布式存储器模式,能够将更多的处理器纳入一个系统的存储器。一个分布式存储器模式具有多个节点,每个节点都有自己的存储器,可以配置为SMP模式,也可以配置为非SMP模式。单个的节点相互连接起来就形成了一个总系统。MPP体系结构对硬件开发商颇具吸引力,因为它们出现的问题比较容易解决,开发成本比较低。由于没有硬件支持共享内存或高速缓存一致性的问题,所以比较容易实现大量处理器的连接。

 

NUMA架构

但是这种MPP架构每个处理器只能访问他自己的本地的存储,而不能访问别是处理器的存储,这就可能造成可能这个处理器需要的存储资源比较多时,没法远程调用其他处理器的存储资源,而且也可能另一个处理器的存储资源总是处于闲置状态,为了解决这个问题,开发了另一种架构,即NUMA架构,如下图:

CPU与内存互联的架构演变_第5张图片

非统一内存访问(NUMA)是一种用于多处理器的电脑记忆体设计,内存访问时间取决于处理器的内存位置。在NUMA下,处理器访问它自己的本地存储器的速度比非本地存储器(存储器的地方到另一个处理器之间共享的处理器或存储器)快一些。

NUMA架构在逻辑上遵循对称多处理(SMP)架构。 它是在二十世纪九十年代被开发出来的,开发商包括Burruphs (优利系统), Convex Computer(惠普),意大利霍尼韦尔信息系统(HISI)的(后来的Group Bull),Silicon Graphics公司(后来的硅谷图形),Sequent电脑系统(后来的IBM),通用数据(EMC), Digital (后来的Compaq,HP)。 这些公司研发的技术后来在类Unix操作系统中大放异彩,并在一定程度上运用到了Windows NT中。

NUMA通过提供分离的存储器给各个处理器,避免当多个处理器访问同一个存储器产生的性能损失来试图解决这个问题。对于涉及到分散的数据的应用(在服务器和类似于服务器的应用中很常见),NUMA可以通过一个共享的存储器提高性能至n倍,而n大约是处理器(或者分离的存储器)的个数。

  NUMA既保持了SMP模式单一操作系统拷贝、简便的应用程序编程模式以及易于管理的特点,又继承了MPP模式的可扩充性,可以有效地扩充系统的规模。这也正是NUMA的优势所在。