首先,介绍一下Nas Parallel Benchmark,其缩写为NPB,中文翻译为NAS并行基准测试程序。NPB是由美国国家航空航天局开发的一套代表流体动力学计算的应用程序集,它已经成为公认的用于评测大规模并行机和超级计算机的标准测试程序。NPB由8个程序组成,包括5个核心程序和3个模拟应用,分别从不同的方面反映了流体动力学计算的特点。NPB中每个基准测试程序有5类问题规模,分别为A、B、C和S、W。其中,A类的规模最小,C类的规模最大,而W(Workstation)类通常用于工作站,S(Sample)类是样例程序。NPB中每个应用都有其各自的特点,其中IS基准程序由C 语言编写,大部分计算是整数算术运算,其它7个基准程序均由FORTRAN 77编写,是浮点密集型计算。

其次,介绍一下它的各个应用的通信特点:

1.整数排序(IS)基准测试检测整数计算速度和通信能力,它检测并行排序操作,不包含浮点运算;但使用了显著的通信数据。整数排序对通信潜伏期敏感,因此低潜伏期的互相连接和高带宽在大量通信的应用中,尤如在IS中,倾向于有较好的性能。

2.繁杂并行(EP)检测按照特殊的方案产生一对高斯无序偏差。主要执行浮点数计算,EP显著的特点是不执行任何处理器间的通信,因此用不同的互相连接得到的结果显示同样的执行特点。

3.快速Fourier转换(FT)检测长距离的通信,利用快速傅立叶变换来解一个求解3维的偏微分方程,有大量计算的FT执行多种谱分析方法的实质性任务。

4.多栅格基准测试(MG)检测短距和长距的高度结构化的通信。MG是一个简化的多栅格核心,它有不变的系数而不是类似于许多滞弹性应用的可变系数问题。

5.共轭梯度方程求解(CG)基准测试检测不规则的长距离通信。CG基准测试使用共轭梯度方法计算较大的稀疏对称有限矩阵的最小特征值。CG是典型的非结构栅格计算,因为它是使用非规则的长距离通信和稀疏矩阵矢量乘法。

6.上下对角线(LU)检测细小块通信。此基准测试采用对称的连续松弛数字方案求解规则的稀疏方块5×5的下面和上面的三角矩阵系统。在LU中大多数的MPI通信使用“方块化”MPI发送和MPI接收。此外其大都是较小片段的通信,而且信息尺寸跨越一个数量级。由于算法实现上没有高度并行化,大多数MPI操作处于阻塞模式。其性能瓶颈主要发生在网络互连方面。

7.标量五角(SP)和块状三角(BT)倾向于检测计算和通信之间的平衡。与其它程序的不同的是,SP和BT需要处理器的平方数。在此两个基准测试中,对非对角性的SP和BT方程的多个独立系统分别求解。虽然SP和BT是相似的,但在通信与计算的比率上有基本的差别,SP比BT有更高的通信强度。