Super Computer常用到的测试基准可以分为应用基准和微观基准两类,其中应用基准是偏向于某种应用的Benchmark,测试更具有针对性,而微观基准则更具普适性,更加偏向于纯粹的工具性能测试。
Linpack
Linpack是国际上流行的用于测试高性能计算机系统浮点性能的benchmark。通过利用高性能计算机,用高斯消元法求解N元一次稠密线性代数方程组的测试,评价高性能计算机的浮点性能。
Linpack测试包括三类,Linpack100、Linpack1000和HPL。
Linpack100求解规模为100阶的稠密线性代数方程组,它只允许采用编译优化选项进行优化,不得更改代码,甚至代码中的注释也不得修改。
Linpack1000要求求解规模为1000阶的线性代数方程组,达到指定的精度要求,可以在不改变计算量的前提下做算法和代码上做优化。
HPL(High Performance Linpack),即高度并行计算基准测试,它对数组大小N没有限制,求解问题的规模可以改变,除基本算法(计算量)不可改变外,可以采用其它任何优化方法。用户在不修改任意测试程序的基础上,可以调节问题规模大小N(矩阵大小)、使用到的CPU数目、使用各种优化方法等来执行该测试程序,以获取最佳的性能。HPL采用高斯消元法求解线性方程组。当求解问题规模为N时,浮点运算次数为(2/3 * N^3-2*N^2)。因此,只要给出问题规模N,测得系统计算时间T,峰值=计算量(2/3 * N^3-2*N^2)/计算时间T,测试结果以浮点运算每秒(Flops)给出。
前两种测试运行规模较小,已不是很适合现代计算机的发展,HPL则是针对现代并行计算机提出的测试方式。
HPCG
超算性能权威排名之一的TOP500是基于Linpack BenchMark性能( 最新版HPL 2.0规范从2008年一直用到现在 )作出的排名。不过随着时间的推移,应用程序对更复杂计算的需求已变得原来越普遍,TOP500创始人之一的田纳西大学教授Jack Dongarra认为 Linpack性能已经过时。
HPCG(The High Performance Conjugate Gradients),即高度共轭梯度基准测试,渐渐被认可作为全面衡量超算性能的benchmark。
与Linpack关注线性方程的计算性能不同, HPCG使用更复杂的微分方程计算方式 。Linpack衡量的是线性方程计算的速度和效率,无法测量这些更加复杂的计算程序。 由于越来越多的应用程序采用微分方程计算方式,所以每一轮全球超级计算机500强排行榜的Linpack性能数据与真实的数据之间的差距将越来越大 。
简单来说, Linpack更考验超算的处理器理论性能,而HPCG更看重实际性能,对内存系统、网络延迟要求也更高,所以任何HPC超算测出来的HPCG性能要比Linpack性能低得多 ,基本报中告有个 HPCG/HPL 比率可衡量计算效率,大部分超算的比例都在5%以内,1-3%的比比皆是。
GTC-P
GTC-P(Gyrokinetic Toroidal Code) 通过使用粒子单元算法求解Vlassov-Poisson方程来模拟离子通过托卡马克的运动。在每个PIC(particle-in-cell)时间步长期间,粒子的电荷分布被内插到网格上,泊松方程在网格上求解,电场从网格内插到粒子,并且根据电场更新粒子的相空间坐标。
Meraculous
Meraculous 是一种大规模并行基因组组装基准,构造并遍历存在于冗余短序列输入数据集中的长度为k(k-mers)的所有重叠子串的de Bruijn图。通过遍历de Bruijn图,并发现所有(可能断开的)线性子图,Meraculous能够构建基因组数据的高质量连续序列。
MILC
MILC基准 代码表示由用于研究量子色力学(Quantum Chromodynamics)的MIMD晶格计算(MILC)协作的一组代码,属于亚原子物理学强相互作用的理论,通过并联机器进行四维格子规格理论的仿真。属于物理研究和模拟场景下的基准。
MiniDFT
MiniDFT 是用于建模材料的平面波密度泛函理论(Density Functional Theory)的模拟应用程序。MiniDFT使用LDA或PBE交换相关函数计算Kohn-Sham方程的自相一致解。对于自相一致的场循环的每次迭代,构建Fock矩阵,然后对角化。为了构建Fock矩阵,使用快速傅立叶变换将平面波基(其中最容易计算的动能)转换为实际空间(其中电位被评估)和返回的轨道。
MiniPIC
MiniPIC 是解决具有反射壁的任意域中的静电场中的离散Boltzman方程。MiniPIC基准测试使用非结构化的基于hex或tet的网格以及用于粒子网格的静态分区。粒子被跟踪到每个单元格交叉区,打包后并使用MPI传递到相邻的处理器。主要代码库使用了Trilinos数学库中的Tpetra对象进行矩阵/向量操作。
PENNANT
PENNANT 是一款用于高级架构研究的应用程序。它具有用于操纵包含任意多边形的二维非结构化有限元网格的数据结构。PENNANT使用几何域分解支持MPI并行性,对使用MPI调用的处理器上实现的点数据进行采集和散射操作,还支持使用OpenMP或CUDA的线程并行。
SNAP
SNAP 作为代理应用程序来建模现代离散坐标中性粒子传输应用程序的性能。SNAP被认为是Sweep3D的更新,旨在用于混合计算架构。它是由洛斯阿拉莫斯国家实验室代码PARTISN建模的。
UMT
UMT 是建立在多个核分布式存储,多节点并行计算机系统上,执行三维非结构化空间网格上的时间依赖性,能量依赖性,离散坐标和非线性辐射问题的解决方案。为了实现极大的可扩展性,应用程序利用节点之间的消息传递和在节点内角度的线程算法进行空间分解。
Crossroads/N9 DGEMM 基准测试是一种简单,多线程,密集矩阵乘法测试。该代码旨在测量单个节点的持续浮点计算速率。
IOR(Interleaved or Random) 是最常见的BenchMark基准,旨在测量POSIX和MPI-IO级别的并行I/O性能。
Mdtest 是一个MPI协调的元数据基准测试,可以对文件和目录执行文件操作,基于不同操作报告性能。
STREAM 基准 用来测试持续的计算内存带宽。Crossroads/N9内存带宽基准测试是John D. McCalpin最初编写的STREAM基准测试版本的升级版。
https://wenku.baidu.com/view/d019e270d4d8d15abf234e0e.html
https://baijiahao.baidu.com/s?id=1572059645152096&wfr=spider&for=pc
https://baike.baidu.com/item/linpack/8831771?fr=aladdin