一.电磁仿真计算特点与硬件配置分析
电磁场仿真软件广泛应用于无线和有线通信、计算机、卫星、雷达、半导体和微波集成电路、航空航天等领域,从毫米波电路、射频电路封装设计验证,到混合集成电路、PCB板、无源板级器件、RFIC/MMIC设计,天线设计,微波腔体、衰减器、微波转接头、波导录波器等设计等。
1. 电磁仿真算法分类、计算特点
计算电磁学(CEM)方法大致可分为2类:精确算法和高频近似方法。
(1)全波精确计算法
包括差分法(FDTD,FDFD)、有限元(FEM)、矩量法(MoM)以及基于矩量法的快速算法(如快速多极子FMM和多层快速多极子MLFMA)等,其中,在解决电大目标电磁问题中最有效的方法为多层快速多极子方法。
(2)高频近似方法
一般可归作2类:一类基于射线光学,包括几何光学(GO)、几何绕射理论(GTD)以及在GTD 基础上发展起来的一致性绕射理论(UTD)等;另一类基于波前光学,包括物理光学(PO)、物理绕射理论(PTD)、等效电磁流方法(MEC)以及增量长度绕射系数法(ILDC)等。
算法计算特点汇总如下
小结
1.时域算法,属于显式算法,传统的CPU多核加速比好,核数越多计算越快,此外,并行度高,支持GPU加速计算,注意大部分求解器对GPU要求是双精度计算为主,也就是说需要用双精度性能高的GPU卡。
2 频域算法,属于隐式算法,支持多核并行计算,但核数并行计算有限,不支持GPU计算,提升性能的手段,就是提升CPU的频率,足够大的内存,值得注意当内存非常大的时候(超过192GB),硬盘io性能非常关键。
2.对并行计算求解过程分析
如何配置CPU要根据求解过程和算法特点,尤其要了解时域、频域两大算法特点紧密结合,这样才能更高效更合理,从并行求解流程图看,循环计算过程是单核和多核交叉过程。
上图可以看出,CPU选型非常重要,CPU睿频足够高,大幅缩短【阶段1】求解时间,和整机足够核数+高频运行,大幅缩短【阶段2】的求解器解算时间。常规工作站卖家,提供的机器往往多核忽视了睿频的重要性,整个计算过程效率非常低。
因此 硬件配置注意:
1.如果是时域算法为主,例如 FDTD、FIT求解器,由于并行度高,工作站配置尽量多核,可显著提升求解速度,同时注意阶段1睿频高的处理器更快,如果是以GPU计算为主,可以配置CPU频率高,核数少的,这样整个过程显著提升。
2.如果是隐式算法为主,例如 FEM,MOM求解器,由于并行度有限,一定要睿频尽可能高,同时保证足够的核数的并行,这样整个求解过程无死角瓶颈。
3.如果是多种算法并用,CPU要足够核数与高睿频之间选择一个兼顾的规格,三种应用(时域算法、频域算法、混合算法)都均能确保工作站硬件计算性能最大化。
考虑到上述计算特点,CPU的选择对整个求解过程极其重要,下面是最新上市的intel Xeon Schalable(可扩展)处理器多种规格,UltraLAB选型分析:
3.CEM求解规模与硬件配置推荐
a)基于时域算法~UltraLAB硬件配置参考(CPU类)
b)基于频域算法~UltraLAB硬件配置参考
c)基于超大规模时域算法求解GPU选型
如果以GPU求解为为主,可选的GPU卡参考下表
二.基于电磁仿真计算的UltraLAB机型介绍
UltraLAB是西安坤隆计算机科技有限公司推出的定制图形工作站品牌,经过多年发展,该产品拥有傲视群雄的三大领先优势:先进计算硬件架构、完整齐全行业应用定制方案、专业硬件系统优化技术,大幅超越同类的“图形工作站”产品,我们提供基于电磁仿真计算应用最快硬件架构产品系列。
1. 极速图形工作站H490介绍
配置特点:
(1)CPU具有超高的频率,中小规模时域与频域求解,发挥极致性能 6核5.0GHz,8~10核4.8GHz,12~14核4.6GHz,16~18核4.4GHz
(2)GPU 支持双GPU架构超算
显著优势:
和市场上单路cpu架构的工作站(单Xeon E5v4,单Xeon W-2100系列,单Xeon Schalable系列)相比,拥有超高频率,在多核并行计算(特别是频域求解),性能出众。
2.高性能计算工作站EX620
配置特点:
CPU 支持双Xeon Schalable(可扩展)处理器,拥有更高频率和更低延迟,中大规模时域与频域求解,发挥极致性能。
提供规格:
24核*4GHz/4.2GHz 36核3.7GHz/3.7GHz 40核3.1GHz/3.7GHz 48核*3.5GHz/3.7GHz 56核3.3GHz/3.8GHz
GPU 支持双GPU架构超算。
显著优势:
和市场上常规双路cpu工作站(双Xeon E5v4,双Xeon Schalable系列)相比,拥有更高频率,多核并行计算(时域、频域算法),定位精准高效,显式计算(EX620i)、显式隐式计算通吃(EX620)。
3.超大规模仿真计算机型Alpha720
配置特点:
CPU 支持4颗Xeon E7v4处理器(最高到96核),拥有更高频率和更低延迟,超大规模时域算法求解,极致性能
提供规格:72核2.8GHz,96核2.7GHz。
GPU 支持双GPU架构超算
显著优势: 市面上唯一的最快时域求解(CPU计算架构)工作站,极致性能还静音。
4.图灵超算工作站GX490M或GX620M
GX490M配置特点:
CPU 具有超高的频率,中小规模时域与频域求解,发挥极致性能
提供规格:10核4.8GHz,12~14核4.6GHz,16~18核4.4GHz
GPU 支持7块双槽GPU卡
GX620M配置特点:
CPU 支持双Xeon Schalable(可扩展)处理器,拥有更高频率和更低延迟,中大规模时域与频域求解,发挥极致性能。
提供规格:24核4GHz,36核3.7GHz,40核3.1GHz,48核3.5GHz,56核3.3GHz
GPU 支持9块双槽GPU卡
显著优势 市面上唯一的基于办公环境(静音级)最强大GPU超算性能时域求解计算系统,同时兼顾频域隐式算法极致性能展现
各种机型性能与差异对比表
三.电磁仿真计算硬件配置(单机与集群)推荐
提供单机CPU、单机GPU、集群架构的全面完整,代表追求目前最快计算架构硬件配置方案
1. 基于多种算法(CPU计算)单机工作站硬件配置方案
2. 基于时域求解(GPU计算架构)单机硬件配置方案
3. 基于分布式集群的硬件配置方案
方案1 基于CPU计算的分布式集群方案
方案2 基于CPU+GPU异构超算的分布式集群方案