众所周知,超算最早的应用领域是在科学计算,包括国防、航空、能源、电力、汽车、生物、气象、仿真等领域,因此超算亦被称之为“国之重器”,它不仅代表着一个国家在科学计算方面的实力,更是一个国家在经济建设中打造核心竞争力的关键武器。
与此同时,超算经过一代代的发展,特别是来自互联网等新兴负载工作的大量出现,如今的超算不仅在科学计算方面的贡献日益突出,更是被广泛应用于自然语言、图像识别、自动驾驶等人工智能新领域。
确实如此,在近期于美国丹佛举办的SC17上,包括E级计算、人工智能和HPC云化在内的话题继续成为大会热议的焦点。究其背后的原因,还是人类在计算力的获取上,始终有着更高、更强的追求。
毫无疑问,这意味着一个全新的计算行业黄金时代的到来。在这个过程中,在HPC 加速计算和AI 计算中均扮演了重要角色的NVIDIA ,正在全力的推动超算和AI的深度融合,并降低人工智能计算的门槛。在NVIDIA的不断努力下,超算创新的边界正在被重新定义,基于超算的各种创新应用更被不断的无限延伸和扩展。
重新定义的超算市场
在今年的SC17上,最大的一个感受莫过于,人工智能已成为超算市场最新的风向标。
可以说,超算和人工智能有着天然的联系,超算不仅可以加速人工智能的快速发展,更随着人工智能的不断成熟,又反过来促进了超算系统更好的部署和应用,因此二者之间是相互促进、相互融合的关系。
例如,在最新公布的TOP500榜单中,由GPU加速的系统增加了34个,增幅再创新高,总数更是达到了87个;同时,GPU在榜单中的总petaflops增幅也达到28%;此外,在Green500榜单的前20个最高效的超级计算机中,由GPU提供支持的系统也占据了14个。
除此之外,在中国上榜的202套系统,计算加速系统数量为51套,占全部计算加速系统的50%。其中,49套采用GPU加速,2套采用英特尔至强融核加速。
这些数据说明了这么一个趋势,那就是在超算未来三个主要发展方向:模拟仿真、数据分析以及人工智能中,人工智能消耗计算力的速度,远比想象的要快得多,尤其是随着神经网络层数的增大,层间连接的增加,数据规模的不断膨胀,加上未来新的模型和算法的出现,将让人工智能对计算能力的需求有几何级的增长。
值得关注的是,在这个变化过程中,由于GPU加速器强大的并行处理能力,可以让超算科研人员顺利去设计深度神经网络,轻易的模仿人的思维结构。此外,加上GPU加速器具备强大的经济性,也能让更多的超算科研人员设计出在每一个单元榨取更多性能的机器。
所以,这让基于GPU设计的全新系统,成为了超算市场中最受关注的新领域之一。
根据Top500.org官方网站的报道,美国能源部橡树岭国家实验室正在建造的HPC系统“Summit”,这套新的系统使用每节点采用2 IBM POWER 9 + 6 NVIDIA Tesla V100 GPU的CPU + GPU架构,使得每个节点能够提供大约40TeraFlops的性能,其性能巅峰将高达200 PetaFlops,这将远超中国神威太湖之光93 PetaFlops的性能,预期明年将成为全球排名第一的超算系统。
不仅如此,来自美国劳伦斯利弗莫尔国家实验室的Sierra和由日本国立高级工业科技研究所运营的ABCI(AI Bridging Cloud Infrastructure)也将紧随其后采用GPU加速器。
据了解,NVIDIA最新的Tesla V100加速器,可以将100个CPU的计算能力集成到了一个GPU中,同时能耗仅为上一代GPU的一半。重要的是,上述三者都同时搭载了CPU和GPU,并全部通过最新的NVIDIA NVLink高速互连技术进行连接。
从某种程度上说,GPU加速器正在重新定义整个超算市场,也正在改变超算市场的未来,而幕后的推动者,正是来自美国硅谷的NVIDIA。
HPC和AI加速融合背后
在今年专程出席SC17大会的NVIDIA创始人兼CEO黄仁勋看来,超算作为全球创新发动机的作用将越发明显,它将更广泛地应用在深度学习、人工智能等领域,而NVIDIA希望通过在软硬件领域的努力,以此来推动超算和人工智能的进一步融合,具体而言:
NVIDIA创始人兼CEO黄仁勋
第一,是提供无处不在的GPU计算力。据黄仁勋透露,目前全球主流的OEM制造商,如DellEMC、HPE、IBM均已宣布向其客户提供NVIDIA的产品。
同时,华为、浪潮、联想等服务器厂商正在采用NVIDIA的HGX参考架构,为超大型数据中心提供基于Volta的加速系统。通过NVIDIA HGX合作伙伴计划,这些OEM合作伙伴可与NVIDIA共同合作,更快设计出各种符合超大规模数据中心需求的GPU加速人工智能系统,并投入市场,从而满足各行各业对AI计算日益增长的需求。
此外, AWS、阿里云、百度云、腾讯云、微软Azure、Oracle云等提供商也已宣布推出基于Volta架构的NVIDIA V100 GPU的云服务。以AWS为例,其基于NVIDIA的Volta V100 GPU创建新的EC2实例,成为第一个提供速度最快的GPU加速器的公有云提供商,这些EC2 P3实例采用1、4、8个Tesla V100 GPU及每个GPU对应配置8个英特尔至强处理器核心的设计,非常适合被用于在云上进行机器学习和深度学习,以及计算流体力学、计算金融、地震分析、分子建模和基因组分析。
第二,是推动深度学习在HPC领域的广泛应用。黄仁勋认为,伴随着整个IT行业都在转向AI应用,传统的HPC也同样可以借助于深度学习的能力实现应用上的创新。所以,NVIDIA希望通过提供强大的深度学习能力,助推超算发挥更重要的价值和作用。
目前,全球前15位的HPC应用均为GPU为其加速,包括GROMACS、ANSYS Fluent、Gaussian、VASP、NAMD、Simulia Abaqus、WRF、OpenFOAM、ANSYS、LS-DYNA、BLAST、LAMMPS、AMBER、Quantum Espresso和GAMESS等。
在NVIDIA在SC17上的演示环节也可以清晰看到,在深度学习训练的一个项目中,负载APP是Caffe AlexNet、GoogLeNet、ResNet-50和VGG-D,采用CPU的方案配置是240台基于双插槽Skylake处理器的服务器,功耗为120Kw。而相比之下,采用GPU加速的方案则需要CPU方案的:1/9成本;1/13电费;1/18空间占用。而在一个生命科学的对比中,GPU方案是CPU方案的:1/3成本;1/4电费;1/6空间。
第三,是通过创新的技术手段为超算市场带来更好的用户体验。例如,利用NVIDIA Holodeck,就可以有效降低诸如汽车设计、建筑设计在内的复杂多设计师场景,用户可以以第一视角“深入”产品内部,并以实时远程交互的方式完成协作,这就意味着创作者可以节约原本简化VR模型所需的大量时间,并将时间用于在高保真条件下进行更加深入的探索等。
不仅如此,NVIDIA还推出了针对NVIDIA GPU Cloud(NGC)容器注册的全新软件及工具,用来帮助科学家们更加轻松地部署NVIDIA加速计算平台,开展计算密集型研究。
据介绍,目前AWS已经对外提供NGC的服务,在完成 NGC 帐户的注册之后,开发人员便可下载并优化各类深度学习框架的集成化软件堆栈、NVIDIA 资料库和 CUDA运行时版本。关键的是,这些软件堆栈均可持续更新,并能流畅运行于云端或NVIDIA DGX系统之中。
正如黄仁勋所言:“NVIDIA Volta是世界上最强大的人工智能与高性能计算平台。现在,部署于全球各地的数据中心与云端的Volta必将引发新一轮创新,进而为全社会带来无与伦比的影响。”
由此可见,科学计算的深入应用,深度学习驱动的人工智能,都正在重新定义超算的创新和应用边界。而NVIDIA一系列围绕超算市场和人工智能领域的布局和创新,不仅是大势所趋,更是NVIDIA在新时代的新使命。
总的来说,NVIDIA通过推动超算和人工智能的融合,积极赋能没有技术优势和人工智能技术基因的企业,这无疑也充分体现了NVIDIA希望通过技术、服务以及生态输出的方式,让更多的企业受益于人工智能普及带来更多价值的决心和信心。
申耀的科技观察(微信号:shenyao),由非著名科技媒体人申耀创办、10万公里公路自驾经验老斯基,在各大自媒体平台拥有专栏,致力于科技行业的观察和思考,在这里读懂科技行业,知趋势,赢未来!