英伟达联手Arm CPU打造AI超算,百万兆级性能,主攻气候变化和核武建模

雷刚 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

AI超算怎么搞?老黄祭出联谊招。

在国际超算大会上,英伟达宣布正式支持Arm CPU,为高性能计算行业开辟了一条全新途径,以构建具有极高能效水平的百万兆级AI超级计算机。

具体方面,英伟达将在年内为Arm态系统提供全堆栈的AI和HPC软件。

该堆栈为600多个HPC应用程序和所有AI框架提供加速。

英伟达联手Arm CPU打造AI超算,百万兆级性能,主攻气候变化和核武建模_第1张图片

其中包括了所有英伟达CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,如支持OpenACC的PGI编译器和性能分析器。

堆栈优化完成后,英伟达将为所有主要CPU架构提供加速,包括x86、POWER和ARM。

英伟达创始人黄仁勋说,英伟达CUDA加速和ARM的高效能CPU架构结合,一定可以推动超算的大幅提升,目标是百万兆级。

英伟达联手Arm CPU打造AI超算,百万兆级性能,主攻气候变化和核武建模_第2张图片

据称英伟达和ARM CPU联手的超算,将率先在预测气候变化和核武器系统建模等领域展开试水。

英伟达官方还专门提到了节能,Arm CPU的开放性之外,节能也是这次联手的题中之义。

在最新发布的Green500排行榜,全球最节能的25款超级计算机中,有22款都得益于英伟达的支持。

需要说明的是,这也不是英伟达和Arm首次联手。

之前英伟达用于便携式游戏、自动驾驶汽车、机器人和嵌入式AI计算的系统级芯片产品,其实都采用了ARM。

英伟达联手Arm CPU打造AI超算,百万兆级性能,主攻气候变化和核武建模_第3张图片

One more thing

最后,也还是在法兰克福超算大会。

英伟达还发布了一款专为自动驾驶汽车打造的超算:DGX SuperPOD。

全球最新排名第22.

整个系统搭建只需要3星期,采用96台NVIDIA DGX-2H超级计算机与Mellanox互联技术。其处理能力高达9.4 petaflops,能够用于训练安全自动驾驶汽车所需要的海量深度神经网络。

DGX SuperPOD内含1,536颗NVIDIA V100 Tensor Core GPU。

英伟达方面称,该套系统能够不间断运行,优化自动驾驶软件,并以前所未有的周转时间(turnaround time)反复训练神经网络。

例如,DGX SuperPOD软硬件平台能够在不到2分钟的时间之内完成ResNet-50训练。

此外,具备同等性能的其他TOP500超级计算机系统都由数千台服务器构建而成,而DGX SuperPOD占地面积更少,其体积比这些同等系统小400倍左右。

AI社群 | 与优秀的人交流

640?wx_fmt=jpeg

精选直播 | 大牛的观点碰撞

640?wx_fmt=jpeg 640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧! 


你可能感兴趣的:(英伟达联手Arm CPU打造AI超算,百万兆级性能,主攻气候变化和核武建模)