重新定义 AI 服务器架构

作者 | 琥珀
出品 | AI科技大本营(公众号ID:rgznai100)

得益于迅速增长的计算能力、海量数据,以及神经网络前所未有的突破,AI 变得无处不在,也成为未来十年最具颠覆性的技术。根据 Gartner 近两年发布的新技术成熟度曲线显示,决定未来企业在数字经济中生存和发展的趋势是 AI。

一方面,大多数 AI 算法需要大量的数据和计算力来完成任务,依靠云服务来执行计算;另一方面,在提供智能云体验上,由 AI 驱动的解决方案将决定企业能否在 AI 时代快速占领制高点。

无论是提供计算资源的云服务供应商,还是支撑强算力的服务器、GPU 厂商,亦或是致力于搭建深度学习框架的技术供应商,都铆足了劲儿借 AI 之力希望重新划定市场格局。

AI 服务器市场变局

近段时间,浪潮 AI 服务器的声势很大。

Gartner 数据显示,2017 年浪潮服务器出货量上升至全球前三,成为全球主要的服务器方案提供商;

在过去的 16 个季度中,有 10 个季度浪潮服务器的增长速度全球最快;全球市值 Top 10 的云服务提供商中 5 家在大批量采购浪潮服务器;浪潮的海外业务也同比增长了 3.5 倍;

此外,据了解,浪潮 2017 年的发明专利受理量在国内排第一位,并研发了最多种类的 AI 服务器;AI 服务器增长率为 600%,4.5 倍于全球的平均增长。

4 月,IPF 2018 大会上,浪潮集团执行总裁王恩东表示,要在未来五年内成为全球最大的服务器供应商。同时,浪潮还发布了首款面向AI云设计的弹性GPU服务器NF5468M5,帮助云服务商快速构建敏捷AI基础架构。

7 月,浪潮发布与英伟达联合研发的 AI 服务器 NF5288M5,可满足 AI 云、深度学习模型框架训练和推理等对计算架构性能、功耗的不同需求。

9 月,浪潮又发布了全球首款 AI 超级服务器 AGX-5,这款服务器计算性能高达每秒 2 千万亿次,能够在 8U 的空间里有 16 颗最新的板卡高速互联,是目前全球最强大的 AI 计算主机之一。

从最近半年新品研发速度来看,浪潮正加紧更高研发效力的新款 AI 服务器,而这背后面临着的却是计算量剧增的挑战。

重新定义 AI 服务器架构

谈及浪潮与IBM合资成立的浪潮商用机器 Power 系列,浪潮 AI 系统架构师邸双朋向AI科技大本营(ID:rgznai100)表示,

“其实现在市场常用的服务器是 X86,而 Power 系列此前主要是在银行、保险这种关键交易行业用得比较多。随着 Power 市场策略的变化,可能也会应用在企业级或消费级市场。

但 Power 与 X86 的架构差异性还是非常大的,不管是底层操作系统、智能学习框架,还是上层应用,可能都需要有一个重新移植的过程。

不过从市场的接受度来说,可能人们都知道 Power 系列的性能比 X86 会有所提升,但从它的生态来看并不是特别完善,可能后续会逐渐完善,把包括 AI 以及其他的生态都完善起来。”

值得一提的是,9 月,浪潮与第四范式联合发布了 AI 软硬一体机“Prophet AIO”。据介绍,部署“Prophet AIO”实际应用效果明显,在相同成本前提下,计算性能提升 10 倍以上,交付周期从半年为单位缩短到周级别。

此次合作,对于双方而言无疑是共赢。站在服务器供应商的角度,与业内优秀的深度学习框架的技术供应商、英伟达等 GPU 厂商强强联合,构建的是 AI 时代的生态关系。

科技朱比莉评论,浪潮要在五年内成为世界第一的服务器企业,一方面就要考虑 AI 服务器上下游产业链和相关产品的研发;另一方面,还要考虑如何将互联网 AI 应用的优势推进到传统企业当中。

而业内人士表示,未来越多的体系架构是为 AI 优化,而不是为应用服务器优化。这意味着对研发团队来讲,以更短的时间或商业化可接受成本的条件下,更好的架构将有助于设计出更好的算法。

写在最后

据 IDC 最新数据显示,截止到 2022 年,全球企业对认知和 AI 系统的支出将保持 37.3% 的年复合增长率,预计总支出将增长到 776 亿美元。在这些支出中,软件成为预测规模最大、发展最快的技术类别,包括会话 AI 应用以及深度学习和机器学习应用;硬件(存储和服务器)将成为第二大支出领域。

云计算提供了强大的弹性计算和存储能力,从而产生庞大的数据量,AI 则提供海量数据快速精准处理的能力,随着机器学习、深度学习应用的不断深入,数据的价值也将不断催生出来。

《2018 中国 AI 计算力发展报告》显示,算力的发展并未达到需求。报告建议通过异构计算和云的结合来解决算力问题。

对于如今绝大部分做技术应用的 AI 公司来说,底层计算资源的优劣直接决定了他们 AI 实力的强弱。而只选择一款通用处理器根本无法解决企业在AI上的需求,如弹性人工智能服务、异构计算、超计算集群等,都要与处理器综合起来对人工智能的性能、模型起到促进作用。

--------------------- 本文来自 AI科技大本营 的CSDN 博客 ,全文地址请点击:https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/82867906?utm_source=copy

你可能感兴趣的:(人工智能)