封图 | CSDN 付费下载自视觉中国
习惯是用来养成的,但往往也是用来打破的。从微处理器起家,英特尔在 52 年的历程中奠定及巩固了其在芯片领域的地位,以至于时下但凡提及芯片设计、工艺等关键词之际,映入众人脑海的巨头企业必然有英特尔的身影。
不过,近几年间,除了传统的处理器层面,在人工智能、大数据、云计算、物联网领域,英特尔依托强硬的硬件基础、创新的软件实现了数字智能化的快速转型,甚至在其内部“以数据为中心的业务”大有赶超“以 PC 为中心业务”之势,这一点也在不久前英特尔最新公布的 2020 年 Q1 财报中得到了验证。
据财报显示,英特尔 Q1 营收为 198 亿美元,与去年同期的 161 亿美元相比增长 23%。从更为细分的部门业绩来看,英特尔客户计算集团即以 PC 为中心的业务净营收为 97.75 亿美元,其他以数据为中心的业务,如英特尔数据中心集团 Q1 财季营收为 69.93 亿美元、英特尔物联网集团营收为 11.37 亿美元、英特尔非可变存储解决方案集团营收为 13.38 亿美元、英特尔可编程解决方案集团营收为 5.19 亿美元。
对此,我们也不禁好奇,对于科技巨头而言,转型并非一夕之间可以实现,英特尔在面向以数据为中心时,是如何一步一步完成转身,并逆袭传统业务的?
或许,这可以从英特尔为现代数据中心打造的「三驾马车」说起。
早在 2017 年,英特尔就已确立“以数据为中心”的战略转型目标,随后并提出制程&封装、架构、内存&存储、互连、软件、安全为六大技术支柱,以软硬件齐发的招式,破解数据爆发式发展下的处理、存储、安全等种种挑战,也让在摩尔定律下的芯片迎来新的生机。
经历了几年转型的蜕变,事实证明,英特尔以数据中心战略并没有走错,同时,在计算、存储、网络的三驾马车鞭策之下,更大的数字能力得到了释放。
众所周知,一直以来,“计算”是英特尔独特的优势。在这一层面上,正如英特尔公司数据平台事业部副总裁,英特尔至强®处理器和存储事业部总经理 Lisa A. Spelman 所言,“英特尔一直致力于为至强处理器注入 AI 训练和 AI 推理功能。从第一代英特尔至强可扩展处理器开始,就加入了 AVX-512,并优化了 FP32。在 2019 年,英特尔继续进行了相关改进,在第二代至强可扩展中引入了英特尔深度学习加速技术,从而显著提高了基于 INT8 推理的性能。随着第二代至强可扩展产品的推出,英特尔将至强拓扑优化的数量从 24 个增加到 44 个。”
经过一年的迭代,英特尔于日前推出了第三代英特尔®至强®可扩展处理器,也是业界首个内置 bfloat16 支持的主流服务器处理器,能够帮助图像分类、推荐引擎、语音识别和语言建模等应用的 AI 推理和训练更简便地部署在通用 CPU 上。
如今,bfloat16 指令集技术的实现,不仅是英特尔在 AI 应用上的一大突破,而且也极大提高第三代至强处理器的处理速度,并达到相似的模型精度。目前,第三代至强可扩展处理器是当前唯一最多可提供 8 插槽可扩展性的 x86 平台,同时为应对更为严峻的数据分析挑战,它也支持最新一代英特尔®傲腾™持久内存。
在存储方面,“所有工作负载都需要数据,但是当今的内存/存储层次结构存在鸿沟,需要在容量,速度,成本和持久性之间进行取舍。在存储金字塔顶部,成本很高,容量很小;在底部,容量实际上是无限的,但是访问数据的速度很慢。”Lisa 剖析道。
针对这一点,英特尔在其丰富的 3D NAND 和傲腾技术研发经验之上,推出了英特尔®傲腾™持久内存200系列,它也被称之为“英特尔的下一代持久内存模块”,可支持前所未有的内存容量,并以最快的速度访问持久存储的数据。与第一代产品相比,英特尔®傲腾™持久内存200系列的平均内存带宽增加了 25%。
如果在意外断电的情况下,傲腾持久内存200系列提供的 CPU 对持久性数据的访问速度比主流 NAND SSD 读取数据快 225 倍以上。与 DRAM 不同,在计划或计划外重新启动后,数据不必重新加载到内存中。
除此之外,英特尔还推出了高性能的英特尔®傲腾™固态盘和高容量的英特尔®3D NAND 固态盘,其中全新英特尔 3D NAND 固态盘 D7-P5500 和 P5600,基于英特尔最新的三层单元(TLC)3D NAND 技术而打造,可为 AI 和大数据分析负载实现性能与容量的更优平衡。
值得关注的是,基于人工智能方面的研究,英特尔还推出了首款针对 AI 进行优化的 FPGA——Stratix 10 NX。它采用了 EMBI 整合封装,并嵌入了一种新型的 AI 优化块 AI Tensor,专注于加速 AI 应用程序,可以在相同的空间内容纳 15 倍的计算量。
Stratix 10 NX 还支持高性能 AI 推理,包括高速存储器和高速收发器。另外,英特尔是基于小芯片的架构策略,因此能够快速开发 Stratix 10 NX 设备。预计这款经过 AI 优化的 FPGA,将于今年晚些时候上市。
基于以上,我们不难看出英特尔在以数据为中心的战略之下,人工智能的应用对算力、效率的提升具有无限的潜力。而在我们回看英特尔的转型之路时,Lisa表示,“人工智能和分析将是未来十年起决定性作用的工作负载,推动以数据为中心的领域从云到边缘的颠覆性创新。IDC 预测,2023 年 AI 系统的支出将达到 979 亿美元,是 2019 年 375 亿美元支出的 2.5 倍多。在摩尔定律和云效率的帮助下,人工智能正从最复杂的组织转向渗透每一个应用程序。”
如今随着机器学习、深度学习等算法的不断成熟,为 AI 带来了更加具象化的效果,也让数据的价值呈现最大化,AI 的推理和训练功能愈发完善。在应用层面上,对于英特尔而言,人工智能可以将数据从负担变成机遇,并将应用落地到各行各业,此外,5G 的普及与发展也将从根本上改变大家对计算的看法,并要求所有网络进行转型。
当下,是人工智能落地应用的最佳选择,也是英特尔乘风破浪的机遇。因此除了在硬件层面,英特尔也从软件、生态系统为核心,全面进行了 AI 布局。
作为传统的硬件厂商,在将软件列入最新技术产业支柱之际,我们已了然软件对其的重要性。事实上,在国内的上海,英特尔有一个超 2000 人的英特尔亚太研发中心,聚焦云计算、服务器设计、虚拟化技术、大数据、深度学习、基本输入输出系统、固件、视频技术等软件方面。
在性能优化与工具层面,英特尔正在通过异构编程神器 oneAPI 建立一个统一的编程模型,为开发人员提供统一的体验。同时,英特尔 oneAPI 跨架构工具生态系统使开发人员能够为 AI、HPC 和其他计算密集型应用程序提供更好的性能和高效的开发。
另外,英特尔推出的 OpenVINO 发行版工具包是用于开发 AI 应用程序的软件工具集,其重点是加快对诸如计算机视觉,音频,语音等用例的推理,实现了高性能计算机视觉和深度学习视觉应用的快速开发。
针对该工具,英特尔于近日推出了该工具包的新的长期支持(LTS)版本,它提供了一致、稳定的版本,仅针对关键错误修复(为期一年)和安全补丁(为期两年)进行了更新。这对于对代码稳定性有着极高要求的物联网客户而言尤其重要。凭借这些高级工具,开发者可在英特尔 CPU、GPU、FPGA 上实现 AI 工作负载的加速,并使代码可以在目前及未来的英特尔处理器及加速器上得以兼容。
最后,从公有云提供商到 OEM 平台以及 AI Builders 社区(SI,ISV等),英特尔已经使用 Intel AI 技术建立了蓬勃发展的合作伙伴生态系统。与此同时,基于自身,英特尔还对其精选解决方案组合进行了全面升级,以更好地帮助企业 IT 部门加速部署最迫切的需求。
在开发者生态上,在我们不完全熟知的背后,英特尔拥抱开源实则已经 20 年有余,不仅如上述提到的 oneAPI、OpenVINO 等工具,还有 NLP 架构、RL Coach、神经网络 Distiller 等人工智能框架及模型均可以在 GitHub 上获取。
对于英特尔而言,正如其发言人所述,「生态系统就是一切」,通过应用程序工程和开源社区的支持,英特尔在借助 AI 走得更快的同时,也希望能为业界 AI 开发者降低开发的门槛。