在IP授权和芯片设计方案的市场份额而言,Arm取得了令人难以置信的成功。然而,在移动智能终端、电视和汽车领域几乎无所不能的Arm,每年的收入只有20亿美元左右,利润差不多在5000万美元上下。
五年前,日本软银以320亿美元收购了Arm;去年软银计划出售这家公司(目前英伟达宣布收购的交易还处于各国监管部门的审批阶段),以缓解自身的财务压力。
然而,根据软银财报,Arm在2017年-2019年的营收分别为18.31亿美元、18.36亿美元和18.98亿美元,这3年的增长微乎其微。不过,Arm在几个重要行业领域的市场地位不可忽视,也助推了芯片行业的繁荣,尤其是对于初创公司而言。
考虑到未来英伟达如愿收购Arm,将可能推动芯片行业的一次新变革。问题不在于Arm能否保持“独立”,而在于这笔交易能否促进竞争,并重构现有的IP市场格局。
比如,英伟达的收购可能会大力推动基于开放RISC-V架构的芯片开发。两年前,阿里巴巴平头哥宣布,正式推出基于RISC-V架构的开源低功耗微控制芯片(MCU)设计平台以及RISC-V处理器玄铁910。
而在汽车行业,零跑汽车从3年前就开始研发智能驾驶芯片,首款量产产品凌芯01正是采用平头哥玄铁C860双核32位CPU开发,采用8核心神经网络处理器,最大算力可以达到4.2TOPS。
有消息称,英伟达内部也在寻求在收购完成后,将GPU与Arm的现有产品线进行整合,为其他芯片厂商尤其是初创公司提供一个模块化、可扩展的通用“大脑”。
Arm公司的名字全称是“Acorn RISC Machine”,创始人Sophie Wilson和Steve Furber发现,CPU只需要一小组指令就能运行得更快。当大多数CPU设计都在向芯片添加更多指令时,Arm使用更少指令却运行得更快更有效的技术专利。
同时伴随着智能移动设备的兴起,对于芯片功率的限制,Arm进入了一个巨大的市场,并占据了90%的市场份额。该公司在2011年引入了ARMv8 64位架构,再加上“异构计算”设计有助于降低功耗要求,并通过平衡性能来实现需求。
数据显示,到目前为止,Arm在移动领域占据主导地位,其中移动处理器领域占据90%的市场份额,在车载信息娱乐和高级驾驶辅助系统(ADAS)处理器市场占据75%的份额。
Arm的架构是英特尔x86的竞争对手。两种架构之间的主要区别是,Arm青睐能效(低功耗指令集和硬件),而英特尔青睐峰值性能(复杂指令集计算)。
而英伟达和Arm之间的协同效应,目标则是着眼于未来的人工智能技术。如今,不论是智能手机还是汽车,每年的市场增量已经处于低增长甚至是负增长阶段,只有机器学习和人工智能才是“虚拟”增量。
不过,对于Arm来说,不管与英伟达的合并是否最终实现,其现有ARMv8架构也已经到了需要下一代接棒的时间点(毕竟此前高通对NXP的收购失败,让后者在下一代产品研发上吃了“滞后”的亏)。
在ARMv8发布10年后,Arm选择彻底改革了其中央处理芯片的架构,包括核心指令集架构(ISA)的改进,目标是为未来大量的AI和数字信号处理(DSP)工作负载提供性能提升,包括音频、视频和语音。
Arm表示,基于Armv9架构的第二代CPU产品(代码为“Makalu”)将比其最先进的Armv8 CPU性能高出30%,预计将于2022年初上市。同时,该公司还将引入一系列新的硬件安全功能。
除了性能的一次性提升,Arm还计划在未来10年里每年对底层架构进行一次升级,推出v9.1、v9.2等版本,并适用于不同类型的设备——“A”用于移动和服务器的应用程序处理器,“R”用于实时处理器,“M”用于微控制器。
Arm首席执行官西蒙·塞加斯(Simon Segars)表示,随着CPU从更多的一维计算转变为能够处理人工智能和5G等异构工作负载的计算,这些改进至关重要。
“这就是我们所说的,一个将由人工智能定义的未来时,我们需要在芯片架构上准备好应对未来的独特挑战。”塞加斯表示。
按照Arm的观点,随着半导体行业从通用计算转向更特殊用途的专用计算,目前CPU性能的提升是远远不够的。
为此,Armv9架构还提出了所谓的“全面计算”战略,通过在系统和软件层面上的一系列改进来提高性能。其中,汽车、物联网、消费电子和数据中心将是主要市场。同时,Arm还在提高频率、带宽和缓存,并减少内存延迟,来提升CPU整体性能。
一直以来,由于云计算、高性能计算和人工智能的繁荣,拥有先天优势的FPGA的关注度更是到达了前所未有的高度。此前,基于嵌入式ARM硬核的FPGA,被称为可扩展处理平台。
比如,Xilinx发布的ZYNQ 7000系列FPGA,它由双核A9+Xilinx 7系列FPGA组成,成为该公司最著名的FPGA开发板系列之一。这套方案可以帮助开发者实现对卷积神经网络的硬件加速。
不过,在这一时期,虽然两者的“联姻”主要还是由FPGA开发商推动的,但FPGA却成为了CPU的一个大型外设,由主角变为了配角。
此后,随着ARM逐步开源Cortex-M0核、M3/4核,极大地降低了开发超高能效SoC的门槛,ARM的进一步开源也降低了开发门槛和减小开发成本。
到此时,事实上,FPGA已经被彻底“边缘化”(还有很重要的原因是成本过高)。而在Armv9架构的设计上,Arm表示,通过升级可扩展向量扩展(SVE)技术来提高性能,以改善AI和DSP处理任务。
现有SVE采用Armv8架构,和英特尔的AVX技术都是所谓的SIMD指令集,用于增强并行处理,是高性能和节能计算的基础。最新的SIMD指令集SVE2,将作为Armv9的标准特性,用于加速音频、语音处理以及图像、语音识别。
按照披露的消息,Cortex-M微控制器、Cortex-A处理器都将受益SVE2带来的性能提升,同时,还提高了CPU在本地运行5G基带和其他任务的能力,而工程师不需要将它们转移到外设的加速器上。
Arm还承诺将进一步扩展其SVE2技术,增强CPU的矩阵数学计算能力,以及Mali GPU和Ethos NPUs的不断创新,从而满足基于人工智能的更复杂工作负载的需求。
在过去的五年时间里,Arm每年都在提高其Cortex-A CPU的性能,其速度超过了整个行业,比如苹果公司自研的M1芯片(基于Arm核的SoC)取代英特尔的CPU。亚马逊还在数据中心部署了基于Arm的Graviton CPU,云服务性能提高了40%。
“这将是打开新市场和机遇的关键。”Arm相关负责人表示,ArmV9还将“帮助我们的合作伙伴在更快上市时间和成本控制之间取得平衡,同时创造独特的解决方案。”
而对于物联网或者说汽车联网来说,硬件安全同样重要。
Armv9体系结构的另一个主要改进与硬件安全有关,为此引入了所谓的机密计算架构(CCA)。即使它还处于早期开发阶段,这项技术将被用于保护正在处理的部分软件和数据(甚至来自操作系统),通过在CPU上隔离的安全内存区域中执行计算。
为此,Arm还引入了“机密域”的概念,类似于软件容器,应用程序或其他工作负载可以转移到一个“域”(完全隔离的区域),并独立于其他代码运行。如果在一个分区的另一边运行的软件被劫持,这个域可以拒绝访问并取消操作。
这种安全,对于汽车行业应用来说,至关重要。
这也是Arm在原有推出的TrustZone技术上的新扩展,比如,虚拟机可以同时运行来自不同客户的应用程序,“机密域”就可以用来隔离虚拟机,并在操作系统或其他软件被入侵时起到保护作用。
不过,Arm不断增强自身实力,对于下游客户来说,压力也越大。
今年初,作为Arm的主要客户之一,高通宣布14亿美元收购Nuvia,这是一家成立仅两年的初创公司,由前苹果芯片项目高管创立,主要定位于低能耗数据中心。
但高通并不仅仅看中服务器市场,相反,该公司计划将Nuvia的CPU技术应用在智能手机、笔记本电脑以及汽车产品线中。目前,Nuvia有自己的专利IP核,意味着高通后续有机会减少对Arm的依赖。
有分析师指出,“这次收购,让高通重新回到完全定制设计CPU内核和专有CPU架构的新时代,这是高通正确的技术方向。”
因为,CPU性能的领先地位对于定义和实现下一个计算创新时代至关重要。“对于汽车行业来说,创建一个新的高性能计算平台,将是一个新的市场标杆。”