作者 | 中国软件网 赵满满
校对 | 中国软件网 暻
11月11日,苹果公司推出三款新的Mac电脑——MacBook Air、13英寸MacBook Pro和Mac Mini。这些新电脑首次采用了苹果自己的处理器M1,而非已经应用了15年的英特尔处理器。
无独有偶,英特尔在10月公布的第三季度财报显示,在收入和每股收益方面表现平平。第三季度收入为183亿美元,同比下降4.6%,最显著的一个变化是云服务器芯片的订单正在放缓。
因为在自己的智能手机iPhone上采用自己的芯片,苹果实现了商业利益的最大化。而这次在MAC上弃用英特尔的处理器的最大一次变革,预示着ICT领域,一场涉及面甚广的计算变革正在积极推进。
异构计算,没有一成不变
目前英特尔、AMD主导的企业计算,正在遭遇Arm、RISC-V和IBM POWER指令集所形成的巨大生态力量的挑战。
在桌面电脑、服务器甚至云计算领域,英特尔和AMD苦战几十年。在2000年,英特尔和AMD占领了PC/服务器处理器的几乎所有市场。
之后AMD通过其Opteron处理器体系结构,将64位指令引入x86指令集。英特尔随后在其核心处理器体系结构和至强产品中添加了AMD 64(现在为x86-64)指令。此后,AMD在2008-2018年期间将大部分服务器处理器市场份额拱手送给了英特尔。
目前,超过90%的云基础架构即服务(IaaS)实例类型都基于Intel Xeon处理器。
AMD和Intel目前是唯一获得交叉许可以使用彼此的重要x86-64专利的服务器处理器供应商。构建现代的x86-64服务器处理器需要获得AMD和Intel的专利。
几年前,Arm认为,相比x86指令集,它将获得重要的市场份额。Arm的业务模式是将Aarch64指令集许可给设计自己的服务器处理器的公司。
获得许可的Arm服务器处理器越来越多,如Ampere的eMAG,AWS Graviton,华为的鲲鹏Kunpeng,以及Marvell的ThunderX。在万物互联时代,这些企业看中是ARM系统在性能和功耗方面具有独特的优势
2019年1月华为发布Kunpeng 920新芯片组,旨在进入数据中心,并将为公司的泰山TaiShan服务器提供处理器。
华为的鲲鹏处理器由自己设计,基于由ARM创立的芯片组架构,ARM是总部设在英国,现在由软银控制。华为表示,配备有Kunpeng 920的新服务器旨在帮助处理和存储大量数据。
ARM凭借其处理器 IP一直是移动设备处理器的主要供应商,但最近几年却试图进入服务器和云市场。当然,华为并不是唯一一家拥有用于服务器的7纳米处理器的公司。在服务器领域,华为已经成为了英特尔和NVIDIA等的竞争对手。
Kunpeng 920也不是华为首款7nm处理器。该公司拥有为自己的手机设计的麒麟Kirin 980和为处理在云中运行的人工智能应用程序而创建的昇腾Ascend 910。Ascend 910还可用于数据中心,但其功能与新的鲲鹏Kunpeng 920不同。
同时,伯克利大学的学者创建了新的RISC-V开源指令集。该指令集已由RISC-V基金会商业化,许多当前和潜在的Arm服务器处理器设计师都在评估RISC-V的潜力。基于RISC-V的服务器处理器正在不但增加,包括一些大型IaaS云,如阿里巴巴集团和Google,以及一些目前不在服务器处理器设计业务中的芯片公司,如nVIDIA。
为了获得AMD和Arm都在尝试的IaaS市场份额,RISC-V将必须展示企业级质量和云工作负载性能价值。但是RISC-V目前仍处于早期的开发阶段,相信目前还不会成为云数据中心部署的成熟竞争者。
为了生存,IBM将其POWER指令集免费提供给开源世界。显然,IBM的POWER9是企业级服务器处理器。IBM出色地启动了OpenPOWER Foundation,该基金会为POWER9创建了云服务器供应链生态系统。
Google在过去几年展示了基于OpenPOWER的POWER9云服务器。Google Cloud是否将POWER9部署到其公共IaaS中,其他云服务商会跟随,目前在不得而知。
另外,创建可行的x86服务器处理器所需的许多专利已经过期或即将过期。自从AMD设计出AMD 64和Opteron处理器以来已20年英特尔的Pentium 4和SSE指令集始于1998年,并于2000年末投入市场。
AMD于2003年春季使用Intel的Pentium 4 32位指令集,AMD的AMD 64 64位指令集扩展和Intel的SSE2多媒体指令集扩展,推出了其Opteron处理器体系结构。利用今天即将到期的知识产权的组合,可使新进入市场的公司绕开Arm、RISC-V和POWER指令集所面临的软件生态系统挑战。
要记住,专利的有效期是基于专利的申请日期,通常是在产品发布之前。
验证是任何处理器指令集软件生态系统增长的最大驱动力。从操作框架和应用程序开发的角度来看,所有声称与指令集兼容的处理器实际上必须兼容。AMD和英特尔拥有令人印象深刻的x86-64验证套件,但在数据中心领域,这主要是为了解决三十年来与传统企业操作系统和应用程序的兼容性问题。云部署可能会指定一个轻得多的验证套件,从而降低了新的x86-64服务器处理器进入者的门槛。
尽管没有公开的迹象表明,有公司会设计基于x86-64的新处理器内核,但设计和验证新的服务器处理器内核体系结构大约需要三到四年的时间。这意味着无论基于x86-64、Arm Aarch64、POWER9还是RISC-V,现在都应该为2022年服务器处理器产品的发布进行开发。
计算多样化,通用计算与AI计算共同发展
在通用计算CPU横行天下多年之后,GPU(图形处理单元)主导的并行计算因为AI应用开始变得流行,让通用计算与AI计算共同发展。
在AI计算方面,参与者越来越多,未来会有更多的好消息。
英伟达在并行处理方面已有24年历史,其无处不在的CUDA平台的发展使该公司具有独特的优势。数以亿计的自动驾驶汽车和数万亿个物联网设备,为英伟达NVIDIA的GPU产品创造了巨大的市场机会。
我们已经看到,使用NVIDIA的Volta AI平台进行机器学习的所有主要云/超大规模OEM以及Oracle和SAP等主要企业供应商,都普遍采用GPU。
人工智能是GPU的杀手级应用。分析师统计,目前全球500强超级计算机中只有15个使用GPU芯片。在未来五年中,这些超级计算机中的100%将通过GPU加速。
在AI服务器上,中国服务器和云计算公司浪潮在性能和市场份额上都有上佳的表现。
最近公布结果显示,在AI基准测试MLPerf中,浪潮的AI服务器NF5488A5创下18项性能记录;在SPC-1基准评测报告中,浪潮存储平均100美金可以购买到13198 个IOPS的性能,刷新了榜单全球最优成绩。
此外,在IDC公布的中国AI加速计算报告中,浪潮AI服务器2020年上半年的销售额达6.88亿美元,市场份额达53.5%,拿下中国AI服务器的半壁江山。
根据浪潮信息相关资料,在服务器的发展中,摩尔定律已经出现衰退,增长从主频增长变成核数增长,即将对超算领域的提升产生制约。浪潮判断,异构加速计算会成为未来进步的方向。
恰在此后,英伟达开发出NVLink,用来连接高速GPU形成性能更强的计算系统。当时所有服务器厂商都对此抱有质疑的态度,认为这个技术没什么用,并且因为要求高带宽和低延迟,技术难度颇高。但浪潮看准方向,在全球第一个开始研发基于NVLink高速AI服务器,上市后获得客户市场认可。
2018年华为正式发布两款AI芯片:采用7nm工艺制程的昇腾910,以及12nm工艺制程的昇腾310。
2019年,华为又推出了全场景AI计算框架MindSpore。这些AI基础软件平台实现了极简易用、极致性能。这让小的传统企业能够基于华为的全栈平台,能以少代码,甚至不开发代码也能充分利用AI能力。
2018年阿里巴巴达摩院发布了一种名为Ali-NPU的AI芯片,该芯片将通过其公共云供任何人使用。此举旨在增强阿里云的AI实力,促进行业AI应用的发展。
与阿里巴巴的做法类似,Google的母公司Alphabet自2015年以来,内部的工程师一直在使用Google的定制张量处理单元(TPU)来加速自己的机器学习任务。2019年Google宣布了可以处理更具挑战性的计算工作的第二代TPU,并于今年2月开始让公众可以通过云使用第二代TPU。
Google认为,第二代Google AI芯片可以代替Nvidia等公司的图形处理单元使用,它不仅可以训练AI模型,还可以完成更多工作。
至少与Nvidia在数据中心的GPU业务相比,阿里巴巴和Google AI芯片计划目前仍处于起步阶段。
实际上,Google和Nvidia仍然是合作伙伴,Nvidia的GPU与TPU一起仍可在Google云中使用。当然,阿里巴巴还通过其云提供了Nvidia GPU,并将在Ali-NPU推出后继续这样做。
很明显Facebook也正在探索AI芯片开发。英特尔去年曾表示,正在与Facebook合作开发AI新芯片。
Facebook的AI芯片可能改善内部研究人员的操作,并提高系统的效率,以供数十亿使用该公司应用的用户提高效率。
同时,苹果在高端iPhone X手机的芯片中内置了“神经引擎”元素。微软正在为其下一个版本的HoloLens混合现实耳机开发AI芯片。特斯拉一直在为其车辆开发AI芯片。
计算生态正在悄悄变化
据中国软件网观察,在计算领域,传统的WinTel联盟体系,X86+linux联盟体系,甚至苹果和英特尔组成生态体系等,都正发生悄悄的变化。
在计算生态中,最大的变化当属国产自主创新生态体系日益壮大。
华为在2019年宣布“硬件开放、软件开源、使能合作伙伴”,意在创建基于鲲鹏、升腾的计算生态体系。
华为计算产品线总裁邓泰华的话直截了当:“鲲鹏、昇腾提供多样性算力、拥抱全栈创新、与合作伙伴、开发者朋友们一起,持续打造计算产业生态,让每一位开发者的智慧汇聚成全生态创新,共同点亮多样性计算新时代”。
在今年HUAWEI CONNECT 2020期间,华为宣布向业界全面开放鲲鹏全栈、昇腾全栈、发布分布式多样性计算软件套件,加速产业创新,使能极简开发,与业界伙伴携手,共赢计算新时代。
华为开放主板和部件,使能硬件伙伴打造自有品牌整机产品,全面共享能力,坚持伙伴优先,在2020年6月,伙伴服务器出货量已超过华为自有品牌;
华为如期开源openEuler、openGauss、openLooKeng和MindSpore,软件伙伴基于开源版本陆续推出商用发行版并在关键行业和项目商用;
华为全方面使能合作伙伴,鲲鹏、昇腾开发者已超过30万,合作伙伴超过1000家,完成兼容性认证的解决方案超过3000个。
万物互联的智能时代,算力需求爆炸式增长,单纯依靠芯片工艺进步带来的算力提升,已不能满足需求,须进行计算体系的架构创新。华为的创新就是从通用计算走向通用计算加异构计算的多样性算力创新,和从硬件到基础软件,到应用使能的全栈协同创新。
在国产计算生态方面,PK体系进展神速。“PK体系”是一个基础的、先进的、开放的架构组合。
飞腾“Phytium处理器”,是中国电子自主设计兼容ARM V8指令集的处理器芯片产品。麒麟Kylin操作系统也是中国电子自主开发的国产操作系统。它支持云计算、虚拟化、大数据等先进应用并与飞腾CPU深度适配。
PK体系是兼容移动、云、(虚拟化)、大数据和物联网、人工智能等各项新技术的产品组合生态。
“PK体系”聚合国内产学研领域400多家核心企业,共同开展关键技术攻关和公共技术服务,形成丰富的办公和事务处理类应用生态体系,目前已在国家部委、中央企业、地方政府等重要行业领域信息化建设中实现数万套规模应用。
通过联合兄弟央企,打造CPU和操作系统联合创新实验室,推动PK体系在国家重要行业领域广泛应用;通过联合地方政府,建成了包括长沙中电软件园在内的35家产业园区,构建了年营业收入超过6000亿元的大生态。
据介绍,“PK体系”对接国际ARM服务器标准与软件领域企业,与 Google、微软、戴尔等在技术标准领域,与Linaro、红帽等在ARM全球开源生态领域,与SAP、IBM等在企业级应用领域展开全面合作。基于“PK体系”的生态建设,已成为国际ARM生态体系的重要支撑。
国产自主计算生态的发展,让计算自主可控落地,产生效益和价值。