整个鲲鹏计算产业生态的共识是,抓住历史机遇,打造更强大的算力,共建生态,为全球用户创造真正的商业价值,是其立足和壮大的根本
文 | 郁之鑫
2019年或将是载入中国科技史的一年:当年7月,在华为的牵头下,一个由150余家企业组成的鲲鹏计算产业联盟成立,而这将是一个致力于在未来十年改写中国乃至世界芯片产业格局的联盟。
所谓鲲鹏计算产业,是基于鲲鹏处理器构建的全栈IT基础设施、行业应用及服务,具体包括PC、服务器、存储设备、操作系统、中间件、虚拟化、数据库、云服务、行业应用等。
过去40年,在英特尔和微软的联手推动下,形成了一个覆盖全球的x86计算商业体系,小到我们手里的电脑、大到支持航天飞行宇宙探索的超级计算机,以及保障整个人类社会运转的大小IT系统,绝大多数都是基于x86计算生态构建。换言之,它们可能都有一颗英特尔“芯”。
不仅仅是英特尔与微软,我们耳熟能详的科技巨头,如惠普、戴尔、AMD、微软、甲骨文、SAP、VMware、亚马逊AWS,以及全世界数以万计的软件、硬件和IT服务公司,也包括如今鲲鹏计算生态的联盟成员,都是x86计算生态的构建者、使用者和受益者。
但越来越多学界和产业界人士认为,未来的智能世界,仅有x86计算生态还不够,5G、AI(人工智能)、云服务等新兴技术将催生新的计算需求,数十年一遇的创新风口渐渐凸显。
2017年3月,两位图灵奖得主、计算机体系结构宗师John M. Hennessy和David A. Patterson在斯坦福大学演讲时称,计算机体系结构领域将迎来又一个黄金十年,新的架构设计会带来更低的成本,更优的能耗、安全和性能。
近几年来,云计算服务商纷纷自研AI芯片,各类AI芯片创业公司不断涌现就是风起的明证。
诸多公司里,华为走得最为彻底。2019年9月,华为宣布面向计算架构创新,以鲲鹏、昇腾处理器为双引擎的开放计算战略。
鉴于“5·16”事件(华为被美国政府列入“实体名录”),这很容易让人联想到华为此举是为了对抗美国的禁运大棒。但“5·16”只是一个让华为抛弃犹豫的外部因素,深层次驱动力来自该公司对未来技术趋势与市场需求的长期观察与投入。
“在未来的智能世界里,联接到哪里,计算就到哪里,哪里有计算,哪里就有联接,两者互相促进、协同发展。”华为轮值董事长胡厚崑在2019华为全联接大会上说道。
这也是为什么华为十几年前就开始投资处理器、数据库,操作系统、云服务等计算相关的产业,并将公司战略从联接升级为“联接+计算”双战略。
目前,最新的鲲鹏920处理器在某些方面可媲美英特尔处理器,但挑战仍旧巨大,因为造芯只是基础工作,联手上下游玩家构造出面向未来计算需求的鲲鹏产业生态则是一场无比艰巨的持久战。
好在愿意与华为一起造梦的企业不在少数。如前文所述,鲲鹏计算产业联盟初成立,吸引的会员数即超过了150家,接下来还源源不断有软硬件公司跟上来。
毋须讳言,2019年爆发的中美贸易战全方位影响着国际国内环境,具体反映在IT领域,国产化趋势较过去明显,IT国产化市场前景也颇为诱人。
但包括华为在内的多个鲲鹏产业生态玩家向笔者表示,IT国产化趋势客观上会给鲲鹏产业生态创造一定的成长空间,但那仅是短期的外部助推力,整个鲲鹏产业生态的共识是,抓住历史机遇,打造更强大的算力,共建生态,为全球用户创造真正的商业价值,是鲲鹏产业生态的初心,也是其立足和壮大的根本。
无论未来成败与否,这都将是一条充满光荣与梦想的荆棘路。
“云+AI+5G”催生多样性计算
2012年6月,谷歌公布了一个令人振奋的消息:1.6万台电脑组成的“谷歌大脑”用七天时间学习完1000张猫咪照片后,能够自动识别出猫。
“猫脸识别”随即在全世界范围内掀起了以深度学习为代表的AI热潮。
近八年过去,人们对AI的认识趋向理性,AI对产业的影响也逐渐沉淀下来,例如,这一波AI浪潮使得在CPU等通用处理器之外诞生了新的处理器品类——AI专用处理器。
这是因为,AI开启了基于统计的计算模式。计算机诞生以来主要是基于规则的计算模式,但是对于一些无法用确定规则描述的问题,如语音识别、图像识别、实时翻译等,基于统计的计算模式能够很好地解决。
但统计计算是一种“暴力计算”,高度依赖于算力,CPU等通用处理器往往性能不够好,效能比不够高,AI专用处理器应运而生。
通过华为最新AI训练集群可以感受一下AI专用处理器的强大:Atlas 900内置数千颗昇腾910 AI处理器,性能相当于50万台PC,原本需要169天解决的天文计算问题,Atlas 900只需花费10秒。
目前,AI处理器的研发已经是显学。亚马逊AWS、微软、谷歌、阿里云、百度、华为等云服务商纷纷自研AI芯片,寒武纪、地平线等AI芯片创业公司也接踵而至。
随着AI逐渐渗透到人类社会的方方面面,有机构预计,五年后AI所消耗的算力,将会占到全社会算力消耗总量的80%。
云服务为多样性计算创造了成长的土壤。如今、亚马逊AWS、微软、谷歌、腾讯、华为等云服务商都在提供多样化的算力,主要分为三类,一类是基于x86处理器的算力,一类是基于Arm处理器的算力,一类是基于专用AI芯片的AI云服务。
相对x86架构处理器,Arm处理器具备低功耗、多核等特性,许多公司都曾努力将Arm服务器带入数据中心市场。例如,除了华为,戴尔、AMD、英伟达、Marvell、高通都推出过Arm服务器。目前,Arm服务器在数据中心的应用前景日益明朗。
首先是因为Arm处理器性能日益强悍。以华为鲲鹏920处理器为例,该处理器采用7nm制造工艺,单芯片最大可支持64核,因为华为采用了优化分支预测算法、提升运算单元数量、改进内存子系统架构等一系列微架构设计,处理器性能得以大幅提高。典型主频下,SPECint Benchmark评分超过930,超出业界25%。同时,能效比优于业界标杆30%。
生态方面,除了华为在全力推进Arm服务器生态建设,微软也在2018年11月开始支持64位Arm应用开发和提交至应用商店。尤其,云服务商亚马逊AWS推出了基于Arm架构的计算服务,微软Azure也在大数据、云存储和搜索场景采用 Arm服务器。“大V”的动作往往引来跟随者无数,也势必加速Arm生态的发展。
应用方面,Arm服务器吸引用户的不仅是能效比,其多核特性适合大数据、HPC等高并发应用。据华为透露,华为TaiShan服务器的第一笔千台大单就来自一位海外互联网客户,用于处理大数据分析。
腾讯云一位服务器架构师还指出Arm处理器的另一种刚需场景:因为智能手机都是采用Arm处理器,腾讯云会提供基于Arm处理器的算力,以方便开发者在云端开发各类手机应用,这种情况下,如果使用基于x86处理器的算力,则会因为转换而损失性能。
基于以上种种因素,数据中心正从几乎清一色x86架构处理器的局面,逐渐走向“x86处理器+Arm处理器+AI专用处理器”等多种处理器并存的多样性计算时代。
不仅如此,近在眼前的5G还会进一步拓宽计算边界,催生架构演进。
因为具备高速率、低时延、高容量(高并发)等特性,5G有望推动计算在多种场景的应用,例如视频、车联网、泛在电力物联网、工业互联网等领域。而这些新兴领域还都是一片蓝海,什么架构的处理器、什么样的芯片厂商能占领上述市场还很难定,但赢家想要通吃可能比较难,例如在自动驾驶芯片领域,显卡芯片出身的英伟达目前暂时领先,华为、高通等具有通信联接能力的厂商在物联网、车联网也存在机会。
科技产业当前的共识是,计算和智能将会无处不在,而不仅像今天主要分布在数据中心。未来,从中心节点的暴力计算,到边缘侧的专业计算,如基因测序,以及端侧的个性计算,如手机、手表、耳机等,一起构成智能时代的计算形态。并且,端边云之间需要高效的协同。中心侧负责通用模型的计算,为端侧的个性化计算和边缘侧的专业化计算,提供协同支撑。
正如华为IT营销运作部部长董理斌向笔者所强调的,华为做计算芯片绝不仅仅是服务传统的数据中心和PC市场,而是与生态伙伴一起共同开拓多样性计算的大蓝海市场。这也是为什么华为推出了“端、边、云”统一的达芬奇架构,为什么其整体计算战略首先强调将实现面向计算架构的创新。未来,华为在车联网的布局、在5G方面的积累,都可能为生态伙伴深入大蓝海市场带来助推力。
华为凭什么
华为IT战略与业务发展部部长武湛是华为鲲鹏产业生态负责人之一,最近半年来他频繁见各种合作伙伴。武湛告诉笔者,目前合作伙伴对华为的疑虑是,华为凭什么能做这件事,能不能坚持到底?
但也有多位行业人士向笔者表示,在国内外众多力求将Arm服务器带入市场的企业中,华为最被看好。
华为在计算领域投资有15年之久,初步构建了基于鲲鹏处理器的软硬件解决方案。目前,华为是业界唯一同时拥有计算架构中“CPU、NPU、存储控制、网络互连、智能管理”五大关键芯片的厂商,并且自主研发了openEuler服务器操作系统和GaussDB数据库,以及内置鲲鹏处理器的TaiShan服务器。
其中,openEuler是华为研发的企业级linux服务器操作系统,也是目前支持TaiShan服务器最好的操作系统之一,在性能、兼容性、功耗等方面具备较强的竞争力。华为GaussDB数据库是全球首款AI-Native数据库,能够同时支持x86、Arm、GPU、NPU等异构计算,在工商银行和招商银行均有应用。
不过,有产品不代表就一定能用和好用,而且,造芯最怕的是造出来没人用,没有场景去打磨,但这于华为问题不大,因为华为是一个拥有19万名员工、业务复杂的国际化大公司,本身就是一个超级用户,而且该公司在运营商和政企市场积累深厚,也便于为鲲鹏找到典型用户。
从2016年开始,华为在自家IT系统中使用鲲鹏,截至目前已部署了超过10万台鲲鹏设备,月均访问用户数超过30万,支撑了研发、财经、生产、办公、交付、销售等业务场景。
2019年6月29日,浙江移动在杭州成功打通全球首个基于鲲鹏计算平台的云化核心网语音电话。该项目采用基于鲲鹏计算平台的华为端到端网络云解决方案,标志着华为在运营商核心网领域鲲鹏软硬件解决方案的成功商用。
不仅仅是浙江移动,山东移动CRM核心系统、江苏电信大数据平台等均使用了TaiShan服务器。
此外,鲲鹏在电子政务和互联网用户市场也实现一定的突破。例如,在北京平安城市的大数据项目中,基于鲲鹏的大数据节点规模已经超过2000台,承载了全文检索、综合分析等业务。新浪公司、海外某互联网公司也都引入了鲲鹏设备。
最重要的是,华为覆盖ICT多个业务线,如云计算、传统IT、手机、运营商等,每条业务线都有鲲鹏用武之地。
例如,华为不仅推出了多款TaiShan服务器,而且该公司的存储的主力产品已经切换到鲲鹏架构。2019 Q3 Gartner全球存储市场份额报告显示,华为存储单季度份额首次跻身前三, 增长率则持续第一,这个强势业务线无疑会有力锻造和推广鲲鹏处理器。
云计算方面,华为是中国位列TOP4的公有云IaaS服务提供商,目前已经上线百余项“鲲鹏+昇腾”云服务。
董理斌向笔者表示,云服务对鲲鹏的价值不仅仅是提供鲲鹏算力,云上跑着各种各样的应用,从而不断地优化鲲鹏计算架构,提升整体性能。因此,越来越多的公有云厂商引入Arm服务器或提供基于Arm的云服务,这对鲲鹏生态是极大的利好。
2019年7月,华为云联合25家伙伴发布“华为云鲲鹏凌云伙伴计划”,为合作伙伴提供全面支持,首批帮助100家伙伴完成基于鲲鹏云服务的开发、应用移植,以及为合作伙伴提供包括专家技术、市场拓展、营销推广、人才培养等方面的全面支持。
至此,也很容易理解为什么华为将鲲鹏产业布局定为“一云两翼双引擎”(“一云”指华为云,“两翼”指华为智能计算和智能数据与存储,“双引擎”指鲲鹏和昇腾):因为在鲲鹏产业生态真正成熟之前,在鲲鹏产业联盟成员真正独当一面之前,“一云两翼双引擎”是华为推进鲲鹏软硬件解决方案走向成熟的支点,也是产业领头羊的最重要责任。
并行科技是一家提供超级计算云服务的中国公司,其创始人兼CEO陈健曾经在英特尔工作,他向笔者表示非常看好华为。“因为华为从第一天起就按照‘主流市场性价比’在进攻,有戏!”陈健说。
但他也表示,任何一款处理器的市场成功,必须要把“量”这个因素考虑进去,英特尔依靠“量+摩尔定律”,打败了其他通用CPU玩家;但台积电依靠更大的“量”,依靠芯片代工完成的7nm工艺打败了英特尔工厂工艺,实现逆袭。
华为目前尚未透露鲲鹏处理器的整体出货量, 而对“量”的追求只能依靠广大合作伙伴。
根据规划,在鲲鹏处理器上,华为将按照“量产一代、研发一代、规划一代”的节奏投资芯片,持续演进,后向兼容。
并行科技目前已经推出了基于鲲鹏处理器的超算云服务,它也在期待华为鲲鹏下一代处理器,因为从目前透露的性能指标来看,下一代鲲鹏处理器浮点性能将有大幅提升,可以更好地满足并行科技的需求。
“鲲鹏处理器达到市场主流性价比阶段时,我们将会海量采购华为鲲鹏计算资源,起步超过1亿元。”陈健对笔者说。
愚公移山+蚂蚁雄兵
未来五年,华为将投入15亿美元发展产业生态。华为还确立了“有所为有所不为”的商业模式。总体而言,该公司不直接对外销售处理器,以云服务面向客户,以部件为主面向合作伙伴,优先支持合作伙伴发展整机。
落到具体执行层面,则可用“硬件开放、软件开源、使能合作伙伴”来形容。
所谓硬件开放,指华为对外提供主板、SSD、网卡、RAID卡、Atlas模组和板卡,优先支持合作伙伴发展服务器和PC等计算产品。
众所周知,华为有基于鲲鹏920处理器的TaiShan服务器,但华为Cloud & AI产品与服务总裁侯金龙曾在2019华为全联接大会上表示,TaiShan服务器将聚焦做高端和内部配套,华为在时机成熟时会停止TaiShan服务器销售业务。
软件开源,指华为将服务器操作系统、数据库、AI开发框架等软件开源,帮助伙伴做好商用版本,让软件开发更简单。
按照规划,华为于2019年12月31日开源服务器操作系统,2020年6月开源GaussDB T单机版数据库,2020年一季度开源MindSpore全场景AI计算框架。
因为华为有处理器也有操作系统和数据库,能拿出完整的解决方案,业界有整机厂商向笔者表示过担心:“华为是想做中国的英特尔还是IBM?如果是英特尔,我们愿意与华为合作,如果是想做IBM,那我们不参与。”
IBM曾经是中高端服务器市场的王者,但其商业模式与英特尔不同,英特尔只卖处理器,IBM有自己的处理器、操作系统、数据库和中间件,主要销售整机。
对此,武湛向笔者表示,华为投入操作系统和数据库,但坚持不做商业变现,而是通过开源方式将能力释放出去,支持合作伙伴做大做强,希望将来有“中国的微软和甲骨文”出现一起做大计算产业。
使能应用开发和迁移方面,华为不做应用,但华为提供工具和团队,帮助伙伴更高效地做好应用开发和迁移。
华为与合作伙伴按产业、按区域、分阶段做应用迁移和开发,此外华为还会通过“沃土计划”大力培育鲲鹏开发者。
当前鲲鹏计算产业生态建设还属于初级阶段,这一阶段的重点是在政务、电信、金融和互联网等行业选取典型场景进行产业使能、孵化和试点,树立标杆案例,从而建立产业界上下游厂家和用户的信心。
“我们内部称此事为愚公移山,因为做生态没有捷径,只有一个场景一个场景地搬,一个行业一个行业地去死磕。”武湛说。
客观上说,相比x86商业生态里的各类科技巨头,当前鲲鹏产业联盟里的成员体量相对要小,董理斌向笔者形容 “我们是一群‘蚂蚁雄兵’去一起愚公移山”。
蚂蚁虽小,但“愚公移山”的勇气和梦想可贵。
用友网络高级副总裁徐洋向笔者表示,对于用友来说,虽然投入鲲鹏是一项长期而浩大的工程,但用友还是愿意与华为一起,围绕鲲鹏展开深入合作,在助力企业数字化转型的同时,推动鲲鹏计算产业发展。
另一位中国软件企业高管则认为,鲲鹏将为中国软件从业者带来新的想象空间。
“x86体系太成熟太稳固了,中国软件公司很难长成为类似甲骨文SAP这样的巨头,鲲鹏让人看到了希望。”上述高管向笔者说。