重磅 | 华为发布绝杀计算战略!投15亿美元打造开放生态,全球最快AI训练集群Atlas 900,绝了!

文 | 阿晶、丹丹、王银发于上海华为HC大会现场

原文来源:https://mp.weixin.qq.com/s/DO3zhNmaO_ZuU45B5XX8tA

科技的不断发展正逐步加速智能世界的到来。一直,华为致力于提供经济且充裕的算力,力图像使用电力一样帮助开发者方便获取AI能力,从而实现让算力更加普惠,让算法更加简单的目标。转眼已到华为全联接大会的第四个年头,让我们共同见证来自“共创智能新高度”的美好。

重磅 | 华为发布绝杀计算战略!投15亿美元打造开放生态,全球最快AI训练集群Atlas 900,绝了!_第1张图片

2019年9月18日-20日,华为全联接大会2019正式现身上海世博展览馆、上海世博中心,关于持续被热议的行业数字化转型、全新赋能开发者的沃土2.0计划、深度了解开发者眼中的自研智能计算鲲鹏+昇腾两大计算平台等诸多内容,亟待一一揭晓。Everybody is here now ! Let’s go!

锁定计算红利,打造最佳连接,华为持之以恒

两年之前,华为发布了崭新愿景,力图构建一个万物互联的智能世界;而在过去的30年,华为一直积蓄力量努力打造世界上最好的联接,这一点在华为副董事长胡厚崑在华为全联接大会2019的开场keynote中被首先提及。       

重磅 | 华为发布绝杀计算战略!投15亿美元打造开放生态,全球最快AI训练集群Atlas 900,绝了!_第2张图片

“我们越来越清楚地看到,要构建这样一个智能世界,有两类关键技术值得不断投资与创新,那就是计算和连接。尽管在过去的很长时间里华为在连接上做了很大投入且成绩斐然,但并不意味着华为只是一家做连接的公司,在我们眼中,计算与连接同样重要,甚至可以被认为是密不可分。”        

重磅 | 华为发布绝杀计算战略!投15亿美元打造开放生态,全球最快AI训练集群Atlas 900,绝了!_第3张图片

或许这种密不可分的关系可以简单表述为在当今世界中,哪里有连接,计算就在哪里应运而生。关于计算,华为始终保持对产业发展的敏感观察。70年一路走来,从1946年第一台计算机诞生至今,从大型机、小型机-台式机、便携机、智能手机以及如今的可穿戴设备,计算机的体积越来越小但功能却越来越多,人类与计算的距离缩短彰显着未来发展的无限前景。

重磅 | 华为发布绝杀计算战略!投15亿美元打造开放生态,全球最快AI训练集群Atlas 900,绝了!_第4张图片

从过去基于规则的计算,到现在依赖于统计计算的新式计算模式,除了能够更好地解决那些没有固定规则可定义的问题之外,甚至奠定了来自AI的突破性发展。对此胡厚崑大胆预测,在未来的五年时间中,这种基于统计的计算模式所消耗的算力有可能占据到整个社会所需要算力的80%以上。“基于这样的大趋势,我们有理由相信,计算正在进入一个新的智能时代。但在智能计算的时代,有几个关键特征需要重点把握。”

  • 未来对算力有高度依赖。事实上基于统计的计算模式本身就是一种“暴力”计算,高度依赖算力。

  • 智能无处不在,计算即无处不在。计算不会仅仅停留在中心节点。从中心侧到边缘侧到终端侧,无处不在的计算将是智能时代的一种新形态。

  • 迫切需要端、边、云进行协同。关于协同模式,华为认为最理想的应该是在中心节点通过暴力计算对通用模型进行训练,并且可以做到使用通用模型来支持在边缘和终端侧的计算,在这样的协同下可以更好发挥算力的效率,带来更好的体验,在这种协同之下,并不需要把所有的数据上传到云端,同时带来更好的隐私保护。

基于这样的趋势判断,华为将坚定不移地对计算产业进行投入,提出在计算产业战略的四个关键的抓手,主要包括架构的创新、处理器的投资、坚持有所为、有不所为的商业策略、打造开放的生态环境。

重磅 | 华为发布绝杀计算战略!投15亿美元打造开放生态,全球最快AI训练集群Atlas 900,绝了!_第5张图片

  • 架构创新。基于投资基础研究打造出达芬奇架构,重点解决全场景智能的架构问题。

在提供覆盖端、边、云全场景智能计算需要的驱动下,达芬奇架构的诞生其实是非常自然的选择结果。据阿晶了解,事实上达芬奇是行业里面唯一一个全面覆盖端、边、云全场景智能计算的架构。

  • 投资全场景处理器族。其中包括面向通用计算的鲲鹏系列、面向AI的昇腾系列、面向智能终端的麒麟系列以及面向智慧屏的鸿鹄系列,将来还会有一系列处理器面向更多场景得到更好的应用效果。       

重磅 | 华为发布绝杀计算战略!投15亿美元打造开放生态,全球最快AI训练集群Atlas 900,绝了!_第6张图片

  • 商业策略。华为处理器不直接对外销售,主要以云服务和部件为主面向客户,优先支持合作伙伴发展整机对此胡厚崑说:“我们会一直坚持硬件开放,把服务器主板、AI模组和板卡向合作伙伴开放,帮助做到整机和解决方案;此外还会坚持软件开源,把服务器的操作系统、数据库、AI计算框架向合作伙伴开放,在这个基础上做出商业版本,让软件的开发更容易;第三,华为不做应用,但是会投入专门的团队和工具帮助伙伴做好应用以及做好应用的迁移。”       

重磅 | 华为发布绝杀计算战略!投15亿美元打造开放生态,全球最快AI训练集群Atlas 900,绝了!_第7张图片

  • 构建开放生态。重点推进沃土计划2.0,面向未来5年,投入15亿美元,汇聚500万开发者,使能全球合作伙伴发展应用及解决方案。

据悉四年以来,华为“沃土”计划发展成就显著。计划下,超过130万个开发者,超过1.4万家的SV合作伙伴加入其中。新一轮的“沃土”计划,华为将承诺投入15亿美元资金,进一步扩大开发者社区,希望可以做到500万人的规模。        

在计算领域,华为将核心竞争力构筑在昇腾处理器和鲲鹏处理器上,即围绕昇腾,打造出全栈全场景AI解决方案;围绕鲲鹏,打通生态全链条,并率先完成从主板、服务器、操作系统、云服务及应用的系统级验证。通过鲲鹏和昇腾的加入,华为希望推动计算产业迈向x86+GPU+ARM+NPU等多样性计算发展,迎接万物互联的智能世界到来。

在已经落地的全栈、全场景的基础上,华为现场发布了Atlas 900。这款产品汇聚了华为几十年的技术积累,是当前全球最快的AI训练集群,由数千颗昇腾处理器组成。在衡量AI计算能力的金标准ResNet-50模型训练中,Atlas 900只用了59.8秒就完成了训练,这比原来世界记录还快了10秒。

最佳集群网络方面,Atlas 900 AI训练集群采用“HCCS、 PCIe 4.0、100G以太”三类高速互联方式,百TB全互联无阻塞专属参数同步网络,降低网络时延,梯度同步时延缩短10~70%。

在AI服务器内部,昇腾910 AI处理器之间通过HCCS高速总线互联;昇腾910 AI处理器和CPU之间以最新的PCIe 4.0(速率16Gb/s)技术互联,其速率是业界主流采用的PCIe 3.0(8.0Gb/s)技术的两倍,使得数据传输更加快速和高效。在集群层面,采用面向数据中心的CloudEngine 8800系列交换机,提供单端口100Gbps的交换速率,将集群内的所有AI服务器接入高速交换网络。独创iLossless 智能无损交换算法,对集群内的网络流量进行实时的学习训练,实现网络0丢包与E2E μs级时延。

系统级调优:Atlas 900 AI训练集群通过华为集合通信库和作业调度平台,整合HCCS、 PCIe 4.0 和100G RoCE三种高速接口,充分释放昇腾910 AI处理器的强大性能。

华为集合通信库提供训练网络所需的分布式并行库,通信库+网络拓扑+训练算法进行系统级调优,实现集群线性度>80%,极大提升了作业调度效率。

极致散热系统领域:传统数据中心多以风冷技术对设备进行散热,但在人工智能时代传统数据中心却面临非常大的挑战。高功耗器件比如CPU和AI芯片带来更大的热岛效应要求更高效的冷却方式。液冷技术可以满足数据中心高功率、高密部署、低PUE的超高需求。

Atlas 900 AI训练集群采用全液冷方案,创新性设计业界最强柜级密闭绝热技术,支撑>95%液冷占比。单机柜支持高达50kW超高散热功耗,实现PUE<1.1的极致数据中心能源效率。

另外,在空间节省方面,与8kW风冷机柜相比,节省机房空间79%。极致的液冷散热技术满足了高功率、高密设备部署、低PUE的需求,极大地降低了客户的TCO。

此外现场还列举了关于天文探索的案例,华为联合上海天文台与SKA共同打造。在一张有20万颗星星的星空图上,过去天文学家要从中找出某种特征的星体,需要169天;现在采用Atlas 900,仅需10秒,我们充分相信Atlas 900”给我们带来超强的算力会在科学探索、技术创新等诸多的领域带来巨大变化。 为了让各行各业获取超强算力,华为将Atlas 900部署到云上,推出华为云EI集群服务,并以极优惠的价格,面向全球科研机构和大学,即刻开放申请使用。

重磅 | 华为发布绝杀计算战略!投15亿美元打造开放生态,全球最快AI训练集群Atlas 900,绝了!_第8张图片

在打造鲲鹏产业生态环境方面,我们了解到华为正在与各地的合作伙伴一起积极利用当地的独特优势来打造不同的鲲鹏产业生态基地,希望将基地变成平台,平台上聚合生态伙伴、开放应用示范、培养产业人才、孵化产业标准。据悉,打造鲲鹏产业生态基地的工作现在已经在北京、上海、深圳、成都、厦门、西安等城市开始落地,未来还有更多的城市合作伙伴加入其中。“华为是一个愿意也善于走远路的公司,我们一直坚信作为一家技术公司,使命就是要用最好的技术解决最难的问题,把“不可能”变成的可能”。”胡厚崑总结道。

鹏城云脑:智能向类脑过渡,打造人工智能开源创新平台

在本次活动上,中国工程院院士、鹏城实验室主任高文院士分享了鹏城实验室与华为的合作,力求共同打造中国首个动态进化的E级AI超算系统,构建新一代人工智能基础研究创新平台。“联接对我们这个时代非常重要。而有了联接之后,我们要做的另外一件更高等的一件事情其实是计算。”高文如是说。        

重磅 | 华为发布绝杀计算战略!投15亿美元打造开放生态,全球最快AI训练集群Atlas 900,绝了!_第9张图片

众所周知,早些时候的计算更多是为了解工程问题。比如弹道导弹的计算,相当于是确定模式的计算,通过一个固定方程,输入参数,由计算机把方程的解求出来。但随着时间的推移,计算能力越来越强,不仅仅满足于让计算机做一些方程求解,还开始让计算能像人一样去识别图像、视频,甚至是听得懂别人说什么。这个时候的计算可谓是工程领域的计算,它需要处理宏大的数据量,有时候可能是一百万张或者一千万张的图象。而在未来,更希望计算是能够像大脑一样的类脑计算。因势而生,华为推出“鹏城云脑”,致力于智能向类脑过渡。它涵盖包括和智慧医疗(身体健康)、交通等方方面面对国家发展可能会遇到的问题当中的一些智能计算需要的模型、算法以及研究平台。

  • 开源开放:搭建鹏城云脑的计算引擎,采用华为提供的最新的人工智能,面向智能计算的系统构建启智平台。由鹏城实验室形成open AI,托管大家的软件,从而更方便软件开发。而其自身也具自行负载及平衡的能力。

  • 向社会赋能:智慧交通、智慧医疗、智慧安防:例如城市堵车以及城市安全问题。“鹏城云脑”采用一套叫数字视网膜这样的技术,通过研脑合一,把一些计算的功能放在边缘,把另外一些放在云端组合起来使系统更合理高效。最后,高文表示打造新一代人工智能基础理论开源开放创新平台,未来期待更多投身人工智能发展的团队能因此做更多贡献

直面行业AI商用裂谷 华为云正式发布“工业智能体”

2018年的华为全联接大会上,华为云业务总裁郑叶来爆出金句:致敬开发者,践行“用得起、用得好,用得放心”,实现普惠AI。2019年的全联接大会上,华为云业务总裁郑叶来携华为云重大战略部署与产品,让我们看到了华为云在普惠AI的道路上一路践行。

今天,华为正式发布了华为云工业智能体,华为称其为行业也智能化升级新引擎,其中包含了智能认知引擎、智能预测引擎、决策优化引擎。在与石油、合成纤维、煤焦化行业的合作中,华为云工业智能体帮助油石油企业在气层识别上花费的时间降低了70%,合成纤维企业的客户需求匹配率提高了28.5%,煤焦化行业利润率提升了16.6%。     

重磅 | 华为发布绝杀计算战略!投15亿美元打造开放生态,全球最快AI训练集群Atlas 900,绝了!_第10张图片

 此外,华为发布一站式开发平台ModelArts2.0版本。郑叶来表示,ModelArts可以加速企业在AI方面的净化过程。举例来说,训练一个OCR的单据模型,只需要几张原始图片,使用字据扩充到数千张,可以节省80%的人力,同比业界最好的91%精度高出5个百分点,达到96%。 

发布前夕,郑叶来介绍了全球AI领域投资趋势,并强调“直面行业AI商用裂谷”的重要性。2018年之前,全球在AI领域的投融资几乎均匀分布在各个行业与技术领域,那时的投融资是符合技术发展热潮时期的特征。此后,大量的投融资活动局部围绕几个具体的行业场景来展开,且高度集中在头部行业。可以看出, 技术上的热度局部回归到商业的理性,而一个新的技术要实现普惠,则需要跨越裂谷。

提及算力中的“暴力美学”。郑叶来强调算力的需求每年增长10倍左右,从研究来看,人类在过去十几年当中,对AI的研究不断深入,也出现了越来越多新的算法和新的探索,新的算法对算力的要求几乎是百倍增长。值得一提的是,在过去三年,算力的增长速度与论文出现的数量已经呈现正相关性;从商业上来看,只有算力的性价比越来越高,AI在商业上的应用才会越来越广泛。 所以,我们希望现在的AI像电力一样可以便利获取。

作为惠普AI的实干家,在过去的八年,华为团队致力于新的产业。而过去的一年多,华为云已涉及10+行业,500+项目成功的实践,携手合作伙伴助力企业走向智能化的升级之路。

你可能感兴趣的:(华为HC大会,计算战略,华为云工业智能体,鹏城云脑,Atlas,900,云计算,大数据,人工智能)