数据中心“芯”变革,英特尔助力异构计算化解算力瓶颈

数字化进程加速,计算是现代及未来世界解决问题的重要方法。

计算种类众多,边缘计算、异构计算、量子计算等不同种类计算有不同的聚焦领域和特定用途。随着新一代信息技术兴起,除了对算力的基础需求持续增加外,计算需求的多元化趋势也在发展。

越来越多的场景开始引入跨越标量(CPU)、矢量(GPU)、矩阵(ASIC)、空间(FPGA)等多种计算单元来进行加速计算,要解决算力的瓶颈,异构计算是非常重要的选项之一。

异构计算是指不同的架构组合在一起提供算力,解决数据处理问题的方式。其主要优点是具有比传统CPU并行计算更高效率和低延迟的计算性能。在业界对计算性能需求水涨船高的背景下,异构计算变得愈发重要。

那么常见的异构计算解决方案主要有哪些?如何通过部署分布式的跨产品组合硬件和软件的架构来提升未来数据中心的效率?

数据中心“芯”变革,英特尔助力异构计算化解算力瓶颈_第1张图片

Science与英特尔联袂推出的“架构师成长计划”第二季系列课程,为您带来第六期——《异构计算数据中心“芯”变革》。本期课程邀请了快手异构计算中心AI&HPC负责人钟辉、英特尔云与行业解决方案事业部互联网行业技术总监高明、极客邦科技创始人兼CEO霍太稳共同研讨通往异构计算实践之路,为相关领域的架构师们答疑解惑。

化解算力瓶颈,

加速异构计算提供多元算力

异构计算平衡算力供需

据赛迪顾问的《先进计算产业发展白皮书》显示,随着数字技术向经济社会各领域全面持续渗透,全社会对算力需求预计每年仍将以20%以上的速度快速增长。英特尔估算,全球的算力需求预计到2025年将提升1000倍。

当算力供给的增长无法跟上算力需求的脚步,如何解决供需矛盾?

以快手这样近3.5亿日活的短视频平台为例,日均负载千万级短视频上传,业务增长的同时对数据中心的基础设施带来挑战。如果通过简单的堆服务器的方式,这既不经济,也不可持续。异构计算从供给侧提供了平衡供需的解决方案。

数据中心“芯”变革,英特尔助力异构计算化解算力瓶颈_第2张图片

异构计算系统是由CPU加上各种加速器构成的计算系统,以达到更优、更经济地解决新型计算任务的目标。

在加速器的选择上,讲师钟辉根据经验分析了各类加速器的优劣点:

  • GPU的优点是高吞吐、高性能,同时其软件可编程,灵活性高;缺点是延迟较大。

  • ASIC在性能、功耗和成本上可以做到极致,但灵活性不够高。

  • FPGA介于GPU和ASIC,可以为架构的创新提供一个硬件可编程的载体,同时可以通过软硬件结合在系统层面做出创新性的解决方案。

 异构计算的设计流程和方法

异构计算的设计流程分为三个阶段:Workload基线分析、建立加速模型和设计实现,每一阶段都有其关键指标。

数据中心“芯”变革,英特尔助力异构计算化解算力瓶颈_第3张图片

例如在第一阶段,算法的精度、吞吐、延迟、功耗等因素决定了整个工作负载实现时的总成本,即Total Cost Ownership(TCO),它包含采购成本和运营成本,是设计流程中的重要衡量指标。

在建立加速模型阶段,通过数学建模,定量加定性地分析目标加速比和成本,从而保证设计和实现出的异构计算系统的性能可预测、成本可控。

快手架构加速异构计算提供多元算力

为了满足内容生产、内容理解、内容分发、内容消费、用户互动等过程中的多元算力需求,快手打造了可提供异构加速选项的LaoFe方案架构。

LaoFe方案通过计算体系结构创新、软硬一体化、领域专用加速器设计,实现一个架构,三重加速。该方案采用近数据处理(Near Data Processing),将计算靠近存储,减少了数据的搬移,节省了网络带宽的同时也降低了系统端到端的延迟,因此可以提供低延迟、高并发、高吞吐、更优成本(TCO)的基础资源。

数据中心“芯”变革,英特尔助力异构计算化解算力瓶颈_第4张图片

近数据处理方案在服务器机器上安装一个或多个FPGA加速卡,实现三重加速——网络加速、存储加速、计算加速。将各个关键操作卸载到FPGA实现后,CPU只负责一些维护和设备状态管理,工作负荷减轻;CPU的剩余算力则用于其他业务场景(更适合CPU做的场景,例如网页服务、流媒体服务等),或用低端的CPU去做管理和维护,降低CPU的采购成本。

数据中心“芯”变革,

软硬协同助力异构计算发展

推动异构计算发展的主要因素正是企业的工作负载驱动,或者说业务驱动。本期另一位嘉宾、来自英特尔的讲师高明分享了更多异构计算的应用场景。

为了获得更高的吞吐、更低的延时、付出更少的成本,需要采用异构算力的场景可以归纳为六大类:HPC(高性能计算)、AI(人工智能)、物联网和边缘计算、5G和通信网络、多媒体处理和渲染、和云基础设施。

数据中心“芯”变革,英特尔助力异构计算化解算力瓶颈_第5张图片

例如高性能计算需要极高的计算并行度,并且需要高精度浮点运算能力,比如双精度浮点运算FP64和单精度浮点运算FP32,因此HPC场景是最早引入异构计算架构的。它的应用场景涵盖了汽车和航空航天建模仿真、电子自动化设计与验证、生命科学、金融保险数据分析、能源勘探、气象预测等众多领域。

英特尔在2011年发布了第一代至强Phi(至强融核)加速卡就提供HPC异构计算领域的加速需求,发展到现在GPGPU(General Purpose GPU)被广泛使用在HPC领域。

事实上,“异构计算”的概念起始于上世纪80年,高明讲师以英特尔为代表梳理了异构计算的产品技术趋势。

首先,即便你只用CPU,也可以实现异构计算。

一般大家会认为从CPU上将工作负载卸载到各类其它加速卡,就属于异构计算了,其实CPU在面对异构计算需求的时候也在不断进化,CPU已经在多方面实现了异构。

数据中心“芯”变革,英特尔助力异构计算化解算力瓶颈_第6张图片

2021年英特尔发布了性能核心和能效核心战略,不同的核心聚焦不同的工作负载需求。性能核心追求单线程的高性能和低延迟;能效核心则通过精简的设计专注于提升多线程应用的吞吐性能。在数据中心领域,英特尔会推出基于性能核心的至强® 和基于能效核心的至强® 处理器来完成不同的计算任务,未来数据中心里的CPU集群就会是异构的了。

其次,硬件层面,异构计算必将迎来XPU时代。

不仅是CPU在进化,XPU战略的部署更好地平衡了功率、性能和响应时间的差异性。图形处理器(GPU)、视觉处理单元(VPU)、现场可编程门阵列(FPGA)和特定应用集成电路(ASIC)等硬件产品对于加速AI推理、视频处理、HPC等工作负载至关重要。

数据中心“芯”变革,英特尔助力异构计算化解算力瓶颈_第7张图片

高明讲师也指出,加速器只是异构计算的组成部分,构建高性能、低成本、灵活高效的异构计算平台还需要应用更多技术,比如I/O和I/O虚拟化技术、内存技术、虚拟内存共享技术。英特尔发起的CXL标准支持主机与加速设备的缓存一致性,是英特尔对异构计算发展的重要贡献之一。

软硬协同,统一的软件编程架构支持多种异构计算单元。

不同的异构硬件有自己的软件栈和模型,开发者需要掌握全部软件开发工具是很难的。针对软件方面的挑战,英特尔率先推出了基于标准的编程模型“oneAPI”,以统一各XPU类型的代码。

数据中心“芯”变革,英特尔助力异构计算化解算力瓶颈_第8张图片

作为统一的软件编程架构,oneAPI可以支持多种异构计算单元,包括英特尔硬件,也支持其它厂商的硬件。oneAPI提供跨硬件架构的编程语言和基于API的高性能库,可以在多种异构平台上运行,其中很多库将开源,鼓励大家协作创新。

嘉宾分享:XPU愿景下,

异构计算需要「综合解题法」

交流碰撞火花,沟通启迪灵感。本期嘉宾会话环节中,三位嘉宾对于异构计算在未来5年的市场发展和技术升级方面,各自分享了一些观点与实践经历。

数据中心“芯”变革,英特尔助力异构计算化解算力瓶颈_第9张图片

面向未来,相关企业该进行怎样的探索来引导行业进入异构计算时代?同时放眼现在,异构计算目前最能够解决的市场问题和技术场景分别是什么?

欲了解更多精彩内容和技术细节,请观看“架构师成长计划”第二季第六期的完整课程。

大咖寄语——致年轻的架构师们

钟辉:数智升级广阔天地,异构创新大有可为。

高明:积极拥抱开放的协议、标准和平台,让各类的加速器充分释放计算潜力,让异构计算落地更多场景。

霍太稳:祝愿每一位架构师都能在成长过程中,借助先进的技术为自己的企业和社会创造更大的价值。

 

“架构师成长计划”第二季

“架构师成长计划”是国际学术期刊《科学》(Science/AAAS) 与英特尔联合推出的公益学习计划,旨在为面向数据科学家、架构师和IT开发者们提供学习资源与公益培训,使架构师群体进行系统性地学习、拓展与创新,获得深入性与持续性的学习成长。

在“架构师成长计划”第一季的课程中,我们邀请到了产业资深技术企业专家代表讲授,吸引了超过1500位架构师踊跃参与,得到了相关企业、讲师以及听众的高度认可和积极反馈。

为持续助力架构师把握数智机遇,构建未来,第二季“架构师成长计划”全新升级,强势归来!业内顶尖架构师大咖齐聚,为架构师群体量身打造系统成长课程,带来涵盖云游戏、云原生、联邦学习、生信大数据、网络智能化、AI for Science、算力网络、云网融合等多个热门话题的前沿技术及案例实践。每一主题系列将邀请一位英特尔专家和两位行业资深专家,从各自的实践经验出发,持续为架构师们输出最前沿的技术。

除了干货满满,第二季还设置了“互动有礼”活动:

▪ 所有观看课程视频的用户,均可获得英特尔&Science联合颁发的结业证书

▪ 报名并登录观看十期课程视频,随机抽取10名用户,获得“架构师Buff王”大礼包(活动时间:2022年6月28日至2022年10月31日)

你可能感兴趣的:(开发者分享,架构)