异构计算场景下构建可信执行环境

本文转载自 OpenHarmony TSC 官方微信公众号《峰会回顾第4期 | 异构计算场景下构建可信执行环境》

演讲嘉宾 | 金意儿
回顾整理 | 廖   涛
排版校对 | 李萍萍

异构计算场景下构建可信执行环境_第1张图片

嘉宾简介

金意儿,华为可信计算首席科学家,IEEE 硬件安全与可信专委会联席主席,OpenHarmony 技术指导委员会安全及机密计算 TSG 成员,美国佛罗里达大学名誉教授。2012 年毕业于耶鲁大学,获得电气工程博士学位。撰写了《集成电路安全》一书,同时在国际知名期刊和会议上发表了超过 200 篇论文,是亚洲硬件安全年会的联合创办人,也参与了多个信息安全和集成电路学术会议和学术杂志的组织工作,目前是 IEEE 设计自动化委员会(CEDA)的杰出讲师。

文章内容来源

第一届开放原子开源基金会 OpenHarmony 技术峰会——安全及机密计算分论坛

视频回顾

视频链接:https://www.bilibili.com/video/BV1Fs4y1S7ZT/?spm_id_from=333....

正 文 内 容

异构,即将 CPU、DSP、GPU、ASIC、FPGA 等不同制程架构、不同指令集、不同功能的算力单元,组合起来形成一个混合的计算系统,使其具有更强大、更高效的功能。如何在异构计算场景下构建可信执行环境呢?华为可信计算首席科学家、IEEE 硬件安全与可信专委会联席主席金意儿教授在第一届 OpenHarmony 技术峰会上提出了几点思考。

异构计算场景下构建可信执行环境_第2张图片

金意儿首先从摩尔定律放缓现象作为切入点。摩尔定律自 1975 年起至 2020 年得到了快速的发展,使得芯片中集成晶体管的密度大幅提升,推动了半导体商业模式“飞轮”快速运转,但逐渐出现放缓现象;2020 年至 2030 年间,在台积电先进晶片制程工艺发展的引领下,摩尔定律放缓现象更为凸显,似乎摩尔定律红利将“走到尽头”。此外, Dennard Scaling、Amdahl’s Law 等定律也在逐步放缓或失效,这预示了计算结构将发生改变。计算结构会如何变化呢?目前主要有 3 类观点:1.近十年会发生架构的变化,即异构;2.近二十年材料会更新;3.更长远来看,计算的模式会发生变化。总之,短期内异构将成为主流。

异构计算场景下构建可信执行环境_第3张图片
备注:图片来自于公开资料

同时,人工智能(AI)推动产业结构优化升级,产业智能化趋势即将颠覆传统产业。而要想更好的运用 AI,首先需要对其提供大量异构场景下的算力,在计算数据量变大的背景下,数据中心的性能税现象也逐步凸显,算力的瓶颈由数据运算转为数据搬运。CPU 在进行数据计算时大量的时间不是做其擅长的运算,而是搬运数据。基于此,英伟达提出了将数据搬运工作从 CPU 转移到 DPU 上进行的方案,在未来数据中心的演进中,CPU 用以支持通用计算,GPU 支持计算加速,DPU 支持数据中心的数据移动和数据处理。

异构计算场景下构建可信执行环境_第4张图片
备注:图片来自于公开资料

在计算架构逐步改变的时代浪潮下,安全策略应该如何发展?CPU 所不擅长的领域,正在逐渐转移到专业的硬件上进行,导致计算逐渐远离了 CPU,而机密计算环境还是在围绕 CPU,万一 CPU 不见了,机密计算环境怎么办?系统安全构建主要有两个方向,一是系统本身的安全,二是系统提供安全能力。系统本身的安全,类似于 CET、CFI 防护等;系统提供的安全能力,即机密计算环境等。

异构计算场景下构建可信执行环境_第5张图片

下图所示为可信计算和异构计算的场景,体现了异构计算与可信计算“并行”“独立”发展。在异构计算场景的迭代中,从以 CPU 为中心,到 CPU 只是普通的 PU,到未来可能没有 CPU。而机密计算却非常“忠诚”,始终围绕 CPU,即使最新的 ARM CCA 技术仍是围绕 CPU 进行。那么在异构计算场景下,如何构建可信执行环境呢?分布式机密计算是一种思路,将 CPU 上的技术应用到其他的 XPU 上是另一种思路,但最关键的问题是怎么用。该问题在 AI 安全上非常明显,AI 模型都在 GPU 上,TEE 想用也用不了,因为其保护边界没有得到扩展。

异构计算场景下构建可信执行环境_第6张图片

在学术界,最早 Graviton 提出了要构建一个大可信执行环境的思路,通过修改 GPU,CPU 的可信执行环境的理念就可以用在 GPU 上;HIX 提出不一定要改 GPU,通过改 CPU,加固 I/O 路径,将 TEE 扩展到 GPU 设备上也是可行的;HETEE 提出了改进互联的方法,这也是一个跨时代的工作;此外,还有一些学者提出了观察方法,从观察的角度构建一个大的可信执行环境。

总的来说,主要包括 3 条清晰的路线,即要么改 GPU,要么改 CPU 本身,要么改互联。在未来计算的发展中,CPU 不再是中心,以 CPU 为中心的安全理念应如何往外扩呢?鉴于短期内 CPU 会继续存在的前提,目前的方案还是以 CPU 拓展作为主流。互联总线的创新,也会对数据中心的架构产生根本性的变化。而如果互联总线能够支持可信环境的拓展,则可以构建即类似于数据中心原生的可信执行环境。

回到嵌入式系统,我们发现嵌入式系统走得更快。手机上的 SOC,很早以前就做到了所有的模块都集中在一个 SOC 上。将其打开来看,发现 SOC 的可信环境拓展,走得比数据中心要快、要早,只是因为其在手机内部,大家没有发现。高通的芯片也好,苹果的芯片也好,华为的芯片也好,如果仔细去看,上面都构建着小的 TEE 环境,其实早就把 CPU 包进去了,但是这些技术并没有反哺到整个计算系统中。

异构计算场景下构建可信执行环境_第7张图片
备注:图片来自于公开资料

金意儿教授最后提到,到底传统的 TEE 扩展和手机上的 TEE 扩展会不会是两条线,或者最后会融合,以及传统的 TEE 的扩展究竟往哪一个方向走,到底是改 GPU 还是改 CPU,还是改互联?期待未来学术界和工业界的共同合作探讨。

点击关注了解更多OpenHarmony TSC技术干货内容

你可能感兴趣的:(openharmony)