本文转载自 OpenHarmony TSC 官方微信公众号《峰会回顾第9期 | 移动应用高级语言开发——并发探索》
演讲嘉宾 | 李勇彪
回顾整理 | 廖 涛
排版校对 | 李萍萍
嘉宾简介
李勇彪,OpenHarmony 项目群技术指导委员会编程语言 TSG 成员,华为 OpenHarmony 虚拟机编译器专家。2021 年至今,华为终端 OS 语言编译运行时团队架构师,负责 OpenHarmony 高级语言编译运行时的整体技术架构。曾就职于阿里巴巴,参与并主导 AliOS 高级语言虚拟机的编译优化、内存管理优化、多线程优化等项目。目前聚焦在移动 OS 的编程语言及语言虚拟机领域。
内容来源
第一届开放原子开源基金会 OpenHarmony 技术峰会——编程语言及应用框架分论坛
视频回顾
视频链接:
https://www.bilibili.com/video/BV1Co4y1c7iC/?spm_id_from=333....
正 文 内 容
随着摩尔定律放缓现象的日益突出以及计算机多核系统架构的出现,并发编程持续引起了广泛的关注。目前,移动应用领域的并发探索有哪些,在 OpenHarmony 上又有哪些成果和未来规划呢?华为终端编译器与运行时架构师李勇彪在第一届 OpenHarmony 技术峰会上给大家带来了几点分享。
01►并发的背景
摩尔定律由 Intel 的联合创始人兼前 CEO 戈登·摩尔提出,即半导体芯片上集成的晶体管和电阻数量将每两年增加一倍,微处理器的性能提高一倍,或价格下降一半。在过去的几十年间,摩尔定律为算力乃至生产力的发展作出了巨大的贡献,但至 2022 年,随着 Denard 微缩效应遇到了元件物理的瓶颈,业界逐渐对这一观点产生了强烈的分歧,一部分人士认为摩尔定律正在逐步放缓甚至有失效的倾向,另一部分人士认为摩尔定律仍然有效,仅是成本增加了。在该背景下,单芯片功耗约束了单核的性能,基于多核化的并发编程成为移动领域提升性能的重要技术手段。
摩尔定律放缓现象
那么,什么是并发呢?并发指同一时间应对多项任务的能力,一个时间段中有几个任务都处于运行准备就绪状态,在单核设备中,任一个时刻只有一个任务能够运行,其运行顺序是不固定的;而在多核场景中,同一时间可以多项任务并行。
并发与并行
02►常见的并发模型
2.1►►线程和锁
线程和锁是并发模型的一种常见表示,下图示意了一种典型的 CPU 多核架构,可以看出,L3 Cache 在多核间共享,因此 L3 Cache 的一致性是保证程序在多核间正常运行的基础。在确保单线程执行结果不变的前提下,可以做任意编译器优化,如常量传播、公共子表达式消除、内联、标量替换、死代码删除、指令乱序等。由于不同的操作系统对内存一致性有不同的约束,需要通使用锁等同步语义保证多线程内存一致性。目前,通过基于共享内存的乐观锁、自旋锁、偏向锁、精准内存屏障等手段可以实现性能优秀的多线程程序,但也存在一定的问题:线程和锁方案的优化依赖软件工程有良好的并发实践规范和资深并发程序开发者,且容易引发死锁,测试及维护的成本也很高。
一种 CPU 多核架构
2.2►►Actor 模型
Actor 模型概念的提出已经几十年了:一个 actor 是一个基本的计算单元,通过消息通信;内部维持可变状态,两边互相不能直接修改。其优势在于每个 Actor 易于维护以及测试,业务开发只需要关心业务的消息处理,测试只需要覆盖消息流顺序即可。此外,其容错性也好,适合分布式编程。当然,Actor 模型也存在一定的短板:存在信箱堆满问题,不共享状态,只通过消息通信交互,不适合细粒度并行。
Actor 模型
2.3►►函数式编程
函数式编程有以下特点:函数是一等公民;无副作用(无共享可变状态);纯函数构建一切。在函数式编程下,只要输入一定,其输出也一定符合预期。真实世界的函数式则更依赖参数化,会将函数副作用(Side Effect)上抛,尽量脱离开发者编写的业务逻辑层,在框架内部进行处理,且有结构依赖。该模式具有确定性、健壮性(易维护易测试)以及天然支持并行化等优势,但开发效率较低,实际的业务逻辑很难直接转成函数式开发,且在部分场景下性能表现较差。
函数式编程
2.4►►并发模型特点
常见的并发模型主要分为两类,一类仅基于共享内存,另一类则基于消息通信。基于共享内存的并发模型(线程与锁),具有适用范围广、接近硬件工作方式的本质和正确使用时效率很高的优势,但不可避免地存在测试及维护困难等问题,目前该模式已经逐渐被应用开发领域摒弃;基于消息通信的并发模型(Actor、函数式编程),具有容错性好、特定场景性能表现很好且易于维护和测试的优势,但也存在应用场景有限、不适合细粒度并行等短板。
03►移动应用框架并发
3.1►►Dart 语言
Dart 是一门新的编程语言,如同 JAVA、PHP 一样,是为了解决编写应用程序中的一些实际问题而被 Google 发明的,其早期主要是为了能够在 Web 领域替换 JavaScript(后文简称 JS),后来 Google 内部用 Dart 编写孵化了一个移动开发框架 Sky,之后又被命名为 Flutter,在移动跨平台开发领域大放异彩。Dart 的并发目标主要为了赋能框架支持任务并行化,解决开发者的并发任务和多线程开发需求。其仅共享不可变对象,而可变对象不共享,且提供了单线程并发(异步)和多线程并发(Isolate Spawn /Compute)的并发 API。
Dart 并发架构
3.2►►Swift
Swift 是苹果公司于 2014 年 WWDC 苹果开发者大会发布的新开发语言,可与 Objective-C 共同运行于 macOS 和 iOS 平台,用于搭建基于苹果平台的应用程序。在 2022 年的 Swift 5.5 版本中,发布了并发 API 的说明,其并发目标主要为了减少应用开发者从想法到实现必须花费的时间,使体验远远优于现有方案(队列不可知、可维护性差且安全性低)。Swift 的并发理念是,共享可变状态不利于开发者,也不利于硬件,且无法突破单进程。因此,Swift 希望能够提供无损化的易用的 API,在设计、可维护性、安全性、可伸缩性以及性能等方面持续改进。目前,Swift 已提供的 API 有 async/await、Task & TaskGroup、Actor 等。
3.3►►流行移动操作系统并发模型趋势
在移动应用开发领域中,迭代和更新频繁,开发效率是一个关键因素,而锁对于应用开发者过于底层,很难用好,难以调试,属于高级用法。出于提供易用、简单、高效的并发模型考虑,业界目前给应用开发者提供的多线程模型,有避免数据竞争、实现无锁化的趋势。例如,在 Web 上,JS 在多线程使用的是消息通信机制(内存隔离,增加可转移 Builtin 对象支持);在 Flutter 上,Dart 在多线程使用的是消息通信机制 (内存隔离);在 Android 上,Kotlin 原生先后提出过 Worker API、不可变共享、对象转移冻结等方案替换共享多线程方案(用户不使用锁);在 IOS 上,Swift 5.5 实现了结构化编程和 Actor,Swift 整体并发的演进思路是默认安全的编程模型。
04►OpenHarmony 高级语言的并发探索
在 JS 世界的并发中,如前文所提到的 JS 并发架构—Actor 模型,具有无锁、容易维护和测试、容错性好以及分布式编程等优势,但启动较慢,并发的实例开销大。对于 JS 并发 API—Worker 来说,由于其每一个并发实例之间不共享,开发者需要封装和解析消息命令,关心 Worker 实例的生命周期,在高负载和低负载时也需要精确调节 Worker 数量。
基于上述问题,OpenHarmony 上实现了轻量化并发实例——Lite Actor。该功能支持不可变对象共享,对基础架构进行了轻量化处理,大幅提升了启动时间,且优化了启动内存。
ArkCompiler 并发实例运行
OpenHarmony 也提供了 TaskPool。TaskPool 是一个更易用的并发任务 API,能够使开发者易于开发并发任务,减少代码编写量,让其无需关心并发实例的生命周期和场景下并发任务的负载轻重。此外,TaskPool 还能够统一任务负载的资源管理,降低了系统的资源消耗,提升了系统的整体性能。在如图所示的 TaskPool 架构中,通过 Task Dispatch Manager 实现优先级调度、负载均衡以及系统的统一管理等功能,通过 Task Worker Threads 实现自适应性和可伸缩性。
TaskPool 统一任务池设计架构
在高级语言并发的发展中,业界更倾向于给开发者提供更易用、更好用以及更高效的并发 API。OpenHarmony 提供的并发 API 目前介于 Dart 和 Swift 之间,汲取两者的长处,并对其现存问题进行持续的优化和改进。此外,OpenHarmony 正在考虑引入准静态对象,实现真正共享。
05►总结
在 OpenHarmony 并发模型上,后续将对并发实例进一步轻量化,探索共享对象的无锁并发。此外,在 OpenHarmony 并发调度上,也将针对现存的系统中线程泛滥问题,从时间和空间两个维度设计相关方案进行优化和改进,并将开发一套统一的并行框架,在运行时根据任务依赖状态和可执行资源自动并发调度和执行任务。
欢迎大家持续关注 OpenHarmony 并发研究工作,也期待与社区的开发者们共建 OpenHarmony 的并发能力。