一、多线程并发概述
1、简介
并发模型是用来实现不同应用场景中并发任务的编程模型,常见的并发模型分为基于内存共享的并发模型和基于消息通信的并发模型。
Actor 并发模型作为基于消息通信并发模型的典型代表,不需要开发者去面对锁带来的一系列复杂偶发的问题,同时并发度也相对较高,因此得到了广泛的支持和使用,也是当前 ArkTS 语言选择的并发模型。
由于 Actor 模型的内存隔离特性,所以需要进行跨线程的数据序列化传输。
2、数据传输对象
目前支持传输的数据对象可以分为普通对象、可转移对象、可共享对象、Native绑定对象四种。
● 普通对象
普通对象传输采用标准的结构化克隆算法(Structured Clone)进行序列化,此算法可以通过递归的方式拷贝传输对象,相较于其他序列化的算法,支持的对象类型更加丰富。
序列化支持的类型包括:除 Symbol 之外的基础类型、Date、String、RegExp、Array、Map、Set、Object(仅限简单对象,比如通过“{}”或者“new Object”创建,普通对象仅支持传递属性,不支持传递其原型及方法)、ArrayBuffer、TypedArray。
● 可转移对象
可转移对象(Transferable object)传输采用地址转移进行序列化,不需要内容拷贝,会将 ArrayBuffer 的所有权转移给接收该 ArrayBuffer 的线程,转移后该 ArrayBuffer 在发送它的线程中变为不可用,不允许再访问。
// 定义可转移对象
let buffer = new ArrayBuffer(100);
● 可共享对象
共享对象 SharedArrayBuffer,拥有固定长度,可以存储任何类型的数据,包括数字、字符串等。
共享对象传输指 SharedArrayBuffer 支持在多线程之间传递,传递之后的 SharedArrayBuffer 对象和原始的 SharedArrayBuffer 对象可以指向同一块内存,进而达到内存共享的目的。
SharedArrayBuffer 对象存储的数据在同时被修改时,需要通过原子操作保证其同步性,即下个操作开始之前务必需要等到上个操作已经结束。
// 定义可共享对象,可以使用Atomics进行操作
let sharedBuffer = new SharedArrayBuffer(1024);
● Native 绑定对象
Native 绑定对象(Native Binding Object)是系统所提供的对象,该对象与底层系统功能进行绑定,提供直接访问底层系统功能的能力。
当前支持序列化传输的 Native 绑定对象主要包含:Context和RemoteObject。
Context 对象包含应用程序组件的上下文信息,它提供了一种访问系统服务和资源的方式,使得应用程序组件可以与系统进行交互。获取 Context 信息的方法可以参考获取上下文信息。
RemoteObject 对象的主要作用是实现远程通信的功能,它允许在不同的进程间传递对象的引用,使得不同进程之间可以共享对象的状态和方法,服务提供者必须继承此类,RemoteObject 对象的创建可以参考RemoteObject的实现。
3、TaskPool 和 WorkerArkTS
提供了 TaskPool 和 Worker 两种并发能力供开发者选择,其具体的实现特点和各自的适用场景存在差异,详细请参见TaskPool和Worker的对比。
二、TaskPool 和 Worker 的对比
TaskPool(任务池)和 Worker 的作用是为应用程序提供一个多线程的运行环境,用于处理耗时的计算任务或其他密集型任务。可以有效地避免这些任务阻塞主线程,从而最大化系统的利用率,降低整体资源消耗,并提高系统的整体性能。
本文将从实现特点和适用场景两个方面来进行 TaskPool 与 Worker 的比较,同时提供了各自运作机制和注意事项的相关说明。
1. 实现特点对比表
表1 TaskPool 和 Worker 的实现特点对比
2. 适用场景对比
TaskPool 和 Worker 均支持多线程并发能力。TaskPool 偏向独立任务(线程级)维度;而 Worker 偏向线程的维度,支持长时间占据线程执行。
常见的一些开发场景及适用具体说明如下:
● 有关联的一系列同步任务。例如某数据库操作时,要用创建的句柄操作,包含增、删、改、查多个任务,要保证同一个句柄,需要使用 Worker。
● 需要频繁取消的任务。例如图库大图浏览场景,为提升体验,会同时缓存当前图片左右侧各 2 张图片,往一侧滑动跳到下一张图片时,要取消另一侧的一个缓存任务,需要使用 TaskPool。
● 大量或者调度点较分散的任务。例如大型应用的多个模块包含多个耗时任务,不方便使用 8 个 Worker 去做负载管理,推荐采用 TaskPool。
3. TaskPool 运作机制
图 1 TaskPool 运作机制示意图
TaskPool 支持开发者在主线程封装任务抛给任务队列,系统选择合适的工作线程,进行任务的分发及执行,再将结果返回给主线程。接口直观易用,支持任务的执行、取消。工作线程数量上限为 4。
4. Worker 运作机制
图 2 Worker 运作机制示意图
创建 Worker 的线程称为宿主线程(不一定是主线程,工作线程也支持创建 Worker 子线程),Worker 自身的线程称为 Worker 子线程(或 Actor 线程、工作线程)。每个 Worker 子线程与宿主线程拥有独立的实例,包含基础设施、对象、代码段等。Worker 子线程和宿主线程之间的通信是基于消息传递的,Worker 通过序列化机制与宿主线程之间相互通信,完成命令及数据交互。
5. TaskPool 注意事项
● 实现任务的函数需要使用装饰器 @Concurrent 标注,且仅支持在.ets 文件中使用。
● 实现任务的函数只支持普通函数或者 async 函数,不支持类成员函数或者匿名函数。
● 实现任务的函数仅支持在 Stage 模型的工程中使用 import 的变量和入参变量,否则只能使用入参变量。
● 实现任务的函数入参需满足序列化支持的类型,详情请参见普通对象传输。
● 由于不同线程中上下文对象是不同的,因此 TaskPool 工作线程只能使用线程安全的库,例如 UI 相关的非线程安全库不能使用。
● 序列化传输的数据量大小限制为 16MB。
6. Worker 注意事项
● 创建 Worker 时,传入的 Worker.ts 路径在不同版本有不同的规则,详情请参见文件路径注意事项。
● Worker 创建后需要手动管理生命周期,且最多同时运行的 Worker 子线程数量为 8 个,详情请参见生命周期注意事项。
● Ability类型的 Module 支持使用 Worker,Library类型的 Module 不支持使用 Worker。
● 创建 Worker 不支持使用其他 Module 的 Worker.ts 文件,即不支持跨模块调用 Worker。
● 由于不同线程中上下文对象是不同的,因此 Worker 线程只能使用线程安全的库,例如 UI 相关的非线程安全库不能使用。
● 序列化传输的数据量大小限制为 16MB。
文件路径注意事项
当使用 Worker 模块具体功能时,均需先构造 Worker 实例对象,其构造函数与 API 版本相关。
// API 9及之后版本使用:
const worker1 = new worker.ThreadWorker(scriptURL);
// API 8及之前版本使用:
const worker1 = new worker.Worker(scriptURL);
构造函数需要传入 Worker 的路径(scriptURL),Worker 文件存放位置默认路径为 Worker 文件所在目录与 pages 目录属于同级。
Stage 模型
构造函数中的 scriptURL 示例如下:/
// 写法一
// Stage模型-目录同级(entry模块下,workers目录与pages目录同级)
const worker1 = new worker.ThreadWorker('entry/ets/workers/MyWorker.ts', {name:"first worker in Stage model"});
// Stage模型-目录不同级(entry模块下,workers目录是pages目录的子目录)
const worker2 = new worker.ThreadWorker('entry/ets/pages/workers/MyWorker.ts');
// 写法二
// Stage模型-目录同级(entry模块下,workers目录与pages目录同级),假设bundlename是com.example.workerdemo
const worker3 = new worker.ThreadWorker('@bundle:com.example.workerdemo/entry/ets/workers/worker');
// Stage模型-目录不同级(entry模块下,workers目录是pages目录的子目录),假设bundlename是com.example.workerdemo
const worker4 = new worker.ThreadWorker('@bundle:com.example.workerdemo/entry/ets/pages/workers/worker');
● 基于 Stage 模型工程目录结构,写法一的路径含义:
○ entry:module.json5 文件中 module 的 name 属性对应值。
○ ets:用于存放 ets 源码,固定目录。
○ workers/MyWorker.ts:worker 源文件在 ets 目录下的路径。
● 基于 Stage 模型工程目录结构,写法二的路径含义:
○ @bundle:固定标签。
○ bundlename:当前应用包名。
○ entryname:module.json5 文件中 module 的 name 属性对应值。
○ ets:用于存放 ets 源码,固定目录。
○ workerdir/workerfile:worker 源文件在 ets 目录下的路径,可不带文件后缀名。
FA 模型
构造函数中的 scriptURL 示例如下:
// FA模型-目录同级(entry模块下,workers目录与pages目录同级)
const worker1 = new worker.ThreadWorker('workers/worker.js', {name:'first worker in FA model'});
// FA模型-目录不同级(entry模块下,workers目录与pages目录的父目录同级)
const worker2 = new worker.ThreadWorker('../workers/worker.js');
生命周期注意事项
● Worker 的创建和销毁耗费性能,建议开发者合理管理已创建的 Worker 并重复使用。Worker 空闲时也会一直运行,因此当不需要 Worker 时,可以调用terminate()接口或parentPort.close()方法主动销毁 Worker。若 Worker 处于已销毁或正在销毁等非运行状态时,调用其功能接口,会抛出相应的错误。
● Worker 存在数量限制,支持最多同时存在 8 个 Worker。
○ 在 API version 8 及之前的版本,当 Worker 数量超出限制时,会抛出“Too many workers, the number of workers exceeds the maximum.”错误。
○ 从 API version 9 开始,当 Worker 数量超出限制时,会抛出“Worker initialization failure, the number of workers exceeds the maximum.”错误。