在 iOS Objective-C 开发中,可变数组或字典 NSMutableArray/NSMutableDictionary 不是线程安全的,即在两个或以上线程对内部元素同时进行写入、读取、新增、删除等操作时,会出现异常或者超出预期的结果(result is unexpected),而不可变数组 NSArray/NSDictionary 因其不可变性可以在多线程下进行读取。要满足多线程下数组操作的需求,常用的解决方案是对可变数组进行封装并提供与可变数组同等的 API 方便访问,下面以可变数组为线索进行讨论,可变字典的性质是相同道理。
YYKit 中 YYThreadSafeArray 的实现
在 YYKit/Utility 中实现了线程安全的可变数组/字典,其实现的思路是:
① 将 NSMutableArray 对象作为成员封装为一个新的类 YYThreadSafeArray
② 持有一个信号量对象作为数组操作的加锁控制
@implementation YYThreadSafeArray {
NSMutableArray *_arr; //Subclass a class cluster...
dispatch_semaphore_t _lock;
}
③ 初始化时构造内部成员数组和信号量对象(使用宏定义实现)
// 通过宏定义实现带入外部代码实现初始化方法
#define INIT(...) self = super.init; \
if (!self) return nil; \
__VA_ARGS__; \
if (!_arr) return nil; \
_lock = dispatch_semaphore_create(1); \
return self;
- (instancetype)init {
INIT(_arr = [[NSMutableArray alloc] init]);
}
④ 在进行修改和读取等操作时进行加锁(使用宏定义实现)
// 通过宏定义对代码块进行加锁操作
#define LOCK(...) dispatch_semaphore_wait(_lock, DISPATCH_TIME_FOREVER); \
__VA_ARGS__; \
dispatch_semaphore_signal(_lock);
// id obj = array[idx];
- (id)objectAtIndexedSubscript:(NSUInteger)idx {
LOCK(id o = [_arr objectAtIndexedSubscript:idx]); return o;
}
// array[idx] = obj;
- (void)setObject:(id)obj atIndexedSubscript:(NSUInteger)idx {
LOCK([_arr setObject:obj atIndexedSubscript:idx]);
}
关于信号量
dispatch_semaphore_t
是为了控制资源的访问频率使用,在 YYKit 的INIT
宏定义实现中使用的信号量初始值为 1,在加锁操作前等待信号量,使用dispatch_semaphore_wait
当信号量大于等于 1 时,减去 1 点信号值并开始执行后面的代码,此时信号值为 0,其他线程访问时没有信号值会一直等待,直到此任务完成后dispatch_semaphore_signal
函数会将信号值加 1,其他线程的访问得以继续,从而实现信号量加锁的目的。
由于读写操作都使用了同一个信号量进行控制,可以得知此方案对可变数组的多线程操作是串行的,可以保证可变数组在多线程下访问的安全,即所有对数组的读写操作都将是依次逐个进行,潜在的问题是:限制了数组的多线程读取操作。
可并行读取的线程安全数组
多线程写入和读取的加锁操作是必要的,如何在此基础上实现多线程并行读取操作?为此可以将数组的操作区分为写操作、读操作,需要满足以下要求:
① 在写入时,不能有其他读写操作
② 可以并行读取
这些要求恰好可以使用 Dispatch Concurrent Queue + dispatch_async_barrier
加以实现,在同样的封装可变数组为成员变量的思路之后:
① 在初始化时,构造一个并行队列
@implementation ThreadSafeArray {
NSMutableArray *_arr;
dispatch_queue_t _queue;
}
- (instancetype)init {
....
_queue = dispatch_queue_create("unique name", DISPATCH_QUEUE_CONCURRENT);
...
}
② 对写操作进行并发限制
使用 dispatch_barrier_async/dispatch_barrier_sync 函数,确保两点:一是在执行此任务之前队列中其他任务已经完成,二是此任务完成之前队列中新增的任务不会执行,达到 barrier 的目标。
- (void)setObject:(id)obj atIndexedSubscript:(NSUInteger)idx {
dispatch_barrier_async(_queue, ^{
[_arr setObject:obj atIndexedSubscript:idx];
});
}
③ 支持并发读取,使用 dispatch_sync 函数是将读取对象的操作加入到 queue 中,同步 dispatch 任务可以阻塞当前线程直到任务完成后成功获取到对象,而因为上述 barrier 机制的存在如果有写入操作则要等到写入操作完成后才能执行,单纯的读取操作可以在 queue 中并行,不会 barrier 队列。
PS:使用 __block id o 修饰是为了在 block 内修改 block 外的局部变量。
- (id)objectAtIndexedSubscript:(NSUInteger)idx {
__block id o;
dispatch_sync(_queue, ^{
o = [_arr objectAtIndexedSubscript:idx]
});
return o;
}
Update 2020/01/22
对于读写的控制,可以使用 pthread_lock_rw 即读写锁,在使用上语义更加清晰。后续会补上这部分的代码。
参考资料
Apple Document - Thread Safe Summary
StackOverFlow - avoid-this-dangling-pointer-with-arc
StackOverFlow - whats-the-difference-between-the-atomic-and-nonatomic-attributes
加我微信沟通。