[iOS][OC] 线程安全的可变数组、可变字典

在 iOS Objective-C 开发中,可变数组或字典 NSMutableArray/NSMutableDictionary 不是线程安全的,即在两个或以上线程对内部元素同时进行写入、读取、新增、删除等操作时,会出现异常或者超出预期的结果(result is unexpected),而不可变数组 NSArray/NSDictionary 因其不可变性可以在多线程下进行读取。要满足多线程下数组操作的需求,常用的解决方案是对可变数组进行封装并提供与可变数组同等的 API 方便访问,下面以可变数组为线索进行讨论,可变字典的性质是相同道理。

YYKit 中 YYThreadSafeArray 的实现

在 YYKit/Utility 中实现了线程安全的可变数组/字典,其实现的思路是:
① 将 NSMutableArray 对象作为成员封装为一个新的类 YYThreadSafeArray
② 持有一个信号量对象作为数组操作的加锁控制

@implementation YYThreadSafeArray {
    NSMutableArray *_arr;  //Subclass a class cluster...
    dispatch_semaphore_t _lock;
}

③ 初始化时构造内部成员数组和信号量对象(使用宏定义实现)

// 通过宏定义实现带入外部代码实现初始化方法
#define INIT(...) self = super.init; \
if (!self) return nil; \
__VA_ARGS__; \
if (!_arr) return nil; \
_lock = dispatch_semaphore_create(1); \
return self;
- (instancetype)init {
    INIT(_arr = [[NSMutableArray alloc] init]);
}

④ 在进行修改和读取等操作时进行加锁(使用宏定义实现)

// 通过宏定义对代码块进行加锁操作
#define LOCK(...) dispatch_semaphore_wait(_lock, DISPATCH_TIME_FOREVER); \
__VA_ARGS__; \
dispatch_semaphore_signal(_lock);

// id obj = array[idx];
- (id)objectAtIndexedSubscript:(NSUInteger)idx {
    LOCK(id o = [_arr objectAtIndexedSubscript:idx]); return o;
}
// array[idx] = obj;
- (void)setObject:(id)obj atIndexedSubscript:(NSUInteger)idx {
    LOCK([_arr setObject:obj atIndexedSubscript:idx]);
}

关于信号量 dispatch_semaphore_t 是为了控制资源的访问频率使用,在 YYKit 的 INIT 宏定义实现中使用的信号量初始值为 1,在加锁操作前等待信号量,使用 dispatch_semaphore_wait 当信号量大于等于 1 时,减去 1 点信号值并开始执行后面的代码,此时信号值为 0,其他线程访问时没有信号值会一直等待,直到此任务完成后 dispatch_semaphore_signal 函数会将信号值加 1,其他线程的访问得以继续,从而实现信号量加锁的目的。

由于读写操作都使用了同一个信号量进行控制,可以得知此方案对可变数组的多线程操作是串行的,可以保证可变数组在多线程下访问的安全,即所有对数组的读写操作都将是依次逐个进行,潜在的问题是:限制了数组的多线程读取操作。

可并行读取的线程安全数组

多线程写入和读取的加锁操作是必要的,如何在此基础上实现多线程并行读取操作?为此可以将数组的操作区分为写操作、读操作,需要满足以下要求:
① 在写入时,不能有其他读写操作
② 可以并行读取
这些要求恰好可以使用 Dispatch Concurrent Queue + dispatch_async_barrier 加以实现,在同样的封装可变数组为成员变量的思路之后:
① 在初始化时,构造一个并行队列

@implementation ThreadSafeArray {
    NSMutableArray *_arr; 
    dispatch_queue_t _queue;
}

- (instancetype)init {
    ....
    _queue = dispatch_queue_create("unique name", DISPATCH_QUEUE_CONCURRENT);
    ...
}

② 对写操作进行并发限制
使用 dispatch_barrier_async/dispatch_barrier_sync 函数,确保两点:一是在执行此任务之前队列中其他任务已经完成,二是此任务完成之前队列中新增的任务不会执行,达到 barrier 的目标。

- (void)setObject:(id)obj atIndexedSubscript:(NSUInteger)idx {
    dispatch_barrier_async(_queue, ^{
        [_arr setObject:obj atIndexedSubscript:idx];
    });
}

③ 支持并发读取,使用 dispatch_sync 函数是将读取对象的操作加入到 queue 中,同步 dispatch 任务可以阻塞当前线程直到任务完成后成功获取到对象,而因为上述 barrier 机制的存在如果有写入操作则要等到写入操作完成后才能执行,单纯的读取操作可以在 queue 中并行,不会 barrier 队列。
PS:使用 __block id o 修饰是为了在 block 内修改 block 外的局部变量。

- (id)objectAtIndexedSubscript:(NSUInteger)idx {
    __block id o;
    dispatch_sync(_queue, ^{
        o = [_arr objectAtIndexedSubscript:idx]
    });
    return o;
}

Update 2020/01/22

对于读写的控制,可以使用 pthread_lock_rw 即读写锁,在使用上语义更加清晰。后续会补上这部分的代码。

参考资料

Apple Document - Thread Safe Summary
StackOverFlow - avoid-this-dangling-pointer-with-arc
StackOverFlow - whats-the-difference-between-the-atomic-and-nonatomic-attributes

加我微信沟通。


你可能感兴趣的:([iOS][OC] 线程安全的可变数组、可变字典)