前言
最近有时间把ios的基础知识整理一下,浅谈一下对ios内存管理机制的理解,以前也只是会用,知其然但不知其所以然。本文的ARC专指ObjectiveC的ARC,不会设计到其他语言的内存管理,在此需要有一点的ios的内存管理机制的理解。
什么是ARC?
ARC的全称是Auto Reference Counting也就是自动引用计数。
Objective C的引用计数理解起来很容易,当一个对象被持有的时候计数加一,不再被持有的时候引用计数减一,当引用计数为零的时候,说明这个对象已经无用了,则将其释放。
引用计数分为两种:
- 手动引用计数(MRC)
- 自动引用计数(ARC)
内存管理的思考方式:
- 自己生成的对象,自己持有
- 非自己生成的对象,自己也能持有
- 不再需要自己持有对象时释放
- 非自己持有的对象无法释放
(1) 自己生成的对象,自己持有
在iOS内存管理中有四个关键字,alloc、new、copy、mutableCopy,自身使用这些关键字产生对象,那么自身就持有了对象
// 使用了alloc分配了内存,obj指向了对象,该对象本身引用计数为1,不需要retain
id obj = [[NSObject alloc] init];
// 使用了new分配了内存,objc指向了对象,该对象本身引用计数为1,不需要retain
id obj = [NSObject new];
(2) 非自己生成的对象,自己也能持有
// NSMutableArray通过类方法array产生了对象(并没有使用alloc、new、copy、mutableCopt来产生对象),因此该对象不属于obj自身产生的
// 因此,需要使用retain方法让对象计数器+1,从而obj可以持有该对象(尽管该对象不是他产生的)
id obj = [NSMutableArray array];
[obj retain];
(3) 不再需要自己持有对象时释放
id obj = [NSMutableArray array];
[obj retain];
// 当obj不在需要持有的对象,那么,obj应该发送release消息
[obj release];
(4) 无法释放非自己持有的对象
// 1. 释放一个已经释放的对象
id obj = [[NSObject alloc] init];
// 已经释放对象
[obj release];
// 释放了对象还进行释放
[obj release]; //
//2. 释放一个不属于自己的对象
id obj1 = [obj object];
// obj1没有进行retain操作而进行release操作,使得obj持有对象释放,造成了野指针错误
[obj1 release];
如上为iOS进行内存管理的四种思考方式(记住不论是ARC还是MRC都遵循该思考方式,只是ARC时代这些工作让编译器做了)
上述是我很好理解ios内存管理的的方法,在此我们做一下小的对比
在iOS开发早期,编写代码是采用MRC的
// MRC代码
NSObject * obj = [[NSObject alloc] init]; //引用计数为1
//不需要的时候
[obj release] //引用计数减1
//持有这个对象
[obj retain] //引用计数加1
//放到AutoReleasePool
[obj autorelease]//在auto release pool释放的时候,引用计数减1
虽说这种方式提供了面向对象的内存管理接口,但是开发者不得不花大量的时间在内存管理上,并且容易出现内存泄漏或者release一个已被提前释放的对象,导致crash。
再后来,Apple对ios/Mac OS开发引入了ARC。使用ARC,开发者不再需要手动的retain/release/autorelease. 编译器会自动插入对应的代码,再结合Objective C的runtime,实现自动引用计数。
比如如下ARC代码:
NSObject * obj;
{
obj = [[NSObject alloc] init]; //引用计数为1
}
NSLog(@"%@",obj);
等同于如下MRC代码
NSObject * obj;
{
obj = [[NSObject alloc] init]; //引用计数为1
[obj relrease]
}
NSLog(@"%@",obj);
在Objective C中,有三种类型是ARC适用的:
- block
- objective 对象,id, Class, NSError*等
- 由attribute((NSObject))标记的类型。
- 像double *,CFStringRef等不是ARC适用的,仍然需要手动管理内存。
- 以CF开头的(Core Foundation)的对象往往需要手动管理内存。
属性所有权
我们在看看ARC中常见的所有权关键字,
- assign对应关键字__unsafe_unretained, 顾名思义,就是指向的对象被释放的时候,仍然指向之前的地址,容易引起野指针。
- copy对应关键字__strong,只不过在赋值的时候,调用copy方法。
- retain对应__strong
- strong对应__strong
- unsafe_unretained对应__unsafe_unretained
- weak对应__weak。
其中,__weak和__strong是本文要讲解的核心内容。
ARC的内部实现
ARC背后的引用计数主要依赖于这三个方法:
- retain 增加引用计数
- release 降低引用计数,引用计数为0的时候,释放对象。
- autorelease 在当前的auto release pool结束后,降低引用计数。
在Cocoa Touch中,NSObject协议中定义了这三个方法,由于Cocoa Touch中,绝大部分类都继承自NSObject(NSObject类本身实现了NSObject协议),所以可以“免费”获得NSObject提供的运行时和ARC管理方法,这就是为什么适用OC开发iOS的时候,你的类要继承自NSObject。
既然ARC是引用计数,那么对应一个对象,内存中必然会有一个地方来存储这个对象的引用计数。iOS的Runtime是开源的,如果你有兴趣可以下载全部的代码,我们通过源代码一探究竟。
我们从retain入手
- (id)retain {
return ((id)self)->rootRetain();
}
inline id objc_object::rootRetain()
{
if (isTaggedPointer()) return (id)this;
return sidetable_retain();
}
所以说,本质上retain就是调用sidetable_retain,再看看sitetable_retain的实现:
id objc_object::sidetable_retain()
{
//获取table
SideTable& table = SideTables()[this];
//加锁
table.lock();
//获取引用计数
size_t& refcntStorage = table.refcnts[this];
if (! (refcntStorage & SIDE_TABLE_RC_PINNED)) {
//增加引用计数
refcntStorage += SIDE_TABLE_RC_ONE;
}
//解锁
table.unlock();
return (id)this;
}
到这里,retain如何实现就很清楚了,通过SideTable这个数据结构来存储引用计数。我们看看这个数据结构的实现:
typedef objc::DenseMap,size_t,true> RefcountMap;
struct SideTable {
spinlock_t slock;
RefcountMap refcnts;
weak_table_t weak_table;
//省略其他实现...
};
可以看到,这个数据结构就是存储了一个自旋锁,一个引用计数map。这个引用计数的map以对象的地址作为key,引用计数作为value。到这里,引用计数的底层实现我们就很清楚了.
存在全局的map,这个map以地址作为key,引用计数的值作为value
再来看看release的实现:
SideTable& table = SideTables()[this];
bool do_dealloc = false;
table.lock();
//找到对应地址的
RefcountMap::iterator it = table.refcnts.find(this);
if (it == table.refcnts.end()) { //找不到的话,执行dellloc
do_dealloc = true;
table.refcnts[this] = SIDE_TABLE_DEALLOCATING;
} else if (it->second < SIDE_TABLE_DEALLOCATING) {//引用计数小于阈值,dealloc
do_dealloc = true;
it->second |= SIDE_TABLE_DEALLOCATING;
} else if (! (it->second & SIDE_TABLE_RC_PINNED)) {
//引用计数减去1
it->second -= SIDE_TABLE_RC_ONE;
}
table.unlock();
if (do_dealloc && performDealloc) {
//执行dealloc
((void(*)(objc_object *, SEL))objc_msgSend)(this, SEL_dealloc);
}
return do_dealloc;
release的到这里也比较清楚了:查找map,对引用计数减1,如果引用计数小于阈值,则调用SEL_dealloc
Autorelease pool
上文提到了,autorelease方法的作用是把对象放到autorelease pool中,到pool drain的时候,会释放池中的对象。举个例子
__weak NSObject * obj;
NSObject * temp = [[NSObject alloc] init];
obj = temp;
NSLog(@"%@",obj); //非空
放到auto release pool中,
__weak NSObject * obj;
@autoreleasepool {
NSObject * temp = [[NSObject alloc] init];
obj = temp;
}
NSLog(@"%@",obj); //null
可以看到,放到自动释放池的对象是在超出自动释放池作用域后立即释放的。事实上在iOS 程序启动之后,主线程会启动一个Runloop,这个Runloop在每一次循环是被自动释放池包裹的,在合适的时候对池子进行清空。
对于Cocoa框架来说,提供了两种方式来把对象显式的放入AutoReleasePool.
- NSAutoreleasePool(只能在MRC下使用)
- @autoreleasepool {}代码块(ARC和MRC下均可以使用)
那么AutoRelease pool又是如何实现的呢?
我们先从autorelease方法源码入手
//autorelease方法
- (id)autorelease {
return ((id)self)->rootAutorelease();
}
//rootAutorelease 方法
inline id objc_object::rootAutorelease()
{
if (isTaggedPointer()) return (id)this;
//检查是否可以优化
if (prepareOptimizedReturn(ReturnAtPlus1)) return (id)this;
//放到auto release pool中。
return rootAutorelease2();
}
// rootAutorelease2
id objc_object::rootAutorelease2()
{
assert(!isTaggedPointer());
return AutoreleasePoolPage::autorelease((id)this);
}
可以看到,把一个对象放到auto release pool中,是调用了AutoreleasePoolPage::autorelease这个方法。
我们继续查看对应的实现:
public: static inline id autorelease(id obj)
{
assert(obj);
assert(!obj->isTaggedPointer());
id *dest __unused = autoreleaseFast(obj);
assert(!dest || dest == EMPTY_POOL_PLACEHOLDER || *dest == obj);
return obj;
}
static inline id *autoreleaseFast(id obj)
{
AutoreleasePoolPage *page = hotPage();
if (page && !page->full()) {
return page->add(obj);
} else if (page) {
return autoreleaseFullPage(obj, page);
} else {
return autoreleaseNoPage(obj);
}
}
id *add(id obj)
{
assert(!full());
unprotect();
id *ret = next; // faster than `return next-1` because of aliasing
*next++ = obj;
protect();
return ret;
}
到这里,autorelease方法的实现就比较清楚了,
autorelease方法会把对象存储到AutoreleasePoolPage的链表里。等到auto release pool被释放的时候,把链表内存储的对象删除。所以,AutoreleasePoolPage就是自动释放池的内部实现。
__weak与__strong
用过block的同学一定写过类似的代码:
__weak typeSelf(self) weakSelf = self;
[object fetchSomeFromRemote:^{
__strong typeSelf(weakSelf) strongSelf = weakSelf;
//从这里开始用strongSelf
}];
那么,为什么要这么用呢?原因是:
- block会捕获外部变量,用weakSelf保证self不会被block被捕获,防止引起循环引用或者不必要的额外生命周期。
- 用strongSelf则保证在block的执行过程中,对象不会被释放掉。
首先__strong和__weak都是关键字,是给编译器理解的。为了理解其原理,我们需要查看它们编译后的代码,使用XCode,我们可以容易的获得一个文件的汇编代码。
比如,对于Test.m文件,当源代码如下时:
#import "Test.h"
@implementation Test
- (void)testFunction{
{
__strong NSObject * temp = [[NSObject alloc] init];
}
}
@end
转换后的汇编代码如下:
.loc 2 15 37 prologue_end ; /Users/hl/Desktop/OCTest/OCTest/Test.m:15:37
ldr x9, [x9]
ldr x1, [x8]
mov x0, x9
bl _objc_msgSend
adrp x8, L_OBJC_SELECTOR_REFERENCES_.2@PAGE
add x8, x8, L_OBJC_SELECTOR_REFERENCES_.2@PAGEOFF
.loc 2 15 36 is_stmt 0 ; /Users/hl/Desktop/OCTest/OCTest/Test.m:15:36
ldr x1, [x8]
.loc 2 15 36 discriminator 1 ; /Users/hl/Desktop/OCTest/OCTest/Test.m:15:36
bl _objc_msgSend
mov x8, #0
add x9, sp, #8 ; =8
.loc 2 15 29 ; /Users/hl/Desktop/OCTest/OCTest/Test.m:15:29
str x0, [sp, #8]
Ltmp4:
.loc 2 16 5 is_stmt 1 ; /Users/hl/Desktop/OCTest/OCTest/Test.m:16:5
mov x0, x9
mov x1, x8
bl _objc_storeStrong
.loc 2 17 1 ; /Users/hl/Desktop/OCTest/OCTest/Test.m:17:1
ldp x29, x30, [sp, #32] ; 8-byte Folded Reload
add sp, sp, #48 ; =48
ret
Ltmp5:
即使我们不懂汇编,也能很轻易的获取到调用顺序如下
_objc_msgSend // alloc
_objc_msgSend // init
_objc_storeStrong // 强引用
在结合Runtime的源码,我们看看最关键的objc_storeStrong的实现
void objc_storeStrong(id *location, id obj)
{
id prev = *location;
if (obj == prev) {
return;
}
objc_retain(obj);
*location = obj;
objc_release(prev);
}
id objc_retain(id obj) { return [obj retain]; }
void objc_release(id obj) { [obj release]; }
我们再来看看__weak. 将Test.m修改成为如下代码,同样我们分析其汇编实现
.loc 2 15 35 prologue_end ; /Users/hl/Desktop/OCTest/OCTest/Test.m:15:35
ldr x9, [x9]
ldr x1, [x8]
mov x0, x9
bl _objc_msgSend
adrp x8, L_OBJC_SELECTOR_REFERENCES_.2@PAGE
add x8, x8, L_OBJC_SELECTOR_REFERENCES_.2@PAGEOFF
.loc 2 15 34 is_stmt 0 ; /Users/hl/Desktop/OCTest/OCTest/Test.m:15:34
ldr x1, [x8]
.loc 2 15 34 discriminator 1 ; /Users/hl/Desktop/OCTest/OCTest/Test.m:15:34
bl _objc_msgSend
add x8, sp, #24 ; =24
.loc 2 15 27 ; /Users/hl/Desktop/OCTest/OCTest/Test.m:15:27
mov x1, x0
.loc 2 15 27 discriminator 2 ; /Users/hl/Desktop/OCTest/OCTest/Test.m:15:27
str x0, [sp, #16] ; 8-byte Folded Spill
mov x0, x8
bl _objc_initWeak
.loc 2 15 27 ; /Users/hl/Desktop/OCTest/OCTest/Test.m:15:27
ldr x1, [sp, #16] ; 8-byte Folded Reload
.loc 2 15 27 discriminator 3 ; /Users/hl/Desktop/OCTest/OCTest/Test.m:15:27
str x0, [sp, #8] ; 8-byte Folded Spill
mov x0, x1
bl _objc_release
add x8, sp, #24
Ltmp4:
.loc 2 16 5 is_stmt 1 ; /Users/hl/Desktop/OCTest/OCTest/Test.m:16:5
mov x0, x8
bl _objc_destroyWeak
.loc 2 17 1 ; /Users/hl/Desktop/OCTest/OCTest/Test.m:17:1
ldp x29, x30, [sp, #48] ; 8-byte Folded Reload
add sp, sp, #64 ; =64
ret
可以看到,__weak本身实现的核心就是以下两个方法
- _objc_initWeak
- _objc_destroyWeak
我们通过Runtime的源码分析这两个方法的实现:
id objc_initWeak(id *location, id newObj)
{
//省略....
return storeWeak
(location, (objc_object*)newObj);
}
void objc_destroyWeak(id *location)
{
(void)storeWeak
(location, nil);
}
所以,本质上都是调用了storeWeak函数,这个函数内容较多,主要做了以下事情
- 获取存储weak对象的map,这个map的key是对象的地址,value是weak引用的地址。
- 当对象被释放的时候,根据对象的地址可以找到对应的weak引用的地址,将其置为nil即可。
这就是在weak背后的神秘的手。