OC底层原理探索文档汇总
上文说到,block本质是一个可以捕获变量的匿名函数,并且具有对象的特征,也可以看做是一个仅有一个函数的对象。接下来就通过Clang和查看源码分析block的底层实现来证明
主要内容:
1、block的本质
2、__block的原理
3、block的底层类型
4、block从栈拷贝到堆的过程分析
1、block的本质
1.1 block在底层的结构
定义block.c文件
#include "stdio.h"
int main(){
void(^block)(void) = ^{
printf("wy");
};
return 0;
}
通过Clang编译
int main(){
void(*block)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
((void (*)(__block_impl *))((__block_impl *)block)->FuncPtr)((__block_impl *)block);
return 0;
}
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
printf("wy");
}
//******简化******
void(*block)(void) = __main_block_impl_0(__main_block_func_0, &__main_block_desc_0_DATA));//构造函数
block->FuncPtr(block);//block调用执行
说明:
- 可以看出__main_block_impl_0用来构造block
- __main_block_impl_0函数传入两个参数,__main_block_func_0和&__main_block_desc_0_DATA。
- 通过指向block的FuncPtr方法进行调用
查看结构体
//**block定义结构体**
struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};
//**block实现结构体**
struct __block_impl {
void *isa;
int Flags;
int Reserved;
void *FuncPtr;
};
说明:
- 可以看到__main_block_impl_0结构体是用以定义block的一个结构体。包含block结构体、block描述信息,以及一个同名构造函数
- impl是block本身
- Desc会提供一些定义block时的描述信息
- 在构造函数中会将外界的值赋值到block结构体中。以此来构造block
- 重点看的就是给impl的isa赋值block类型,还有将外界的函数赋值给block。
- 在block结构体__block_impl中包含isa和FuncPtr,还有Flags和Reserved(这两个不用关注)
- 结构体中包含有isa,有三种类型,NSGlobalBlock、NSMallocBlock、NSStackBlock,这也可以说明block可以看做一个对象,因为它有isa,并且指向不同的结构体类型。
- FuncPtr就是block中的函数,它用来执行具体的功能
1.2 block如何捕获外界变量
定义一个变量,并在block中调用
int main(){
int a = 11;
void(^block)(void) = ^{
printf("WY - %d", a);
};
block();
return 0;
}
底层编译:
//**block实现结构体**
struct __block_impl {
void *isa;
int Flags;
int Reserved;
void *FuncPtr;
};
//block定义结构体
struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
int a;//编译时就自动生成了相应的变量
// a(_a) 的做法是将传入的_a赋值给当前结构体中的a
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int _a, int flags=0) : a(_a) {
impl.isa = &_NSConcreteStackBlock;//block的isa默认是stackBlock
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};
//block函数
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
//在函数中会自动创建一个局部变量,并将外界的变量值赋值给局部变量a中
//属于值拷贝,也就是直接将11赋值给a.因此__cself->a和a没有关系
int a = __cself->a; // bound by copy 值拷贝,即 a = 11
printf("WY - %d", a);
}
int main(){
int a = 11;
//当block使用外界变量时,会自动将变量传入到block中
void(*block)(void) = __main_block_impl_0(__main_block_func_0, &__main_block_desc_0_DATA, a));
block)->FuncPtr(block);
return 0;
}
说明:
- 当block使用外界的变量时,会将变量通过block的构造函数中传入到block定义结构体中
- 在block的构造函数中会将变量赋值给block定义结构体__main_block_impl_0的变量。(此时_main_block_impl_0结构体会自动创建一个相同名称的变量,差别在于没有前边没有)
- 之后在block函数中也会自动创建一个局部变量,同时将__main_block_impl_0结构体中的变量赋值给局部变量。以此让函数可以使用该变量。
总结:block在使用外界变量时,会在block定义结构体中定义一个变量来保存外界变量的值。这样就表现为捕获。
1.3 __block修饰变量的原理
对a加一个__block,然后在block中使用a
#include "stdio.h"
int main(){
__block int a = 11;
void(^block)(void) = ^{
a++;
printf("WY %d",a);
};
// block();
return 0;
}
Clang编译:
//block实现结构体
struct __block_impl {
void *isa;//可以看到包含有isa
int Flags;
int Reserved;
void *FuncPtr;//函数指针
};
//__block修饰的变量结构体
struct __Block_byref_a_0 {
void *__isa;
__Block_byref_a_0 *__forwarding;//这里是a的地址
int __flags;
int __size;
int a;//最后可以找到结构中的变量a
};
//定义block的底层结构体
struct __main_block_impl_0 {
struct __block_impl impl;//block结构体
struct __main_block_desc_0* Desc;//描述符
__Block_byref_a_0 *a; // 变量,在编译时就会将外界的数据获取到
//构造函数,传入的fp就是block内部的函数
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, __Block_byref_a_0 *_a, int flags=0) : a(_a->__forwarding) {
impl.isa = &_NSConcreteStackBlock;//这里是栈block
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};
//block内部的函数实现,会传入block本身
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
//将block的变量赋值给当前函数的局部变量。
//但因为此处的a是指针,不是基本类型,所以指针赋值的修改是可以影响的。
//在函数中是定义了一个变量a,如果是基本数据类型,进行赋值,那么就是局部变量,无法影响到外界的a
__Block_byref_a_0 *a = __cself->a; // bound by ref
//之后将结构体a的__forwarding结构体拿到,在拿到结构体中的变量a,之后进行操作
//也就是说这里操作的不是局部变量本身,而是局部变量结构体的指针。
(a->__forwarding->a)++;
printf("LG_Cooci - %d",(a->__forwarding->a));
}
int main(){
//__block修饰的变量
__attribute__((__blocks__(byref))) __Block_byref_a_0 a = {(void*)0,(__Block_byref_a_0 *)&a, 0, sizeof(__Block_byref_a_0), 11};
//block定义
void(*block)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_a_0 *)&a, 570425344));
//这里是调用,可以看到会将结构体__Block_byref_a_0作为变量传入到block中
void(*block)(void) = __main_block_impl_0(__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_a_0 *)&a, 570425344));
return 0;
}
说明:
- 可以看到外界的变量使用__block修饰后,其实在底层会将该变量设置为结构体__Block_byref_a_0
- __Block_byref_a_0结构体主要包含两个值,一个是变量地址,一个是变量本身
- block在使用变量时,也会传入__Block_byref_a_0结构体来使用,可以看到传入的其实就是a的地址&a。
- __main_block_impl_0中也会主动创建一个变量block来存储外界变量的地址,通过a(_a->__forwarding)来进行赋值
- 最后在block内部函数__main_block_func_0中也自动创建一个__Block_byref_a_0局部变量用来存储外界变量的地址。
- 在函数中使用变量时,其实使用的是通过变量地址所指向的变量。
总结:
- 外界变量会生成__Block_byref_a_0结构体
- 结构体用来保存原始变量的指针和值
- 将变量生成的结构体对象的指针地址 传递给block,然后在block内部就可以对外界变量进行操作了
- 简单来说就是将值拷贝转变为指针拷贝,所以就可以修改外界变量了。
2、block的底层类型
查看libclosure-74源码,通过查看_Block_copy的源码实现,发现block在底层的真正类型是Block_layout
block真正类型
查看Block_layout类型的定义,是一个结构体
// Block 结构体
struct Block_layout {
//指向表明block类型的类
void *isa;//8字节
//用来作标识符的,类似于isa中的位域,按bit位表示一些block的附加信息
volatile int32_t flags; // contains ref count 4字节
//保留信息,可以理解预留位置,用于存储block内部变量信息
int32_t reserved;//4字节
//函数指针,指向具体的block实现的调用地址
BlockInvokeFunction invoke;
//block的附加信息
struct Block_descriptor_1 *descriptor;
// imported variables
};
说明:
- isa:指向表明block类型的类
- flags:标识符,按bit位表示一些block的附加信息,使用位域的方式存储,其中flags的种类有以下几种,主要重点关注BLOCK_HAS_COPY_DISPOSE 和 BLOCK_HAS_SIGNATURE。 BLOCK_HAS_COPY_DISPOSE 决定是否有 Block_descriptor_2。BLOCK_HAS_SIGNATURE 决定是否有 Block_descriptor_3
- 第1 位 - BLOCK_DEALLOCATING,释放标记,-般常用 BLOCK_NEEDS_FREE 做 位与 操作,一同传入 Flags , 告知该 block 可释放。
- 低16位 - BLOCK_REFCOUNT_MASK,存储引用计数的值;是一个可选用参数
- 第24位 - BLOCK_NEEDS_FREE,低16是否有效的标志,程序根据它来决定是否增加或是减少引用计数位的 值;
- 第25位 - BLOCK_HAS_COPY_DISPOSE,是否拥有拷贝辅助函数(a copy helper function);
- 第26位 - BLOCK_IS_GC,是否拥有 block 析构函数;
- 第27位,标志是否有垃圾回收;//OS X
- 第28位 - BLOCK_IS_GLOBAL,标志是否是全局block;
- 第30位 - BLOCK_HAS_SIGNATURE,与 BLOCK_USE_STRET 相对,判断当前 block 是否拥有一个签名。用于 runtime 时动态调用。
// Values for Block_layout->flags to describe block objects
enum {
//释放标记,一般常用于BLOCK_BYREF_NEEDS_FREE做位与运算,一同传入flags,告知该block可释放
BLOCK_DEALLOCATING = (0x0001), // runtime
//存储引用引用计数的 值,是一个可选用参数
BLOCK_REFCOUNT_MASK = (0xfffe), // runtime
//低16位是否有效的标志,程序根据它来决定是否增加或者减少引用计数位的值
BLOCK_NEEDS_FREE = (1 << 24), // runtime
//是否拥有拷贝辅助函数,(a copy helper function)决定block_description_2
BLOCK_HAS_COPY_DISPOSE = (1 << 25), // compiler
//是否拥有block C++析构函数
BLOCK_HAS_CTOR = (1 << 26), // compiler: helpers have C++ code
//标志是否有垃圾回收,OSX
BLOCK_IS_GC = (1 << 27), // runtime
//标志是否是全局block
BLOCK_IS_GLOBAL = (1 << 28), // compiler
//与BLOCK_HAS_SIGNATURE相对,判断是否当前block拥有一个签名,用于runtime时动态调用
BLOCK_USE_STRET = (1 << 29), // compiler: undefined if !BLOCK_HAS_SIGNATURE
//是否有签名
BLOCK_HAS_SIGNATURE = (1 << 30), // compiler
//使用有拓展,决定block_description_3
BLOCK_HAS_EXTENDED_LAYOUT=(1 << 31) // compiler
};
- reserved:保留信息,可以理解预留位置,猜测是用于存储block内部变量信息
- invoke:是一个函数指针,指向block的执行代码
- descriptor:block的附加信息,比如保留变量数、block的大小、进行copy或dispose的辅助函数指针。有三类
- Block_descriptor_1是必选的
- Block_descriptor_2 和 Block_descriptor_3都是可选的
#define BLOCK_DESCRIPTOR_1 1
struct Block_descriptor_1 {
uintptr_t reserved;//保留信息
uintptr_t size;//block大小
};
#define BLOCK_DESCRIPTOR_2 1
struct Block_descriptor_2 {
// requires BLOCK_HAS_COPY_DISPOSE
BlockCopyFunction copy;//拷贝函数指针
BlockDisposeFunction dispose;
};
#define BLOCK_DESCRIPTOR_3 1
struct Block_descriptor_3 {
// requires BLOCK_HAS_SIGNATURE
const char *signature;//签名
const char *layout; // contents depend on BLOCK_HAS_EXTENDED_LAYOUT 布局
};
以上关于descriptor的可以从其构造函数中体现,其中Block_descriptor_2和Block_descriptor_3都是通过Block_descriptor_1的地址,经过内存平移得到的
源码:
static struct Block_descriptor_1 * _Block_descriptor_1(struct Block_layout *aBlock)
{
return aBlock->descriptor;//默认打印
}
#endif
// Block 的描述 : copy 和 dispose 函数
static struct Block_descriptor_2 * _Block_descriptor_2(struct Block_layout *aBlock)
{
if (! (aBlock->flags & BLOCK_HAS_COPY_DISPOSE)) return NULL;
uint8_t *desc = (uint8_t *)aBlock->descriptor;//descriptor_1的地址
desc += sizeof(struct Block_descriptor_1);//通过内存平移获取
return (struct Block_descriptor_2 *)desc;
}
// Block 的描述 : 签名相关
static struct Block_descriptor_3 * _Block_descriptor_3(struct Block_layout *aBlock)
{
if (! (aBlock->flags & BLOCK_HAS_SIGNATURE)) return NULL;
uint8_t *desc = (uint8_t *)aBlock->descriptor;
desc += sizeof(struct Block_descriptor_1);
if (aBlock->flags & BLOCK_HAS_COPY_DISPOSE) {
desc += sizeof(struct Block_descriptor_2);
}
return (struct Block_descriptor_3 *)desc;
}
4、block的拷贝过程
包括block本身从栈如何拷贝到堆中,捕获的外界局部变量如何拷贝到堆中两类。
4.1 _Block_copy源码分析
这里只有一次拷贝,即将栈block拷贝为堆block,如果不使用外界的局部变量,就只有这一层拷贝。
源码
// Copy, or bump refcount, of a block. If really copying, call the copy helper if present.
// 这里是核心重点 block的拷贝操作: 栈Block -> 堆Block
void *_Block_copy(const void *arg) {
struct Block_layout *aBlock;
if (!arg) return NULL;
// The following would be better done as a switch statement
aBlock = (struct Block_layout *)arg;//强转为Block_layout类型对象,防止对外界造成影响
if (aBlock->flags & BLOCK_NEEDS_FREE) {//是否需要释放
// latches on high
latching_incr_int(&aBlock->flags);
return aBlock;
}
else if (aBlock->flags & BLOCK_IS_GLOBAL) {//如果是全局block,直接返回
return aBlock;
}
else {//为栈block 或者 堆block,由于堆区需要申请内存,所以只可能是栈区
// Its a stack block. Make a copy. 它是一个堆栈块block,拷贝。
struct Block_layout *result =
(struct Block_layout *)malloc(aBlock->descriptor->size);//申请空间并接收
if (!result) return NULL;
//通过memmove内存拷贝,将 aBlock 拷贝至result
memmove(result, aBlock, aBlock->descriptor->size); // bitcopy first
#if __has_feature(ptrauth_calls)
// Resign the invoke pointer as it uses address authentication.
result->invoke = aBlock->invoke;//可以直接调起invoke
#endif
// reset refcount
result->flags &= ~(BLOCK_REFCOUNT_MASK|BLOCK_DEALLOCATING); // XXX not needed 告知可释放
result->flags |= BLOCK_NEEDS_FREE | 2; // logical refcount 1
_Block_call_copy_helper(result, aBlock);
// Set isa last so memory analysis tools see a fully-initialized object.
result->isa = _NSConcreteMallocBlock;//设置block对象类型为堆区block
return result;
}
}
说明:
- 进入_Block_copy源码,将block 从栈区拷贝至堆区
- 如果需要释放,则直接释放
- 如果是globalBlock,说明不需要copy,直接返回
- 反之,肯定是栈block,因为初始创建的不可能是堆block,堆block必须是通过栈block拷贝的
- 此处将栈block拷贝为堆block
- 通过malloc申请内存空间用于接收block
- 通过memmove将block拷贝至新申请的内存中
- 设置block对象的类型为堆区block,即result->isa = _NSConcreteMallocBlock
4.2 _Block_object_assign 分析
如果block使用外部的局部变量,则会开始接下来的两层拷贝
首先需要知道外部变量的种类有哪些,下面这些其中用的最多的是BLOCK_FIELD_IS_OBJECT和BLOCK_FIELD_IS_BYREF
// Block 捕获的外界变量的种类
// Runtime support functions used by compiler when generating copy/dispose helpers
// Values for _Block_object_assign() and _Block_object_dispose() parameters
enum {
// see function implementation for a more complete description of these fields and combinations
//普通对象,即没有其他的引用类型
BLOCK_FIELD_IS_OBJECT = 3, // id, NSObject, __attribute__((NSObject)), block, ...
//block类型作为变量
BLOCK_FIELD_IS_BLOCK = 7, // a block variable
//经过__block修饰的变量
BLOCK_FIELD_IS_BYREF = 8, // the on stack structure holding the __block variable
//weak 弱引用变量
BLOCK_FIELD_IS_WEAK = 16, // declared __weak, only used in byref copy helpers
//返回的调用对象 - 处理block_byref内部对象内存会加的一个额外标记,配合flags一起使用
BLOCK_BYREF_CALLER = 128, // called from __block (byref) copy/dispose support routines.
};
4.2.1 _Block_object_assign源码
// __block 变量
void _Block_object_assign(void *destArg, const void *object, const int flags) {
const void **dest = (const void **)destArg;
switch (os_assumes(flags & BLOCK_ALL_COPY_DISPOSE_FLAGS)) {
//普通的对象类型
case BLOCK_FIELD_IS_OBJECT:
/*******
id object = ...;
[^{ object; } copy];
********/
// objc 指针地址 weakSelf (self)
// arc
_Block_retain_object(object);
// 持有
//持有了当前指针,就在这里,强引用
*dest = object;
break;
case BLOCK_FIELD_IS_BLOCK:
/*******
void (^object)(void) = ...;
[^{ object; } copy];
********/
// block 被一个 block 捕获
*dest = _Block_copy(object);
break;
case BLOCK_FIELD_IS_BYREF | BLOCK_FIELD_IS_WEAK:
case BLOCK_FIELD_IS_BYREF:
/*******
// copy the onstack __block container to the heap
// Note this __weak is old GC-weak/MRC-unretained.
// ARC-style __weak is handled by the copy helper directly.
__block ... x;
__weak __block ... x;
[^{ x; } copy];
********/
*dest = _Block_byref_copy(object);
break;
case BLOCK_BYREF_CALLER | BLOCK_FIELD_IS_OBJECT:
case BLOCK_BYREF_CALLER | BLOCK_FIELD_IS_BLOCK:
/*******
// copy the actual field held in the __block container
// Note this is MRC unretained __block only.
// ARC retained __block is handled by the copy helper directly.
__block id object;
__block void (^object)(void);
[^{ object; } copy];
********/
*dest = object;
break;
case BLOCK_BYREF_CALLER | BLOCK_FIELD_IS_OBJECT | BLOCK_FIELD_IS_WEAK:
case BLOCK_BYREF_CALLER | BLOCK_FIELD_IS_BLOCK | BLOCK_FIELD_IS_WEAK:
/*******
// copy the actual field held in the __block container
// Note this __weak is old GC-weak/MRC-unretained.
// ARC-style __weak is handled by the copy helper directly.
__weak __block id object;
__weak __block void (^object)(void);
[^{ object; } copy];
********/
*dest = object;
break;
default:
break;
}
}
说明:
- 如果是普通对象,则交给系统arc处理,并通过*dest = object拷贝对象指针,即引用计数+1,所以如果直接使用外界的对象,则该对象会引用计数+1不能释放,这也是循环引用出现的条件
- 如果是block类型的变量,则通过_Block_copy操作,将block从栈区拷贝到堆区
- 如果是__weak或__block修饰的变量,调用_Block_byref_copy函数,开始捕获变量
4.2.2 进入_Block_byref_copy源码
源码:
static struct Block_byref *_Block_byref_copy(const void *arg) {
// Block_byref 结构体,捕获变量的结构体
struct Block_byref *src = (struct Block_byref *)arg;
if ((src->forwarding->flags & BLOCK_REFCOUNT_MASK) == 0) {
// src points to stack
//1、先创建了一个需要捕获的变量的结构体
struct Block_byref *copy = (struct Block_byref *)malloc(src->size);
copy->isa = NULL;
// byref value 4 is logical refcount of 2: one for caller, one for stack
copy->flags = src->flags | BLOCK_BYREF_NEEDS_FREE | 4;
//2、在这里将这个结构体的指针都指向这两个变量中,这样他们两个的修改都会改变这个内存数据
copy->forwarding = copy; // patch heap copy to point to itself
src->forwarding = copy; // patch stack to point to heap copy
copy->size = src->size;
//如果有copy能力 ,
if (src->flags & BLOCK_BYREF_HAS_COPY_DISPOSE) {
// Trust copy helper to copy everything of interest
// If more than one field shows up in a byref block this is wrong XXX
//Block_byref_2是结构体,__block修饰的可能是对象,对象通过byref_keep保存,在合适的时机进行调用
struct Block_byref_2 *src2 = (struct Block_byref_2 *)(src+1);
struct Block_byref_2 *copy2 = (struct Block_byref_2 *)(copy+1);
copy2->byref_keep = src2->byref_keep;
copy2->byref_destroy = src2->byref_destroy;
if (src->flags & BLOCK_BYREF_LAYOUT_EXTENDED) {
struct Block_byref_3 *src3 = (struct Block_byref_3 *)(src2+1);
struct Block_byref_3 *copy3 = (struct Block_byref_3*)(copy2+1);
copy3->layout = src3->layout;
}
//等价于 __Block_byref_id_object_copy
(*src2->byref_keep)(copy, src);
}
else {
// Bitwise copy.
// This copy includes Block_byref_3, if any.
memmove(copy+1, src+1, src->size - sizeof(*src));
}
}
// already copied to heap
else if ((src->forwarding->flags & BLOCK_BYREF_NEEDS_FREE) == BLOCK_BYREF_NEEDS_FREE) {
latching_incr_int(&src->forwarding->flags);
}
return src->forwarding;
}
说明:
- 先将传入的对象,强转为Block_byref结构体类型对象
- 再创建一个需要捕获的变量的结构体,并且将原来的数据拷贝到这个结构体中
- 最后让src和copy两者的forwarding都指向copy,也就是他们指向同一个区域,这样就可以做到他们两个的修改都会改变这个内存数据
总结:
- 最初创建的需要捕获的变量的结构体是在栈中
- 之后这个结构体从栈中copy到堆中
- 最后将栈的指针指向堆中的结构体,堆中的结构体的指针指向自己。