iOS之武功秘籍⑮: Block的原理

iOS之武功秘籍 文章汇总

写在前面

相信大家对block都有一定的了解,日常开发中也经常能看到它的身影.本文会从block概念、blcok循环引用、block底层三方面进行讲解

本节可能用到的秘籍Demo

一、Block初探

① block定义

带有自动变量(局部变量)的匿名函数叫做block,又叫做匿名函数代码块

② block分类

block主要有三种类型

  • __NSGlobalBlock__:全局block,存储在全局区

此时的block无参也无返回值,属于全局block

  • __NSMallocBlock__:堆区block,因为block既是函数,也是对象

此时的block会访问外界变量,即底层拷贝a,所以是堆区block

  • __NSStackBlock__:栈区block

其中局部变量a在没有处理之前(即没有拷贝之前)是 栈区block, 处理后(即拷贝之后)是堆区block ,目前的栈区block越来越少了

这个情况下,可以通过__weak不进行强持有,block就还是栈区block

总结:

  • block直接存储在全局区
  • 如果block访问外界变量,并进行block相应拷贝,即copy操作
    • 如果此时的block是强引用,则block存储在堆区,即堆区block
    • 如果此时的block通过__weak变成了弱引用,则block存储在栈区,即栈区block

二、Block循环引用

① 循环引用的分析

  • 正常释放:是指A持有B的引用,当A调用dealloc方法,给B发送release信号,B收到release信号,如果此时BretainCount(即引用计数)为0时,则调用Bdealloc方法
  • 循环引用A、B相互持有,所以导致A无法调用dealloc方法给B发送release信号,而B也无法接收到release信号.所以A、B此时都无法释放

② 解决循环引用

请问下面两段代码有循环引用吗?


  • 代码一种发生了循环引用,因为在block内部使用了外部变量name,导致block持有了self,而self原本是持有block的,所以导致了self和block的相互持有.
  • 代码二中无循环引用,虽然也使用了外部变量,但是self并没有持有animationblock,仅仅只有animation持有self,不构成相互持有.

解决循环引用常见的方式有以下几种:

  • 方式①: weak-strong-dance -- 强弱共舞
  • 方式②: __block修饰对象(需要注意的是在block内部需要置空对象,而且block必须调用)
  • 方式③: 传递对象self作为block的参数,提供给block内部使用
  • 方式④: 使用NSProxy

②.1 方式①: weak-strong-dance

  • 如果block内部并未嵌套block,直接使用__weak修饰self即可

此时的weakSelfself指向同一片内存空间,且使用__weak不会导致self的引用计数发生变化,可以通过打印weakSelfself的指针地址,以及self的引用计数来验证,如下所示

  • 如果block内部嵌套block,需要同时使用__weak__strong

其中strongSelf是一个临时变量,在block的作用域内,即内部block执行完就释放strongSelf

这种方式属于打破self对block的强引用,依赖于中介者模式,属于自动置为nil,即自动释放

②.2 方式②: __block修饰变量

这种方式同样依赖于中介者模式,属于手动释放,是通过__block修饰对象,主要是因为__block修饰的对象是可以改变的

需要注意的是这里的block必须调用,如果不调用blockvc就不会置空,那么依旧是循环引用,selfblock都不会被释放.

②.3 方式③: 对象self作为参数

主要是将对象self作为参数,提供给block内部使用,不会有引用计数问题

②.4 方式④: NSProxy 虚拟类

  • OC是只能单继承的语言,但是它是基于运行时的机制,所以可以通过NSProxy来实现伪多继承,填补了多继承的空白

  • NSProxyNSObject是同级的一个类,也可以说是一个虚拟类,只是实现了NSObject的协议

  • NSProxy其实是一个消息重定向封装的一个抽象类,类似一个代理人,中间件,可以通过继承它,并重写下面两个方法来实现消息转发到另一个实例

    - (void)forwardInvocation:(NSInvocation *)invocation;
    - (nullable NSMethodSignature *)methodSignatureForSelector:(SEL)sel
    

使用场景

NSProxy的使用场景主要有两种

  • 实现多继承功能
  • 解决了NSTimer&CADisplayLink创建时对self强引用问题,参考YYKitYYWeakProxy

循环引用解决原理
主要是通过自定义的NSProxy类的对象来代替self,并使用方法实现消息转发

下面是NSProxy子类的实现以及使用的场景

  • 自定义一个NSProxy的子类CJLProxy
  • 自定义TCJCat类和TCJDog
  • 通过TCJProxy实现多继承功能
  • 通过TCJProxy解决定时器中self的强引用问题

②.5 总结

循环应用的解决方式从根本上来说就两种,以self -> block -> self为例

  • 打破selfblock的强引用,可以block属性修饰符使用weak,但是这样会导致block还每创建完就释放了,所以从这里打破强引用行不通
  • 打破blockself的强引用,主要就是self的作用域和block作用域的通讯,通讯有代理、传值、通知、传参等几种方式,用于解决循环,常见的解决方式如下:
    • weak-strong-dance
    • __block(block内对象置空,且调用block)
    • 将对象self作为block的参数
    • 通过NSProxy的子类代替self

三、Block底层原理

主要是通过clang断点调试等方式分析Block底层

③.1 block本质

  • 定义block.c文件
  • 通过xcrun -sdk iphonesimulator clang -arch x86_64 -rewrite-objc block.c,将block.c 编译成 block.cpp,其中block在底层被编译成了以下的形式

通过简化我们知道:相当于block等于__main_block_impl_0,是一个函数

  • 查看__main_block_impl_0,是一个结构体,同时可以说明block是一个__main_block_impl_0类型的对象,这也是为什么block能够%@打印的原因.

总结:block本质对象、函数、结构体,由于block函数没有名称,也被称为匿名函数代码块

block通过clang编译后的源码间的关系如下所示,以__block修饰的变量为例

③.1.1 block为什么需要调用

在底层block的类型为__main_block_impl_0结构体,通过其同名构造函数创建,第一个传入的block的内部实现代码块,即__main_block_func_0,用fp表示,然后赋值给implFuncPtr属性,然后在main中进行了调用,这也是block为什么需要调用的原因.如果不调用,block内部实现的代码块将无法执行,可以总结为以下两点

  • 函数声明:即block内部实现声明成了一个函数__main_block_func_0
  • 执行具体的函数实现:通过调用blockFuncPtr指针,调用block执行

③.1.2 block是如何获取外界变量的

  • 定义一个变量,并在block中调用

  • 底层编译成下面这样

__main_block_func_0中的a值拷贝,如果此时在block内部实现中作 a++操作,是有问题的,会造成编译器的代码歧义,即此时的a是只读的.

总结:block捕获外界变量时,在内部会自动生成同一个属性来保存

③.1.3 __block的原理

  • a加一个__block,然后在block中对a进行++操作

底层编译为如下
  • main中的a是通过外界变量封装的对象
  • __main_block_impl_0中,将对象a的地址&a给构造函数
  • __main_block_func_0内部对a的处理是指针拷贝,此时创建的对象a与传入对象的a指向同一片内存空间

总结:

  • 外界变量通过__block生成__Block_byref_a_0结构体
  • 结构体用来保存原始变量的指针和值
  • 将变量生成的结构体对象的指针地址传递给block,然后在block内部就可以对外界变量进行操作了

上面__block非__block修饰局部变量产生两种不同的拷贝

  • 非__block修饰值拷贝 - 深拷贝,只是拷贝数值,且拷贝的值不可更改,指向不同的内存空间,案例中普通变量a就是值拷贝
  • __block修饰指针拷贝 - 浅拷贝生成的对象指向同一片内存空间,案例中经过__block修饰的变量a就是指针拷贝

③.2 分析block源码所在位置

  • 通过在block处打断点,分析运行时的block,打开汇编
  • objc_retainBlock符号断点,发现会走到_Block_copy
  • _Block_copy符号断点,运行断住,在libsystem_blocks.dylib源码中

可以到苹果开源网站下载最新的libclosure-78源码,通过查看_Block_copy的源码实现,发现block在底层的真正类型是Block_layout

③.3 Block真正类型 -- Block_layout

查看Block_layout类型的定义,是一个结构体

  • isa:指向表明block类型的类
  • flags:标识符,按bit位表示一些block的附加信息,类似于isa中的位域,其中flags的种类有以下几种,主要重点关注BLOCK_HAS_COPY_DISPOSEBLOCK_HAS_SIGNATURE. BLOCK_HAS_COPY_DISPOSE 决定是否有 Block_descriptor_2.BLOCK_HAS_SIGNATURE 决定是否有 Block_descriptor_3
    • 第1位: BLOCK_DEALLOCATING,释放标记,-般常用 BLOCK_NEEDS_FREE位与 操作,一同传入 Flags , 告知该 block 可释放
    • 第16位: BLOCK_REFCOUNT_MASK,存储引用计数的值;是一个可选用参数
    • 第24位: BLOCK_NEEDS_FREE,第16是否有效的标志,程序根据它来决定是否增加或是减少引用计数位的值;
    • 第25位: BLOCK_HAS_COPY_DISPOSE,是否拥有拷贝辅助函数(a copy helper function);
    • 第26位: BLOCK_HAS_CTOR,是否拥有 block 析构函数;
    • 第27位: BLOCK_IS_GC,标志是否有垃圾回收;//OS X
    • 第28位: BLOCK_IS_GLOBAL,标志是否是全局block;
    • 第30位: BLOCK_HAS_SIGNATURE,与 BLOCK_USE_STRET 相对,判断当前 block 是否拥有一个签名.用于 runtime 时动态调用
  • reserved:保留信息,可以理解预留位置,猜测是用于存储block内部变量信息
  • invoke:是一个函数指针,指向block的执行代码
  • descriptorblock的附加信息,比如保留变量数block的大小进行copydispose的辅助函数指针.有三类
    • Block_descriptor_1是必选的
    • Block_descriptor_2Block_descriptor_3都是可选的

以上关于descriptor的分类可以从其构造函数中体现,其中Block_descriptor_2Block_descriptor_3都是通过Block_descriptor_1的地址,经过内存平移得到的

③.4 Block内存变化

  • 打断点运行,打开汇编调式,走到objc_retainBlockblock断点处读取寄存器x0,此时的block全局block ,即__NSGlobalBlock__类型
  • 增加外部变量a,并在block内打印

此时读取block断点处读取寄存器x0,此时的block栈block -- __NSStackBlock__

  • 执行到符号断点objc_retainBlock时,还是栈区block
  • 增加_Block_copy符号断点并断住,直接在最后的ret加断点,读取x0,发现经过_Block_copy之后,变成了堆block,即__NSMallocBlock__,主要是因为block地址发生了改变,为堆block

调用情况

  • 同样也可以通过断点来验证
  • register read x0 读取x0,为堆block
  • 继续往下走,register read x9 读取x9,还是堆block
  • 继续往下register read x11 ,此时是指向一片内存空间,用于存储_block_invoke
  • 按住control + step into,进入 _block_invoke,可以得出是通过内存平移得到的block内部实现

前面提到的Block_layout的结构体源码,从源码中可以看出,有个属性invoke,即block的执行者,是从isa的首地址平移 16字节取到invoke,然后进行调用执行的.

③.5 签名

继续操作,读取x0寄存器,看内存布局,通过 内存平移 3*8 就可获得Block_layout的属性descriptor,主要是为了查看是否有Block_descriptor_2Block_descriptor_3,其中3中有block的签名

  • register read x0,读取寄存器x0
  • po 0x0000000280ad9fb0,打印block
  • x/8gx 0x0000000280ad9fb0 ,即打印block内存情况
  • x/8gx 0x0000000100024010 , 查看descriptor的内存情况,其中第三个0x0000000100023396表示签名
  • 判断是否有Block_descriptor_2,即flagsBLOCK_HAS_COPY_DISPOSE(拷贝辅助函数)是否有值
    • p/x 1<<25 ,即1左移25位,其十六进制为0x2000000
    • p 0x02000000 & 0x00000000c1000002 ,即BLOCK_HAS_COPY_DISPOSE & flags ,等于0,表示没有Block_descriptor_2
  • 判断是否有Block_descriptor_3
  • p/x 1<<30,即1左移30位
  • p 0x40000000 & 0x00000000c1000002 ,即BLOCK_HAS_SIGNATURE & flags ,有值,说明有Block_descriptor_3
  • p (char *)0x000000010089f395 -- 获取Block_descriptor_3中的属性signature签名
  • po [NSMethodSignature signatureWithObjCTypes:"v8@?0"] ,即打印签名

其中签名的部分说明如下

//无返回值
return value: -------- -------- -------- --------
    type encoding (v) 'v'
    flags {}
    modifiers {}
    frame {offset = 0, offset adjust = 0, size = 0, size adjust = 0}
    memory {offset = 0, size = 0}
argument 0: -------- -------- -------- --------
    //encoding = (@),类型是 @?
    type encoding (@) '@?'
    //@是isObject ,?是isBlock,代表 isBlockObject
    flags {isObject, isBlock}
    modifiers {}
    frame {offset = 0, offset adjust = 0, size = 8, size adjust = 0}
    //所在偏移位置是8字节
    memory {offset = 0, size = 8}

block的签名信息类似于方法的签名信息,主要是体现block的返回值,参数以及类型等信息.

③.6 block三次copy分析

③.6.1 _Block_copy源码分析

进入_Block_copy源码,将block栈区拷贝至堆区

  • 如果需要释放,则直接释放
    • block的引用计数不受runtime处理的,是由自己管理的

    • 这里可能有个疑问 —— 为什么引用计数是 +2 而不是 +1

    • 因为flags的第一号位置已经存储着释放标记

  • 如果是globalBlock,则不需要copy,直接返回
  • 反之,只有两种情况:栈区block or 堆区block,由于堆区block需要申请空间,前面并没有申请空间的相关代码,所以只能是栈区block
    • 通过malloc申请内存空间用于接收block
    • 通过memmoveblock拷贝至新申请的内存中
    • 设置block对象的类型为堆区block,即result->isa = _NSConcreteMallocBlock

③.6.2 _Block_object_assign 分析

想要分析block三层copy,首先需要知道外部变量的种类有哪些,在__block的cpp文件中,在函数声明时会传__main_block_desc_0_DATA结构体,在里面又会去调用__main_block_copy_0函数,__main_block_copy_0里面会调用_Block_object_assign.

block修饰其中用的最多的是BLOCK_FIELD_IS_OBJECTBLOCK_FIELD_IS_BYREF

_Block_object_assign是在底层编译代码中,外部变量拷贝时调用的方法就是它

进入_Block_object_assign源码

  • 1.如果是普通对象,则交给ARC处理,并拷贝对象指针,即引用计数+1,所以外界变量不能释放
  • 2.如果是block类型的,则通过_Block_copy操作,将block栈区拷贝到堆区
  • 3.如果是__block修饰的变量,调用_Block_byref_copy函数,进行内存拷贝以及常规处理

此时捕获到的变量是被__block修饰的BLOCK_FIELD_IS_BYREF类型,就会调用*dest = _Block_byref_copy(object);

  • 1.将传入的对象,强转为Block_byref结构体类型对象,保存一份
  • 2.没有将外界变量拷贝到堆,需要申请内存,其进行拷贝
  • 如果已经拷贝过了,则进行处理并返回
  • 其中copysrcforwarding指针都指向同一片内存,这也是为什么__block修饰的对象具有修改能力的原因
  • (*src2->byref_keep)(copy, src)
    • (*src2->byref_keep)(copy, src)跟进去会来到Block_byref结构来,而byref_keepBlock_byref的第5个属性

代码调试

  • 定义一个__block修饰的NSString对象
  • 进行clang编译结果如下
  • 编译后的cj_name比普通变量多了__Block_byref_id_object_copy_131__Block_byref_id_object_dispose_131
  • __Block_byref_cj_name_0结构体中多了__Block_byref_id_object_copy__Block_byref_id_object_dispose

通过上面的分析,我们可以知道这些方法的执行顺序_Block_copy->_Block_byref_copy->_Block_object_assign,正好对应上述的三层copy

综上所述,那么block是如何拿到cj_name的呢?

  • 1、通过_Block_copy方法,将block拷贝一份至堆区
  • 2、通过_Block_object_assign方法正常拷贝,因为__block修饰的外界变量在底层是Block_byref结构体
  • 3、发现外部变量还存有一个对象,从bref中取出相应对象cj_name,拷贝至block空间,才能使用(相同空间才能使用,不同则不能使用).最后通过内存平移就得到了cj_name,此时的cj_name 和 外界的cj_name是同一片内存空间(从_Block_object_assign方法中的*dest = object;看出)

三层copy总结
综上所述,block的三层拷贝是指以下三层:

  • 【第一层】通过_Block_copy实现对象的自身拷贝,从栈区拷贝至堆区
  • 【第二层】通过_Block_byref_copy方法,将对象拷贝为Block_byref结构体类型
  • 【第三层】调用_Block_object_assign方法,对__block修饰的当前变量的拷贝

注意:只有__block修饰的对象,blockcopy才有三层

③.6.3 _Block_object_dispose 分析

__Block_byref_id_object_dispose_131实现中调用的就是_Block_object_dispose,下面我们看下_Block_object_dispose的底层实现:

通过源码我们可以知道_Block_object_dispose是进行release操作,通过不同分区的block进行不同的释放操作.而_Block_object_assign是进行retain操作的.

  • 进入_Block_byref_release源码,主要就是对象、变量的释放销毁
    • 如果是释放对象就什么也不做(自动释放)
    • 如果是__block修饰,就将指向指回原来的区域并使用free释放

③.6.4 总结

  • block的本质是个__main_block_impl_0的结构体对象,所以能用%@打印
  • block声明只是将block实现保存起来,具体的函数实现需要自行调用
  • block捕获外界变量时block结构体会自动生成一个属性来保存变量
  • __block修饰的属性在底层会生成响应的结构体,保存原始变量的指针,并传递一个指针地址给block
  • block中有三层拷贝:拷贝block拷贝捕获变量的内存地址拷贝对象

Block的三层copy的流程如下图所示

写在后面

和谐学习,不急不躁.我还是我,颜色不一样的烟火.

你可能感兴趣的:(iOS之武功秘籍⑮: Block的原理)