本文详细整理了 Cocoa 的 Runtime 系统的知识,它使得 Objective-C 如虎添翼,具备了灵活的动态特性,使这门古老的语言焕发生机。主要内容如下:
曾经觉得Objc特别方便上手,面对着 Cocoa 中大量 API,只知道简单的查文档和调用。还记得初学 Objective-C 时把 [receiver message]
当成简单的方法调用,而无视了“发送消息”这句话的深刻含义。其实 [receiver message]
会被编译器转化为:
1 |
objc_msgSend(receiver, selector) |
如果消息含有参数,则为:
1 |
objc_msgSend(receiver, selector, arg1, arg2, ...) |
如果消息的接收者能够找到对应的 selector
,那么就相当于直接执行了接收者这个对象的特定方法;否则,消息要么被转发,或是临时向接收者动态添加这个 selector
对应的实现内容,要么就干脆玩完崩溃掉。
现在可以看出 [receiver message]
真的不是一个简简单单的方法调用。因为这只是在编译阶段确定了要向接收者发送 message
这条消息,而 receive
将要如何响应这条消息,那就要看运行时发生的情况来决定了。
Objective-C 的 Runtime 铸就了它动态语言的特性,这些深层次的知识虽然平时写代码用的少一些,但是却是每个 Objc 程序员需要了解的。
因为Objc是一门动态语言,所以它总是想办法把一些决定工作从编译连接推迟到运行时。也就是说只有编译器是不够的,还需要一个运行时系统 (runtime system) 来执行编译后的代码。这就是 Objective-C Runtime 系统存在的意义,它是整个 Objc 运行框架的一块基石。
Runtime其实有两个版本: “modern” 和 “legacy”。我们现在用的 Objective-C 2.0 采用的是现行 (Modern) 版的 Runtime 系统,只能运行在 iOS 和 macOS 10.5 之后的 64 位程序中。而 maxOS 较老的32位程序仍采用 Objective-C 1 中的(早期)Legacy 版本的 Runtime 系统。这两个版本最大的区别在于当你更改一个类的实例变量的布局时,在早期版本中你需要重新编译它的子类,而现行版就不需要。
Runtime 基本是用 C 和汇编写的,可见苹果为了动态系统的高效而作出的努力。你可以在这里下到苹果维护的开源代码。苹果和GNU各自维护一个开源的 runtime 版本,这两个版本之间都在努力的保持一致。
Objc 从三种不同的层级上与 Runtime 系统进行交互,分别是通过 Objective-C 源代码,通过 Foundation 框架的NSObject
类定义的方法,通过对 runtime 函数的直接调用。
大部分情况下你就只管写你的Objc代码就行,runtime 系统自动在幕后辛勤劳作着。
还记得引言中举的例子吧,消息的执行会使用到一些编译器为实现动态语言特性而创建的数据结构和函数,Objc中的类、方法和协议等在 runtime 中都由一些数据结构来定义,这些内容在后面会讲到。(比如 objc_msgSend
函数及其参数列表中的 id
和 SEL
都是啥)
Cocoa 中大多数类都继承于 NSObject
类,也就自然继承了它的方法。最特殊的例外是 NSProxy
,它是个抽象超类,它实现了一些消息转发有关的方法,可以通过继承它来实现一个其他类的替身类或是虚拟出一个不存在的类,说白了就是领导把自己展现给大家风光无限,但是把活儿都交给幕后小弟去干。
有的NSObject
中的方法起到了抽象接口的作用,比如description
方法需要你重载它并为你定义的类提供描述内容。NSObject
还有些方法能在运行时获得类的信息,并检查一些特性,比如class
返回对象的类;isKindOfClass:
和isMemberOfClass:
则检查对象是否在指定的类继承体系中;respondsToSelector:
检查对象能否响应指定的消息;conformsToProtocol:
检查对象是否实现了指定协议类的方法;methodForSelector:
则返回指定方法实现的地址。
Runtime 系统是一个由一系列函数和数据结构组成,具有公共接口的动态共享库。头文件存放于/usr/include/objc
目录下。许多函数允许你用纯C代码来重复实现 Objc 中同样的功能。虽然有一些方法构成了NSObject
类的基础,但是你在写 Objc 代码时一般不会直接用到这些函数的,除非是写一些 Objc 与其他语言的桥接或是底层的debug工作。在 Objective-C Runtime Reference 中有对 Runtime 函数的详细文档。
还记得引言中的objc_msgSend:
方法吧,它的真身是这样的:
1 |
id objc_msgSend ( id self, SEL op, ... ); |
下面将会逐渐展开介绍一些术语,其实它们都对应着数据结构。熟悉 Objective-C 类的内存模型或看过相关源码的可以直接跳过。
objc_msgSend
函数第二个参数类型为SEL
,它是selector
在Objc中的表示类型(Swift中是Selector
类)。selector
是方法选择器,可以理解为区分方法的 ID,而这个 ID 的数据结构是SEL
:
1 |
typedef struct objc_selector *SEL; |
其实它就是个映射到方法的C字符串,你可以用 Objc 编译器命令 @selector()
或者 Runtime 系统的 sel_registerName
函数来获得一个 SEL
类型的方法选择器。
不同类中相同名字的方法所对应的方法选择器是相同的,即使方法名字相同而变量类型不同也会导致它们具有相同的方法选择器,于是 Objc 中方法命名有时会带上参数类型(NSNumber
一堆抽象工厂方法拿走不谢),Cocoa 中有好多长长的方法哦。
objc_msgSend
第一个参数类型为id
,大家对它都不陌生,它是一个指向类实例的指针:
1 |
typedef struct objc_object *id; |
那objc_object
又是啥呢,参考 objc-private.h 文件部分源码:
1 |
struct objc_object { |
objc_object
结构体包含一个 isa
指针,类型为 isa_t
联合体。根据 isa
就可以顺藤摸瓜找到对象所属的类。isa
这里还涉及到 tagged pointer 等概念。因为 isa_t
使用 union
实现,所以可能表示多种形态,既可以当成是指针,也可以存储标志位。有关 isa_t
联合体的更多内容可以查看 Objective-C 引用计数原理。
PS: isa
指针不总是指向实例对象所属的类,不能依靠它来确定类型,而是应该用 class
方法来确定实例对象的类。因为KVO的实现机理就是将被观察对象的 isa
指针指向一个中间类而不是真实的类,这是一种叫做 isa-swizzling 的技术,详见官方文档
Class
其实是一个指向 objc_class
结构体的指针:
1 |
typedef struct objc_class *Class; |
而 objc_class
包含很多方法,主要都为围绕它的几个成员做文章:
1 |
struct objc_class : objc_object { |
objc_class
继承于 objc_object
,也就是说一个 ObjC 类本身同时也是一个对象,为了处理类和对象的关系,runtime 库创建了一种叫做元类 (Meta Class) 的东西,类对象所属类型就叫做元类,它用来表述类对象本身所具备的元数据。类方法就定义于此处,因为这些方法可以理解成类对象的实例方法。每个类仅有一个类对象,而每个类对象仅有一个与之相关的元类。当你发出一个类似 [NSObject alloc]
的消息时,你事实上是把这个消息发给了一个类对象 (Class Object) ,这个类对象必须是一个元类的实例,而这个元类同时也是一个根元类 (root meta class) 的实例。所有的元类最终都指向根元类为其超类。所有的元类的方法列表都有能够响应消息的类方法。所以当 [NSObject alloc]
这条消息发给类对象的时候,objc_msgSend()
会去它的元类里面去查找能够响应消息的方法,如果找到了,然后对这个类对象执行方法调用。
上图实线是 superclass
指针,虚线是isa
指针。 有趣的是根元类的超类是 NSObject
,而 isa
指向了自己,而 NSObject
的超类为 nil
,也就是它没有超类。
可以看到运行时一个类还关联了它的超类指针,类名,成员变量,方法,缓存,还有附属的协议。
1 |
struct cache_t { |
_buckets
存储 IMP
,_mask
和 _occupied
对应 vtable
。
cache
为方法调用的性能进行优化,通俗地讲,每当实例对象接收到一个消息时,它不会直接在isa
指向的类的方法列表中遍历查找能够响应消息的方法,因为这样效率太低了,而是优先在 cache
中查找。Runtime 系统会把被调用的方法存到 cache
中(理论上讲一个方法如果被调用,那么它有可能今后还会被调用),下次查找的时候效率更高。
bucket_t
中存储了指针与 IMP 的键值对:
1 |
struct bucket_t { |
有关缓存的实现细节,可以查看 objc-cache.mm 文件。
objc_class
中最复杂的是 bits
,class_data_bits_t
结构体所包含的信息太多了,主要包含 class_rw_t
, retain/release/autorelease/retainCount
和 alloc
等信息,很多存取方法也是围绕它展开。查看 objc-runtime-new.h 源码如下:
1 |
struct class_data_bits_t { |
注意 objc_class
的 data
方法直接将 class_data_bits_t
的data
方法返回,最终是返回 class_rw_t
,保了好几层。
可以看到 class_data_bits_t
里又包了一个 bits
,这个指针跟不同的 FAST_
前缀的 flag 掩码做按位与操作,就可以获取不同的数据。bits
在内存中每个位的含义有三种排列顺序:
32 位:
0 | 1 | 2 - 31 |
---|---|---|
FAST_IS_SWIFT | FAST_HAS_DEFAULT_RR | FAST_DATA_MASK |
64 位兼容版:
0 | 1 | 2 | 3 - 46 | 47 - 63 |
---|---|---|---|---|
FAST_IS_SWIFT | FAST_HAS_DEFAULT_RR | FAST_REQUIRES_RAW_ISA | FAST_DATA_MASK | 空闲 |
64 位不兼容版:
0 | 1 | 2 | 3 - 46 | 47 |
---|---|---|---|---|
FAST_IS_SWIFT | FAST_REQUIRES_RAW_ISA | FAST_HAS_CXX_DTOR | FAST_DATA_MASK | FAST_HAS_CXX_CTOR |
48 | 49 | 50 | 51 | 52 - 63 |
FAST_HAS_DEFAULT_AWZ | FAST_HAS_DEFAULT_RR | FAST_ALLOC | FAST_SHIFTED_SIZE_SHIFT | 空闲 |
其中 64 位不兼容版每个宏对应的含义如下:
1 |
// class is a Swift class |
这里面除了 FAST_DATA_MASK
是用一段空间存储数据外,其他宏都是只用 1 bit 存储 bool 值。class_data_bits_t
提供了三个方法用于位操作:getBit
,setBits
和 clearBits
,对应到存储 bool 值的掩码也有封装函数,比如:
1 |
bool isSwift() { |
重头戏在于最大的那块存储区域–FAST_DATA_MASK
,它其实就存储了指向 class_rw_t
的指针:
1 |
class_rw_t* data() { |
对这片内存读写处于并发环境,但并不需要加锁,因为会通过对一些状态(realization or construction)判断来决定是否可读写。
class_data_bits_t
甚至还包含了一些对 class_rw_t
中 flags
成员存取的封装函数。
objc_class
包含了 class_data_bits_t
,class_data_bits_t
存储了 class_rw_t
的指针,而 class_rw_t
结构体又包含 class_ro_t
的指针。
class_ro_t
中的 method_list_t
, ivar_list_t
, property_list_t
结构体都继承自 entsize_list_tt
。结构为 xxx_list_t
的列表元素结构为 xxx_t
,命名很工整。protocol_list_t
与前三个不同,它存储的是 protocol_t *
指针列表,实现比较简单。
entsize_list_tt
实现了 non-fragile 特性的数组结构。假如苹果在新版本的 SDK 中向 NSObject
类增加了一些内容,NSObject
的占据的内存区域会扩大,开发者以前编译出的二进制中的子类就会与新的 NSObject
内存有重叠部分。于是在编译期会给 instanceStart
和 instanceSize
赋值,确定好编译时每个类的所占内存区域起始偏移量和大小,这样只需将子类与基类的这两个变量作对比即可知道子类是否与基类有重叠,如果有,也可知道子类需要挪多少偏移量。更多细节可以参考后面的章节 Non Fragile ivars。
1 |
struct class_ro_t { |
class_ro_t->flags
存储了很多在编译时期就确定的类的信息,也是 ABI 的一部分。下面这些 RO_
前缀的宏标记了 flags
一些位置的含义。其中后三个并不需要被编译器赋值,是预留给运行时加载和初始化类的标志位,涉及到与 class_rw_t
的类型强转。运行时会用到它做判断,后面会讲解。
1 |
|
class_rw_t
提供了运行时对类拓展的能力,而 class_ro_t
存储的大多是类在编译时就已经确定的信息。二者都存有类的方法、属性(成员变量)、协议等信息,不过存储它们的列表实现方式不同。
class_rw_t
中使用的 method_array_t
, property_array_t
, protocol_array_t
都继承自 list_array_tt
, 它可以不断扩张,因为它可以存储 list 指针,内容有三种:
entsize_list_tt
指针entsize_list_tt
指针数组class_rw_t
的内容是可以在运行时被动态修改的,可以说运行时对类的拓展大都是存储在这里的。
1 |
struct class_rw_t { |
class_rw_t->flags
存储的值并不是编辑器设置的,其中有些值可能将来会作为 ABI 的一部分。下面这些 RW_
前缀的宏标记了 flags
一些位置的含义。这些 bool 值标记了类的一些状态,涉及到声明周期和内存管理。有些位目前甚至还空着。
1 |
|
demangledName
是计算机语言用于解决实体名称唯一性的一种方法,做法是向名称中添加一些类型信息,用于从编译器中向链接器传递更多语义信息。
在某个类初始化之前,objc_class->data()
返回的指针指向的其实是个 class_ro_t
结构体。等到 static Class realizeClass(Class cls)
静态方法在类第一次初始化时被调用,它会开辟 class_rw_t
的空间,并将 class_ro_t
指针赋值给 class_rw_t->ro
。这种偷天换日的行为是靠 RO_FUTURE
标志位来记录的:
1 |
ro = (const class_ro_t *)cls->data(); |
注意之前 RO 和 RW flags 宏标记的一个细节:
1 |
|
也就是说 ro = (const class_ro_t *)cls->data();
这种强转对于接下来的 ro->flags & RO_FUTURE
操作完全是 OK 的,两种结构体第一个成员都是 flags
,RO_FUTURE
与 RW_FUTURE
值一样的。
经过 realizeClass
函数处理的类才是『真正的』类,调用它时不能对类做写操作。
Category
为现有的类提供了拓展性,它是 category_t
结构体的指针。
1 |
typedef struct category_t *Category; |
category_t
存储了类别中可以拓展的实例方法、类方法、协议、实例属性和类属性。类属性是 Objective-C 2016 年新增的特性,沾 Swift 的光。所以 category_t
中有些成员变量是为了兼容 Swift 的特性,Objective-C 暂没提供接口,仅做了底层数据结构上的兼容。
1 |
struct category_t { |
在 App 启动加载镜像文件时,会在 _read_images
函数间接调用到 attachCategories
函数,完成向类中添加 Category
的工作。原理就是向 class_rw_t
中的 method_array_t
, property_array_t
, protocol_array_t
数组中分别添加 method_list_t
, property_list_t
, protocol_list_t
指针。之前讲过 xxx_array_t
可以存储对应 xxx_list_t
的指针数组。
在调用 attachCategories
函数之前,会先使用 unattachedCategoriesForClass
函数获取类中还未添加的类别列表。这个列表类型为 locstamped_category_list_t
,它封装了 category_t
以及对应的 header_info
。header_info
存储了实体在镜像中的加载和初始化状态,以及一些偏移量,在加载 Mach-O 文件相关函数中经常用到。
1 |
struct locstamped_category_t { |
所以更具体来说 attachCategories
做的就是将 locstamped_category_list_t.list
列表中每个 locstamped_category_t.cat
中的那方法、协议和属性分别添加到类的 class_rw_t
对应列表中。header_info
中的信息决定了是否是元类,从而选择应该是添加实例方法还是类方法、实例属性还是类属性等。源码在 objc-runtime-new.mm 文件中,很好理解。
Method
是一种代表类中的某个方法的类型。
1 |
typedef struct method_t *Method; |
而 objc_method
在上面的方法列表中提到过,它存储了方法名,方法类型和方法实现:
1 |
struct method_t { |
SEL
,前面提到过相同名字的方法即使在不同类中定义,它们的方法选择器也相同。 types
是个char
指针,其实存储着方法的参数类型和返回值类型。imp
指向了方法的实现,本质上是一个函数指针,后面会详细讲到。 Ivar
是一种代表类中实例变量的类型。
1 |
typedef struct ivar_t *Ivar; |
而 ivar_t
在上面的成员变量列表中也提到过:
1 |
struct ivar_t { |
可以根据实例查找其在类中的名字,也就是“反射”:
1 |
-(NSString *)nameWithInstance:(id)instance { |
class_copyIvarList
函数获取的不仅有实例变量,还有属性。但会在原本的属性名前加上一个下划线。
@property
标记了类中的属性,这个不必多说大家都很熟悉,它是一个指向objc_property
结构体的指针:
1 |
typedef struct property_t *objc_property_t; |
可以通过 class_copyPropertyList
和 protocol_copyPropertyList
方法来获取类和协议中的属性:
1 |
objc_property_t *class_copyPropertyList(Class cls, unsigned int *outCount) |
返回类型为指向指针的指针,哈哈,因为属性列表是个数组,每个元素内容都是一个 objc_property_t
指针,而这两个函数返回的值是指向这个数组的指针。
举个栗子,先声明一个类:
1 |
@interface Lender : NSObject { |
你可以用下面的代码获取属性列表:
1 |
id LenderClass = objc_getClass("Lender"); |
你可以用 property_getName
函数来查找属性名称:
1 |
const char *property_getName(objc_property_t property) |
你可以用class_getProperty
和 protocol_getProperty
通过给出的名称来在类和协议中获取属性的引用:
1 |
objc_property_t class_getProperty(Class cls, const char *name) |
你可以用property_getAttributes
函数来发掘属性的名称和@encode
类型字符串:
1 |
const char *property_getAttributes(objc_property_t property) |
把上面的代码放一起,你就能从一个类中获取它的属性啦:
1 |
id LenderClass = objc_getClass("Lender"); |
对比下 class_copyIvarList
函数,使用 class_copyPropertyList
函数只能获取类的属性,而不包含成员变量。但此时获取的属性名是不带下划线的。
虽然 Objective-C 的 Category
和 protocol
拓展能力有限,但也得为了将就 Swift 的感受,充个胖子。
flags
32 位指针最后两位是给加载 Mach-O 的 fix-up 阶段使用的,前 16 位预留给 Swift 用的。
protocol
主要内容其实是(可选)方法,其次就是继承其他 protocol
。Swift 还支持 protocol
多继承,所以需要 protocols
数组来做兼容。
1 |
struct protocol_t : objc_object { |
IMP
在objc.h
中的定义是:
1 |
typedef void (*IMP)(void /* id, SEL, ... */ ); |
它就是一个函数指针,这是由编译器生成的。当你发起一个 ObjC 消息之后,最终它会执行的那段代码,就是由这个函数指针指定的。而 IMP
这个函数指针就指向了这个方法的实现。既然得到了执行某个实例某个方法的入口,我们就可以绕开消息传递阶段,直接执行方法,这在后面会提到。
你会发现 IMP
指向的方法与 objc_msgSend
函数类型相同,参数都包含 id
和 SEL
类型。每个方法名都对应一个 SEL
类型的方法选择器,而每个实例对象中的 SEL
对应的方法实现肯定是唯一的,通过一组 id
和 SEL
参数就能确定唯一的方法实现地址;反之亦然。
前面做了这么多铺垫,现在终于说到了消息了。Objc 中发送消息是用中括号([]
)把接收者和消息括起来,而直到运行时才会把消息与方法实现绑定。
有关消息发送和消息转发机制的原理,可以查看这篇文章。
在引言中已经对objc_msgSend
进行了一点介绍,看起来像是objc_msgSend
返回了数据,其实objc_msgSend
从不返回数据而是你的方法被调用后返回了数据。下面详细叙述下消息发送步骤:
selector
是不是要忽略的。比如 Mac OS X 开发,有了垃圾回收就不理会 retain
, release
这些函数了。nil
对象。ObjC 的特性是允许对一个 nil
对象执行任何一个方法不会 Crash,因为会被忽略掉。IMP
,先从 cache
里面找,完了找得到就跳到对应的函数去执行。cache
找不到就找一下方法分发表。NSObject
类为止。 PS:这里说的分发表其实就是Class
中的方法列表,它将方法选择器和方法实现地址联系起来。
其实编译器会根据情况在objc_msgSend
, objc_msgSend_stret
, objc_msgSendSuper
, 或 objc_msgSendSuper_stret
四个方法中选择一个来调用。如果消息是传递给超类,那么会调用名字带有”Super”的函数;如果消息返回值是数据结构而不是简单值时,那么会调用名字带有”stret”的函数。排列组合正好四个方法。
值得一提的是在 i386 平台处理返回类型为浮点数的消息时,需要用到objc_msgSend_fpret
函数来进行处理,这是因为返回类型为浮点数的函数对应的 ABI(Application Binary Interface) 与返回整型的函数的 ABI 不兼容。此时objc_msgSend
不再适用,于是objc_msgSend_fpret
被派上用场,它会对浮点数寄存器做特殊处理。不过在 PPC 或 PPC64 平台是不需要麻烦它的。
PS:有木有发现这些函数的命名规律哦?带“Super”的是消息传递给超类;“stret”可分为“st”+“ret”两部分,分别代表“struct”和“return”;“fpret”就是“fp”+“ret”,分别代表“floating-point”和“return”。
我们经常在方法中使用self
关键字来引用实例本身,但从没有想过为什么self
就能取到调用当前方法的对象吧。其实self
的内容是在方法运行时被偷偷的动态传入的。
当objc_msgSend
找到方法对应的实现时,它将直接调用该方法实现,并将消息中所有的参数都传递给方法实现,同时,它还将传递两个隐藏的参数:
self
指向的内容)_cmd
指向的内容) 之所以说它们是隐藏的是因为在源代码方法的定义中并没有声明这两个参数。它们是在代码被编译时被插入实现中的。尽管这些参数没有被明确声明,在源代码中我们仍然可以引用它们。在下面的例子中,self
引用了接收者对象,而_cmd
引用了方法本身的选择器:
1 |
- strange |
在这两个参数中,self
更有用。实际上,它是在方法实现中访问消息接收者对象的实例变量的途径。
而当方法中的super
关键字接收到消息时,编译器会创建一个objc_super
结构体:
1 |
struct objc_super { id receiver; Class class; }; |
这个结构体指明了消息应该被传递给特定超类的定义。但receiver
仍然是self
本身,这点需要注意,因为当我们想通过[super class]
获取超类时,编译器只是将指向self
的id
指针和class
的SEL传递给了objc_msgSendSuper
函数,因为只有在NSObject
类才能找到class
方法,然后class
方法调用object_getClass()
,接着调用objc_msgSend(objc_super->receiver, @selector(class))
,传入的第一个参数是指向self
的id
指针,与调用[self class]
相同,所以我们得到的永远都是self
的类型。
在IMP
那节提到过可以避开消息绑定而直接获取方法的地址并调用方法。这种做法很少用,除非是需要持续大量重复调用某方法的极端情况,避开消息发送泛滥而直接调用该方法会更高效。
NSObject
类中有个methodForSelector:
实例方法,你可以用它来获取某个方法选择器对应的IMP
,举个栗子:
1 |
void (*setter)(id, SEL, BOOL); |
当方法被当做函数调用时,上节提到的两个隐藏参数就需要我们明确给出了。上面的例子调用了1000次函数,你可以试试直接给target
发送1000次setFilled:
消息会花多久。
PS:methodForSelector:
方法是由 Cocoa 的 Runtime 系统提供的,而不是 Objc 自身的特性。
你可以动态地提供一个方法的实现。例如我们可以用@dynamic
关键字在类的实现文件中修饰一个属性:
1 |
@dynamic propertyName; |
这表明我们会为这个属性动态提供存取方法,也就是说编译器不会再默认为我们生成setPropertyName:
和propertyName
方法,而需要我们动态提供。我们可以通过分别重载resolveInstanceMethod:
和resolveClassMethod:
方法分别添加实例方法实现和类方法实现。因为当 Runtime 系统在Cache
和方法分发表中(包括超类)找不到要执行的方法时,Runtime会调用resolveInstanceMethod:
或resolveClassMethod:
来给程序员一次动态添加方法实现的机会。我们需要用class_addMethod
函数完成向特定类添加特定方法实现的操作:
1 |
void dynamicMethodIMP(id self, SEL _cmd) { |
上面的例子为resolveThisMethodDynamically
方法添加了实现内容,也就是dynamicMethodIMP
方法中的代码。其中 “v@:
” 表示返回值和参数,这个符号涉及 Type Encoding
PS:动态方法解析会在消息转发机制浸入前执行。如果 respondsToSelector:
或 instancesRespondToSelector:
方法被执行,动态方法解析器将会被首先给予一个提供该方法选择器对应的IMP
的机会。如果你想让该方法选择器被传送到转发机制,那么就让resolveInstanceMethod:
返回NO
。
评论区有人问如何用 resolveClassMethod:
解析类方法,我将他贴出有问题的代码做了纠正和优化后如下,可以顺便将实例方法和类方法的动态方法解析对比下:
头文件:
1 |
|
m 文件:
1 |
|
需要深刻理解 [self class]
与 object_getClass(self)
甚至 object_getClass([self class])
的关系,其实并不难,重点在于 self
的类型:
self
为实例对象时,[self class]
与 object_getClass(self)
等价,因为前者会调用后者。object_getClass([self class])
得到元类。self
为类对象时,[self class]
返回值为自身,还是 self
。object_getClass(self)
与 object_getClass([self class])
等价。凡是涉及到类方法时,一定要弄清楚元类、selector、IMP 等概念,这样才能做到举一反三,随机应变。
在消息转发机制执行前,Runtime 系统会再给我们一次偷梁换柱的机会,即通过重载- (id)forwardingTargetForSelector:(SEL)aSelector
方法替换消息的接受者为其他对象:
1 |
- (id)forwardingTargetForSelector:(SEL)aSelector |
毕竟消息转发要耗费更多时间,抓住这次机会将消息重定向给别人是个不错的选择,不过千万别返回 如果此方法返回nil或self,则会进入消息转发机制(self
,因为那样会死循环。forwardInvocation:
);否则将向返回的对象重新发送消息。
如果想替换类方法的接受者,需要覆写 + (id)forwardingTargetForSelector:(SEL)aSelector
方法,并返回类对象:
1 |
+ (id)forwardingTargetForSelector:(SEL)aSelector { |
当动态方法解析不作处理返回NO
时,消息转发机制会被触发。在这时forwardInvocation:
方法会被执行,我们可以重写这个方法来定义我们的转发逻辑:
1 |
- (void)forwardInvocation:(NSInvocation *)anInvocation |
该消息的唯一参数是个NSInvocation
类型的对象——该对象封装了原始的消息和消息的参数。我们可以实现forwardInvocation:
方法来对不能处理的消息做一些默认的处理,也可以将消息转发给其他对象来处理,而不抛出错误。
这里需要注意的是参数anInvocation
是从哪的来的呢?其实在forwardInvocation:
消息发送前,Runtime系统会向对象发送methodSignatureForSelector:
消息,并取到返回的方法签名用于生成NSInvocation
对象。所以我们在重写forwardInvocation:
的同时也要重写methodSignatureForSelector:
方法,否则会抛异常。
当一个对象由于没有相应的方法实现而无法响应某消息时,运行时系统将通过forwardInvocation:
消息通知该对象。每个对象都从NSObject
类中继承了forwardInvocation:
方法。然而,NSObject
中的方法实现只是简单地调用了doesNotRecognizeSelector:
。通过实现我们自己的forwardInvocation:
方法,我们可以在该方法实现中将消息转发给其它对象。
forwardInvocation:
方法就像一个不能识别的消息的分发中心,将这些消息转发给不同接收对象。或者它也可以象一个运输站将所有的消息都发送给同一个接收对象。它可以将一个消息翻译成另外一个消息,或者简单的”吃掉“某些消息,因此没有响应也没有错误。forwardInvocation:
方法也可以对不同的消息提供同样的响应,这一切都取决于方法的具体实现。该方法所提供是将不同的对象链接到消息链的能力。
注意: forwardInvocation:
方法只有在消息接收对象中无法正常响应消息时才会被调用。 所以,如果我们希望一个对象将negotiate
消息转发给其它对象,则这个对象不能有negotiate
方法。否则,forwardInvocation:
将不可能会被调用。
转发和继承相似,可以用于为Objc编程添加一些多继承的效果。就像下图那样,一个对象把消息转发出去,就好似它把另一个对象中的方法借过来或是“继承”过来一样。
这使得不同继承体系分支下的两个类可以“继承”对方的方法,在上图中Warrior
和Diplomat
没有继承关系,但是Warrior
将negotiate
消息转发给了Diplomat
后,就好似Diplomat
是Warrior
的超类一样。
消息转发弥补了 Objc 不支持多继承的性质,也避免了因为多继承导致单个类变得臃肿复杂。它将问题分解得很细,只针对想要借鉴的方法才转发,而且转发机制是透明的。
转发不仅能模拟多继承,也能使轻量级对象代表重量级对象。弱小的女人背后是强大的男人,毕竟女人遇到难题都把它们转发给男人来做了。这里有一些适用案例,可以参看官方文档。
尽管转发很像继承,但是NSObject
类不会将两者混淆。像respondsToSelector:
和 isKindOfClass:
这类方法只会考虑继承体系,不会考虑转发链。比如上图中一个Warrior
对象如果被问到是否能响应negotiate
消息:
1 |
if ( [aWarrior respondsToSelector: (negotiate)] ) |
结果是NO
,尽管它能够接受negotiate
消息而不报错,因为它靠转发消息给Diplomat
类来响应消息。
如果你为了某些意图偏要“弄虚作假”让别人以为Warrior
继承到了Diplomat
的negotiate
方法,你得重新实现 respondsToSelector:
和 isKindOfClass:
来加入你的转发算法:
1 |
- (BOOL)respondsToSelector:(SEL)aSelector |
除了respondsToSelector:
和 isKindOfClass:
之外,instancesRespondToSelector:
中也应该写一份转发算法。如果使用了协议,conformsToProtocol:
同样也要加入到这一行列中。类似地,如果一个对象转发它接受的任何远程消息,它得给出一个methodSignatureForSelector:
来返回准确的方法描述,这个方法会最终响应被转发的消息。比如一个对象能给它的替代者对象转发消息,它需要像下面这样实现methodSignatureForSelector:
:
1 |
- (NSMethodSignature*)methodSignatureForSelector:(SEL)selector |
在 Runtime 的现行版本中,最大的特点就是健壮的实例变量。当一个类被编译时,实例变量的布局也就形成了,它表明访问类的实例变量的位置。从对象头部开始,实例变量依次根据自己所占空间而产生位移:
上图左边是NSObject
类的实例变量布局,右边是我们写的类的布局,也就是在超类后面加上我们自己类的实例变量,看起来不错。但试想如果哪天苹果更新了NSObject
类,发布新版本的系统的话,那就悲剧了:
我们自定义的类被划了两道线,那是因为那块区域跟超类重叠了。唯有苹果将超类改为以前的布局才能拯救我们,但这样也导致它们不能再拓展它们的框架了,因为成员变量布局被死死地固定了。在脆弱的实例变量(Fragile ivars) 环境下我们需要重新编译继承自 Apple 的类来恢复兼容性。那么在健壮的实例变量下会发生什么呢?
在健壮的实例变量下编译器生成的实例变量布局跟以前一样,但是当 runtime 系统检测到与超类有部分重叠时它会调整你新添加的实例变量的位移,那样你在子类中新添加的成员就被保护起来了。
需要注意的是在健壮的实例变量下,不要使用sizeof(SomeClass)
,而是用class_getInstanceSize([SomeClass class])
代替;也不要使用offsetof(SomeClass, SomeIvar)
,而要用ivar_getOffset(class_getInstanceVariable([SomeClass class], "SomeIvar"))
来代替。
优化 App 的启动时间 讲过加载 Mach-O 文件时有个步骤是通过 fix-up 修改偏移量来解决 fragile base class。
在 OS X 10.6 之后,Runtime系统让Objc支持向对象动态添加变量。涉及到的函数有以下三个:
1 |
void objc_setAssociatedObject ( id object, const void *key, id value, objc_AssociationPolicy policy ); |
这些方法以键值对的形式动态地向对象添加、获取或删除关联值。其中关联政策是一组枚举常量:
1 |
enum { |
这些常量对应着引用关联值的政策,也就是 Objc 内存管理的引用计数机制。有关 Objective-C 引用计数机制的原理,可以查看这篇文章。
之前所说的消息转发虽然功能强大,但需要我们了解并且能更改对应类的源代码,因为我们需要实现自己的转发逻辑。当我们无法触碰到某个类的源代码,却想更改这个类某个方法的实现时,该怎么办呢?可能继承类并重写方法是一种想法,但是有时无法达到目的。这里介绍的是 Method Swizzling ,它通过重新映射方法对应的实现来达到“偷天换日”的目的。跟消息转发相比,Method Swizzling 的做法更为隐蔽,甚至有些冒险,也增大了debug的难度。
PS: 对于熟练使用 Method Swizzling 的开发者,可以跳过此章节,看看我另一篇『稍微深入』一点的文章 Objective-C Method Swizzling。
这里摘抄一个 NSHipster 的例子:
1 |
|
上面的代码通过添加一个Tracking
类别到UIViewController
类中,将UIViewController
类的viewWillAppear:
方法和Tracking
类别中xxx_viewWillAppear:
方法的实现相互调换。Swizzling 应该在+load
方法中实现,因为+load
是在一个类最开始加载时调用。dispatch_once
是GCD中的一个方法,它保证了代码块只执行一次,并让其为一个原子操作,线程安全是很重要的。
如果类中不存在要替换的方法,那就先用class_addMethod
和class_replaceMethod
函数添加和替换两个方法的实现;如果类中已经有了想要替换的方法,那么就调用method_exchangeImplementations
函数交换了两个方法的 IMP
,这是苹果提供给我们用于实现 Method Swizzling 的便捷方法。
可能有人注意到了这行:
1 |
// When swizzling a class method, use the following: |
object_getClass((id)self)
与 [self class]
返回的结果类型都是 Class
,但前者为元类,后者为其本身,因为此时 self
为 Class
而不是实例.注意 [NSObject class]
与 [object class]
的区别:
1 |
+ (Class)class { |
PS:如果类中没有想被替换实现的原方法时,class_replaceMethod
相当于直接调用class_addMethod
向类中添加该方法的实现;否则调用method_setImplementation
方法,types
参数会被忽略。method_exchangeImplementations
方法做的事情与如下的原子操作等价:
1 |
IMP imp1 = method_getImplementation(m1); |
最后xxx_viewWillAppear:
方法的定义看似是递归调用引发死循环,其实不会的。因为[self xxx_viewWillAppear:animated]
消息会动态找到xxx_viewWillAppear:
方法的实现,而它的实现已经被我们与viewWillAppear:
方法实现进行了互换,所以这段代码不仅不会死循环,如果你把[self xxx_viewWillAppear:animated]
换成[self viewWillAppear:animated]
反而会引发死循环。
看到有人说+load
方法本身就是线程安全的,因为它在程序刚开始就被调用,很少会碰到并发问题,于是 stackoverflow 上也有大神给出了另一个 Method Swizzling 的实现:
1 |
- (void)replacementReceiveMessage:(const struct BInstantMessage *)arg1 { |
上面的代码同样要添加在某个类的类别中,相比第一个种实现,只是去掉了dispatch_once
部分。
Method Swizzling 的确是一个值得深入研究的话题,找了几篇不错的资源推荐给大家:
在用 SpriteKit 写游戏的时候,因为 API 本身有一些缺陷(增删节点时不考虑父节点是否存在啊,很容易崩溃啊有木有!),我在 Swift 上使用 Method Swizzling弥补这个缺陷:
1 |
extension SKNode { |
然后其他地方调用那两个类方法:
1 |
SKNode.yxy_swizzleAddChild() |
因为 Swift 中的 extension 的特殊性,最好在某个类的load()
方法中调用上面的两个方法.我是在AppDelegate 中调用的,于是保证了应用启动时能够执行上面两个方法.
我们之所以让自己的类继承 NSObject
不仅仅因为苹果帮我们完成了复杂的内存分配问题,更是因为这使得我们能够用上 Runtime 系统带来的便利。可能我们平时写代码时可能很少会考虑一句简单的 [receiver message]
背后发生了什么,而只是当做方法或函数调用。深入理解 Runtime 系统的细节更有利于我们利用消息机制写出功能更强大的代码,比如 Method Swizzling 等。
Update 20170820: 使用 objc4-709 源码重写部分章节,更新至 Swift 4 代码示例。
参考链接: