Runtime源码 —— 方法加载的过程

在上一篇文章中分析过类的结构体,是这个样子的:

struct objc_class : objc_object {
    Class superclass;
    cache_t cache;             // formerly cache pointer and vtable
    class_data_bits_t bits;    // class_rw_t * plus custom rr/alloc flags
}

那一篇主要是分析isa的源码,这些字段并没有深究,这一篇就来深入研究一下。我还是会先对源码进行分析,再结合例子进行验证。

从字面上来看,前两个字段的意思是很容易理解的:

  • Class superclass
    父类的指针。
  • cache_t cache;
    一个缓存,官方文档注释写明了用于缓存指针和虚表。但这个缓存是如何起作用在后续的文章中再讲。

下面就来重点看一看这个不太看得懂的字段:

  • class_data_bits_t bits
    注释中讲了这个字段实际上就是class_rw_t *加上自定义的rr/alloc标志,rr/alloc标志是指含有这些方法:retain/release/autorelease/retainCount/alloc等。

那么就来看看class_rw_t这个结构体:

struct class_rw_t {
    // Be warned that Symbolication knows the layout of this structure.
    uint32_t flags;
    uint32_t version;

    const class_ro_t *ro;

    method_array_t methods;
    property_array_t properties;
    protocol_array_t protocols;
    Class firstSubclass;
    Class nextSiblingClass;
    char *demangledName;
}

除开明显的方法,属性,协议等字段,这个结构体中有一个奇怪的字段,const class_ro_t *ro;这个结构体是这样定义的:

struct class_ro_t {
    uint32_t flags;
    uint32_t instanceStart;
    uint32_t instanceSize;
    uint32_t reserved;
    const uint8_t * ivarLayout;
    const char * name;
    method_list_t * baseMethodList;
    protocol_list_t * baseProtocols;
    const ivar_list_t * ivars;
    const uint8_t * weakIvarLayout;
    property_list_t *baseProperties;
}

感觉这两个结构体还是比较类似的,这时候合理猜测一下,rw应该是指readwrite,ro是指readonly。也就是说在可读可写的结构体中存放了一个只读的结构体,而且这两个结构体很相似。

结合oc是一门动态语言再猜测一下,class_ro_t是不是存放在编译期就确定的信息,class_rw_t用来存放在运行期添加的信息呢?只能通过代码来验证一下。

注:这里面还有一些很关键的字段,比如instanceStart,instanceSize。本文不做扩展。

例子

首先把之前的TestObject扩展一下,添加一个hello方法:

// TestObject.h
#import 
@interface TestObject : NSObject

- (void)hello;

@end

// TestObject.m
#import "TestObject.h"
@implementation TestObject

- (void)hello {
    NSLog(@"hello");
}

@end

接着获取一下TestObject在内存中的地址:

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSLog(@"%p", [TestObject class]);
    }
    return 0;
}

输出:0x100001168

只要代码不变,这个类在内存中的地址就不会变

这个时候在void _objc_init(void)添加一个断点:


Runtime源码 —— 方法加载的过程_第1张图片
1.png

然后利用上面的地址就可以看一看这个时候class_ro_t的内容。

(lldb) p (objc_class *)0x100001168
(objc_class *) $0 = 0x0000000100001168
// 根据objc_class的结构,isa:8字节,superclass:8字节,cache:16字节
// 所以偏移32字节来获取class_data_bits_t
(lldb) p (class_data_bits_t *)0x100001188
(class_data_bits_t *) $1 = 0x0000000100001188
(lldb) p $1->data()
(class_rw_t *) $2 = 0x00000001000010e8
// 在这个时候,class_rw_t实际上是class_ro_t,后面会验证
(lldb) p (class_ro_t *)$2
(class_ro_t *) $3 = 0x00000001000010e8
(lldb) p *$3
(class_ro_t) $4 = {
  flags = 128
  instanceStart = 8
  instanceSize = 8
  reserved = 0
  ivarLayout = 0x0000000000000000 
  name = 0x0000000100000f99 "TestObject"
  baseMethodList = 0x00000001000010c8
  baseProtocols = 0x0000000000000000
  ivars = 0x0000000000000000
  weakIvarLayout = 0x0000000000000000 
  baseProperties = 0x0000000000000000
}

可以看到class_ro_t结构体中name和baseMethodList已经有内容了,可以打印一下看看是不是TestObject类中的hello方法:

(lldb) p $4.baseMethodList
(method_list_t *) $5 = 0x00000001000010c8
(lldb) p $5->get(0)
(method_t) $6 = {
  name = "hello"
  types = 0x0000000100000fb0 "v16@0:8"
  imp = 0x0000000100000eb0 (debug-objc`-[TestObject hello] at TestObject.m:13)
}

没有问题,从name可以看出就是hello方法。method_t结构体也非常简单:

struct method_t {
    SEL name;
    const char *types;
    IMP imp;
}

types那一串乱七八糟的字符串可以参考苹果的文档:Type Encodings

扯远了,刚刚验证了在编译期,类的相关信息会存放到class_ro_t中,那么看看运行期是如何把信息添加到class_rw_t中的。这时候就需要看看这个方法了:static Class realizeClass(Class cls)

为什么会突然跳到这个方法,中间过程有些复杂,概括来说就是在研究void _objc_init(void)方法时,通过这么个路径(省略函数签名)map_2_images() -> map_images_nolock() -> _read_images() -> realizeClass(),看到了这个方法,主要是看到了这个方法的注释:

* realizeClass
* Performs first-time initialization on class cls, 
* including allocating its read-write data.
* Returns the real class structure for the class. 
* Locking: runtimeLock must be write-locked by the caller

这里面提到的read-write data指的就是class_rw_t了,当然实际方法的调用栈并不是上面的路径。在realizeClass方法中添加一个断点:


Runtime源码 —— 方法加载的过程_第2张图片
2.png

左侧可以看到方法的调用栈,切换到4那一步:


Runtime源码 —— 方法加载的过程_第3张图片
3.png

可以看到是因为在main函数中打印log时调用了class方法,才一步步进入了realizeClass方法。

猜测:某个类的realizeClass方法是在类被首次调用的时候才会调用。

关于方法的调用,或者说是消息的转发,并不是本文的重点,下一篇讲消息转发机制的时候再具体说。下面看看realizeClass方法是如何实现的:

static Class realizeClass(Class cls)
{
    const class_ro_t *ro;
    class_rw_t *rw;
    ...
    ro = (const class_ro_t *)cls->data();
    // Normal class. Allocate writeable class data.
    rw = (class_rw_t *)calloc(sizeof(class_rw_t), 1);
    rw->ro = ro;
    rw->flags = RW_REALIZED|RW_REALIZING;
    cls->setData(rw);
    ...
    methodizeClass(cls);

    return cls;
}

删掉了不少代码,只看关键部分,首先看到这一步:

  • ro = (const class_ro_t *)cls->data();
    验证了之前我们的猜想,在这个时候,class_rw_t实际上class_ro_t,所以有这一步强转。
  • rw->ro = ro;
    把ro赋值给rw中的ro字段
  • cls->setData(rw);
    最后把rw赋值回去,这一步完成之后rw和ro就被正确的设置了,但rw中的方法、属性、协议列表还是空的。
  • methodizeClass(cls);
    这一步会把ro中的方法、属性、协议拷贝到rw中。另外会把此类所有的category中附加的方法、属性、协议也拷贝进去。oc之所以能在运行时做各种事情,其实都是基于runtime的这些支持。

看看关键的methodizeClass(cls)方法是如何实现的:

static void methodizeClass(Class cls)
{
    bool isMeta = cls->isMetaClass();
    auto rw = cls->data();
    auto ro = rw->ro;

    // Install methods and properties that the class implements itself.
    method_list_t *list = ro->baseMethods();
    if (list) {
        prepareMethodLists(cls, &list, 1, YES, isBundleClass(cls));
        rw->methods.attachLists(&list, 1);
    }

    property_list_t *proplist = ro->baseProperties;
    if (proplist) {
        rw->properties.attachLists(&proplist, 1);
    }

    protocol_list_t *protolist = ro->baseProtocols;
    if (protolist) {
        rw->protocols.attachLists(&protolist, 1);
    }

    // Root classes get bonus method implementations if they don't have 
    // them already. These apply before category replacements.
    if (cls->isRootMetaclass()) {
        // root metaclass
        addMethod(cls, SEL_initialize, (IMP)&objc_noop_imp, "", NO);
    }

    // Attach categories.
    category_list *cats = unattachedCategoriesForClass(cls, true /*realizing*/);
    attachCategories(cls, cats, false /*don't flush caches*/);
}

这个方法结构还是很清楚的,就是通过attachLists()方法把ro中的内容拷贝到了rw中,最后通过attachCategories()方法把分类中的内容也添加进去,这里就不再深挖了。

在methodizeClass()方法结束后,rw中的方法、属性、协议就有内容了,用代码验证一下:

(lldb) p (objc_class *)0x100001168
(objc_class *) $5 = 0x0000000100001168
(lldb) p (class_data_bits_t *)0x100001188
(class_data_bits_t *) $6 = 0x0000000100001188
(lldb) p $6->data()
(class_rw_t *) $7 = 0x00000001008022e0
// 之前在这里强转成class_ro_t,现在这个时候已经不需要了,直接获取属性
(lldb) p $7->methods
(method_array_t) $8 = {
  list_array_tt = {
     = {
      list = 0x00000001000010c8
      arrayAndFlag = 4294971592
    }
  }
}
// method_array_t结构体中有如下的方法来获取method_list_t的二维数组
(lldb) p $8.beginCategoryMethodLists()[0][0]
(method_list_t) $9 = {
  entsize_list_tt = {
    entsizeAndFlags = 26
    count = 1
    first = {
      name = "hello"
      types = 0x0000000100000fb0 "v16@0:8"
      imp = 0x0000000100000eb0 (debug-objc`-[TestObject hello] at TestObject.m:13)
    }
  }
}

可以看到这个时候hello方法已经存在了。

总结

  • 在编译期,类的相关方法,属性,协议会被添加到class_ro_t这个只读的结构体中。
  • 在运行期,类第一次被调用的时候,class_rw_t会被初始化,category中的内容也是在这个时候被添加进来的。
  • 最开始的猜测不完全正确,class_rw_t不仅仅用来存放运行时添加的信息,编译期确定下来的信息也会被拷贝进去。

你可能感兴趣的:(Runtime源码 —— 方法加载的过程)