方法查找流程-快速查找流程

上一篇我们讲了方法写入流程:objc_class cache分析
本篇将介绍,方法的查找流程,在这之前,我们先了解一下runtime

Runtime

  • 什么是runtime
    • 区别runtime,可以把runtime编译时做下类比
      • runtime:代码被跑起来,转载到内存空间了,此时出错,将会导致程序崩溃,是一个动态过程
      • 编译时编译器把代码编译成机器能够识别的代码,编译器会在编译的时候做词法分析,语法分析,如果有问题,则编译不会被通过,程序则不能运行
  • runtime的使用
    • 通过我们的Objective-C代码,比如我们自己写的一些方法
    • 通过Framework和Service提供的接口,比如isKindOfClass
    • 通过RuntimeApi,比如class_xxx, objc_xxx
      runtime调用的方式.png

方法调用的本质

定义一个类,申明两个方法,并完成实现。

@interface Person : NSObject
- (void)sayHello;
+ (void)sayHoney;

@end

@implementation Person
- (void)sayHello{
    NSLog(@"hello");
}
+ (void)sayHoney{
    NSLog(@"honey");
}

@end

在main函数中完成调用

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        // insert code here...
        Person * person = [Person alloc];
        [Person sayHoney];
        [person sayHello];
        
        NSLog(@"Hello, World!");
    }
    return 0;
}

main.m文件对main.m进行clang,在终端执行:

xcrun -sdk iphonesimulator clang -arch x86_64 -rewrite-objc main.m

得到一个main.cpp文件
我们看到[Person sayHoney],和[person sayHello]这两个方法的调用在底层被编译成了:

  • [Person sayHoney]:
((void (*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("Person"), sel_registerName("sayHoney"));
  • [person sayHello]:
((void (*)(id, SEL))(void *)objc_msgSend)((id)person, sel_registerName("sayHello"))

从这两段代码,我们可以看出,方法的调用在底层其实就是objc_msgSend的调用。实际代码中验证一下。
要使用objc_msgSend方法,需要导入#import ,然后关闭msg_msgSend严厉的检验机制,关闭方法如下图:

关闭消息发送严格的检查机制.png

然后在main函数中通过objc_msgSend来调用:

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        // insert code here...
        Person * person = [Person alloc];
        objc_msgSend(person, sel_registerName("sayHello"));
        objc_msgSend(objc_getClass("Person"), sel_registerName("sayHoney"));
        NSLog(@"------------------");
        [person sayHello];
        [Person sayHoney];
    }
    return 0;
}

打印结果如下:

2020-12-30 15:44:20.845622+0800 runtime感受[29642:236248] hello
2020-12-30 15:44:20.846451+0800 runtime感受[29642:236248] honey
2020-12-30 15:44:20.846557+0800 runtime感受[29642:236248] ------------------
2020-12-30 15:44:20.846638+0800 runtime感受[29642:236248] hello
2020-12-30 15:44:20.846802+0800 runtime感受[29642:236248] honey

发现,其实调用objc_msgSendoc代码的调用,结果都是一样的。
接下来我们就开始研究objc_msgSend

objc_msgSend

在源码环境搜索objc_msgSend,发现只有汇编的实现源码,我们找到在arm64下的objc_msgSend作为我们的研究对象。其源码如下,我们进行逐行的翻译

    ENTRY _objc_msgSend
    UNWIND _objc_msgSend, NoFrame

    cmp p0, #0          // nil check and tagged pointer check
#if SUPPORT_TAGGED_POINTERS
    b.le    LNilOrTagged        //  (MSB tagged pointer looks negative)
#else
    b.eq    LReturnZero
#endif
    ldr p13, [x0]       // p13 = isa
    GetClassFromIsa_p16 p13     // p16 = class
LGetIsaDone:
    // calls imp or objc_msgSend_uncached
    CacheLookup NORMAL, _objc_msgSend

#if SUPPORT_TAGGED_POINTERS
LNilOrTagged:
    b.eq    LReturnZero     // nil check

    // tagged
    adrp    x10, _objc_debug_taggedpointer_classes@PAGE
    add x10, x10, _objc_debug_taggedpointer_classes@PAGEOFF
    ubfx    x11, x0, #60, #4
    ldr x16, [x10, x11, LSL #3]
    adrp    x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGE
    add x10, x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGEOFF
    cmp x10, x16
    b.ne    LGetIsaDone

    // ext tagged
    adrp    x10, _objc_debug_taggedpointer_ext_classes@PAGE
    add x10, x10, _objc_debug_taggedpointer_ext_classes@PAGEOFF
    ubfx    x11, x0, #52, #8
    ldr x16, [x10, x11, LSL #3]
    b   LGetIsaDone
// SUPPORT_TAGGED_POINTERS
#endif

LReturnZero:
    // x0 is already zero
    mov x1, #0
    movi    d0, #0
    movi    d1, #0
    movi    d2, #0
    movi    d3, #0
    ret

    END_ENTRY _objc_msgSend
  • 判断消息的第一个参数receiver是否为空和是否为小对象类型
    • 如果为小对象类型,则执行LNilOrTagged
      • b.le LNilOrTagged
    • 如果为空,则直接返回
      • b.eq LReturnZero
    cmp p0, #0          // nil check and tagged pointer check
#if SUPPORT_TAGGED_POINTERS
    b.le    LNilOrTagged        //  (MSB tagged pointer looks negative)
#else
    b.eq    LReturnZero
#endif
  • 获取isa
    • ldr p13, [x0]
  • 获取类信息
    • GetClassFromIsa_p16 p13
  • 从缓存中获取IMP
    • CacheLookup NORMAL, _objc_msgSend

接下来进入快速查找流程CacheLookup

方法的快速查找流程

.macro CacheLookup
    //
    // Restart protocol:
    //
    //   As soon as we're past the LLookupStart$1 label we may have loaded
    //   an invalid cache pointer or mask.
    //
    //   When task_restartable_ranges_synchronize() is called,
    //   (or when a signal hits us) before we're past LLookupEnd$1,
    //   then our PC will be reset to LLookupRecover$1 which forcefully
    //   jumps to the cache-miss codepath which have the following
    //   requirements:
    //
    //   GETIMP:
    //     The cache-miss is just returning NULL (setting x0 to 0)
    //
    //   NORMAL and LOOKUP:
    //   - x0 contains the receiver
    //   - x1 contains the selector
    //   - x16 contains the isa
    //   - other registers are set as per calling conventions
    //
LLookupStart$1:

    // p1 = SEL, p16 = isa
    ldr p11, [x16, #CACHE]              // p11 = mask|buckets

#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
    and p10, p11, #0x0000ffffffffffff   // p10 = buckets
    and p12, p1, p11, LSR #48       // x12 = _cmd & mask
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
    and p10, p11, #~0xf         // p10 = buckets
    and p11, p11, #0xf          // p11 = maskShift
    mov p12, #0xffff
    lsr p11, p12, p11               // p11 = mask = 0xffff >> p11
    and p12, p1, p11                // x12 = _cmd & mask
#else
#error Unsupported cache mask storage for ARM64.
#endif

    // 0x00010
    // 0x10000

    add p12, p10, p12, LSL #(1+PTRSHIFT)
                     // p12 = buckets + ((_cmd & mask) << (1+PTRSHIFT))

    ldp p17, p9, [x12]      // {imp, sel} = *bucket
1:  cmp p9, p1          // if (bucket->sel != _cmd)
    b.ne    2f          //     scan more
    CacheHit $0         // call or return imp
    
2:  // not hit: p12 = not-hit bucket
    CheckMiss $0            // miss if bucket->sel == 0
    cmp p12, p10        // wrap if bucket == buckets
    b.eq    3f
    ldp p17, p9, [x12, #-BUCKET_SIZE]!  // {imp, sel} = *--bucket
    b   1b          // loop

3:  // wrap: p12 = first bucket, w11 = mask
#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
    add p12, p12, p11, LSR #(48 - (1+PTRSHIFT))
                    // p12 = buckets + (mask << 1+PTRSHIFT)
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
    add p12, p12, p11, LSL #(1+PTRSHIFT)
                    // p12 = buckets + (mask << 1+PTRSHIFT)
#else
#error Unsupported cache mask storage for ARM64.
#endif

    // Clone scanning loop to miss instead of hang when cache is corrupt.
    // The slow path may detect any corruption and halt later.

    ldp p17, p9, [x12]      // {imp, sel} = *bucket
1:  cmp p9, p1          // if (bucket->sel != _cmd)
    b.ne    2f          //     scan more
    CacheHit $0         // call or return imp
    
2:  // not hit: p12 = not-hit bucket
    CheckMiss $0            // miss if bucket->sel == 0
    cmp p12, p10        // wrap if bucket == buckets
    b.eq    3f
    ldp p17, p9, [x12, #-BUCKET_SIZE]!  // {imp, sel} = *--bucket
    b   1b          // loop

LLookupEnd$1:
LLookupRecover$1:
3:  // double wrap
    JumpMiss $0

.endmacro

逐行解读:


获取maskAndbuckets.png
  • 从注释我们可以看出这里,p16isa#CACHE是宏定义的16isa平移16个字节刚好就是我们的cache,所以这里的p11就是我们的cache

    获取buckets和mask.png

  • 获取buckets

    • 通过maskandbuckets与上0x0000ffffffffffff,获取存在低48位的buckets,赋值给p11
  • 获取方法存储下标

    • 首先通过maskandbuckets右移48位,获取mask
    • 然后mask在与上SEL,就得到了我们的方法下标,赋值给p12
      偏移到我们需要查找到的方法的下标.png
  • 首先计算出一个bucket占用的大小1<<4为16个字节

  • 然后index转换成2进制左移4位,相当于index*16

  • 最后通过buckets偏移index*16获取当前查找的方法的开始的位置

    从当前bucket中获取imp,sel.png

  • 从当前的bucket中获取imp赋值给p17sel赋值给p9

    对比我们获取到的sel是否为我们查找的sel.png

  • 第一次循环递归

    • 比较我们获取到的bucket中的sel与我们查找的sel是否相等
      • 如果相等则跳转至CacheHit,即缓存命中,并返回imp
      • 如果不相等,会出现两种情况:
        • 如果一直都找不到,直接跳转至CheckMiss,因为$0normal,会跳转至__objc_msgSend_uncached,即进入慢速查找流程
        • 如果根据index获取的bucket等于 buckets的第一个元素,则人为的将当前bucket设置为buckets的最后一个元素(通过buckets首地址+mask右移44位(等同于左移4位)直接定位到buckets的最后一个元素),然后继续进行递归循环(第一个递归循环嵌套第二个递归循环)
        • 如果当前bucket不等于buckets的第一个元素,则继续向前查找,进入第一次递归循环
          第二次循环递归.png
  • 在上一个代码段如果buckets的第一个元素,就会执行这段代码, 如果当前的bucket还是等于buckets的第一个元素,则直接跳转至JumpMiss,此时的$0normal,也是直接跳转至__objc_msgSend_uncached,即进入慢速查找流程

你可能感兴趣的:(方法查找流程-快速查找流程)