iOS底层之objc_msgSend快速查找流程

在iOS底层之cache_t探究分析了方法写入缓存的流程。类似于数据库的增删改查,OC对象在调用方法的时候,在写入缓存之前,也会先执行查找缓存的过程。下面我们来分析objc_msgSend消息发送过程中是怎么查找方法缓存的。
首先,我们先了解下Runtime的机制。

Runtime

Runtime,顾名思义,即运行时,区别于编译时。

  • 编译时:就是正在编译的时刻。 而编译,就是编译器把
    源代码翻译成机器能识别的代码(实际上可能只是翻译成某个中间状态的语言)。编译时,做了一些检查、翻译的工作。会检查你的关键字、词法、语法,如果发现了错误,就会编译不通过,提示错误信息。这个过程也会进行静态类型分析,这时候只是扫描代码而已,并没有真正放到内存中运行,也不存在分配内存。
  • 运行时:将代码运行起来,装载到内存中去。而运行时做的类型检查就跟编译时类型检查(静态类型检查)不一样,不是简单的扫描代码,会将其运行在内存中做些判断和操作。例如我们通过使用performSelector给对象发送执行方法选择器的消息的方式,就是运行时的操作。

Runtime的使用方式有三种:

  1. Objective-C,例如[person eat];,类的实例对象调用方法;
  2. 通过框架和接口引入,比如isKindOf
  3. 通过Runtime API,比如class_getInstanceSize

其层级可以表示为


也就是Runtime通过编译层到底层库,比如alloc方法是通过发送消息在LLVM编译阶段以objc_alloc实现的。

OC运行时

#import 
#import 

@interface BKPerson : NSObject
- (void)sayHello;
@end

@implementation BKPerson
- (void)sayHello{
    NSLog(@"Hello!");
}
@end

@interface Man : BKPerson
- (void)sayHello;
- (void)sayBye;
@end

@implementation Man
- (void)sayBye{
    NSLog(@"88");
}
@end

定义两个类,Man继承于BKPerson
将下列方法Clang编译成.cpp文件,可以看到

Man *man = [Man alloc];
[man sayBye];
[man sayHello];
//.cpp
Man *man = ((Man *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("Man"), sel_registerName("alloc"));
((void (*)(id, SEL))(void *)objc_msgSend)((id)man, sel_registerName("sayBye"));
((void (*)(id, SEL))(void *)objc_msgSend)((id)man, sel_registerName("sayHello"));

可以发现,实例对象调用方法,本质是通过objc_msgSend实现的。

为了验证这个发现。以objc_msgSend方法方式来调用[man sayBye]

Man *man = [Man alloc];
objc_msgSend(man, sel_registerName("sayBye"));
[man sayBye];

打印如下,两种方式打印的结果一致,验证成功。


拓展:
1、调用objc_msgSend,需要导入头文件#import
2、使用obc_msgSend方法时,编译器会有参数错误警告。 需要将target -->Build Setting -->搜索msg -- 将enable strict checking of obc_msgSend callsYES 改为NO,将严厉的检查机制关掉。

实例方法调用机制初探

@interface BKPerson : NSObject
- (void)sayHello;
@end

@implementation BKPerson
- (void)sayHello{
    NSLog(@"Hello!");
}
@end

@interface Man : BKPerson
- (void)sayHello;
- (void)sayBye;
@end

@implementation Man
- (void)sayBye{
    NSLog(@"88");
}

上面的代码,Man继承自BKPersonBKPerson实现了sayHello方法,Man却没有实现sayHello方法。
消息的接收者都是Man的实例对象,分别使用OC对象调用和C语言API调用的方式:

  1. OC中对象调用:
Man *man = [Man alloc];
BKPerson *person = [BKPerson alloc];
[man sayHello];
  1. 直接调用底层CAPI
struct objc_super mansuper;
mansuper.receiver = man;
mansuper.super_class = [BKPerson class];
objc_msgSendSuper(&mansuper, sel_registerName("sayHello"));

objc_msgSendSuper的定义:

OBJC_EXPORT id _Nullable
objc_msgSendSuper(struct objc_super * _Nonnull super, SEL _Nonnull op, ...)
    OBJC_AVAILABLE(10.0, 2.0, 9.0, 1.0, 2.0);
struct objc_super {
    /// Specifies an instance of a class.
    __unsafe_unretained _Nonnull id receiver;

    /// Specifies the particular superclass of the instance to message. 
#if !defined(__cplusplus)  &&  !__OBJC2__
    /* For compatibility with old objc-runtime.h header */
    __unsafe_unretained _Nonnull Class class;
#else
    __unsafe_unretained _Nonnull Class super_class;
#endif
    /* super_class is the first class to search */
};

__OBJC2__需要指定receiversuper_class

执行打印结果:


Man并没有实现sayHello,却不会崩溃,而且两种方式都打印出了方法里的信息。猜测原因在于其父类实现了sayHello
那么可猜想,类的实例方法调用的查找是会向父类查找。而方法调用的本质是objc_msgSend发送消息,那么它是怎么通过调用的方法编号sel找到imp函数地址指针,从而找到函数内容的呢?
带着这个疑惑我们来查看objc_msgSend的流程。

objc_msgSend快速查找流程

首先要知道objc_msgSend是通过汇编语言写的,区别于C/C++实现的源码,优势是汇编快,由于方法查找是经常发生的高频率的事务,所以如果能提高一点点速度,那么在运行中进程的量级上是一个质的飞跃。另外一点是为了实现参数的不确定性(动态性),而C/C++大多使用静态方法,要实现动态性则麻烦得多。
objc_msgSend消息的接收者是对象,对象和方法的关系是:对象 ->ISA -> 类(元类)-> class->data()->methods()。由于会先查找方法缓存,会从类(元类)->cache_t -> buckets()查找缓存bucket_t,这一步称为objc_msgSend快速查找。

第一步.获取isa的类信息
objc4-781源码中,搜索objc_msgSend,在arm64.s后缀的文件中查找objc_msgSend汇编实现。入口函数为

其汇编实现如下:

    //消息发送汇编入口:这一步主要获取isa类信息
    ENTRY _objc_msgSend
    //无窗口化
    UNWIND _objc_msgSend, NoFrame
    //p0存放是objc_msgSend的第一个参数-消息接收者receiver,receiver和空对比,判断消息接收者是否存在
    cmp p0, #0          // nil check and tagged pointer check
//是否支持小对象类型,在arm64架构下,恒为true
#if SUPPORT_TAGGED_POINTERS
    //1.支持则走小对象流程
    b.le    LNilOrTagged        //  (MSB tagged pointer looks negative)
#else
    //0.不支持则返回空
    b.eq    LReturnZero
#endif
    //p13存放isa
    ldr p13, [x0]       // p13 = isa
    //从p13的isa中获取class,放在p16
    GetClassFromIsa_p16 p13     // p16 = class
LGetIsaDone://获取isa完毕
    // calls imp or objc_msgSend_uncached
    //开始从缓存中获取imp地址(CacheLookup方法参数为NORMAL)
    CacheLookup NORMAL, _objc_msgSend

#if SUPPORT_TAGGED_POINTERS
LNilOrTagged://小对象流程
    //判断为空则返回空
    b.eq    LReturnZero     // nil check

    // tagged
    adrp    x10, _objc_debug_taggedpointer_classes@PAGE
    add x10, x10, _objc_debug_taggedpointer_classes@PAGEOFF
    ubfx    x11, x0, #60, #4
    ldr x16, [x10, x11, LSL #3]
    adrp    x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGE
    add x10, x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGEOFF
    cmp x10, x16
    b.ne    LGetIsaDone

    // ext tagged
    adrp    x10, _objc_debug_taggedpointer_ext_classes@PAGE
    add x10, x10, _objc_debug_taggedpointer_ext_classes@PAGEOFF
    ubfx    x11, x0, #52, #8
    ldr x16, [x10, x11, LSL #3]
    b   LGetIsaDone
// SUPPORT_TAGGED_POINTERS
#endif

LReturnZero:
    // x0 is already zero
    mov x1, #0
    movi    d0, #0
    movi    d1, #0
    movi    d2, #0
    movi    d3, #0
    ret

    END_ENTRY _objc_msgSend

GetClassFromIsa_p16获取类信息的汇编实现:

.macro GetClassFromIsa_p16 /* src */
//是否支持INDEXED_ISA
#if SUPPORT_INDEXED_ISA 
//# if  __ARM_ARCH_7K__ >= 2  ||  (__arm64__ && !__LP64__)
    // 仅支持armv7k or arm64_32
    // Indexed isa
    //将isa指针存入p16
    mov p16, $0         // optimistically set dst = src
    //判断是否是 non-pointer isa
    tbz p16, #ISA_INDEX_IS_NPI_BIT, 1f  // done if not non-pointer isa
    // isa in p16 is indexed
    //将_objc_indexed_classes所在页的基址 读入x10寄存器
    adrp    x10, _objc_indexed_classes@PAGE
    //x10 = x10 + _objc_indexed_classes(偏移量),对x10基址根据偏移量进行内存偏移
    add x10, x10, _objc_indexed_classes@PAGEOFF
    //将p16的isa从第ISA_INDEX_SHIFT位(第2位)开始,提取 ISA_INDEX_BITS 位(15位) 到 p16寄存器,剩余的高位用0补充
    ubfx    p16, p16, #ISA_INDEX_SHIFT, #ISA_INDEX_BITS  // extract index
    ldr p16, [x10, p16, UXTP #PTRSHIFT] // load class from array
1:

//arm64架构64位处理器
#elif __LP64__
    // 64-bit packed isa
    //p16的isa & ISA_MASK 得到class存到p16
    and p16, $0, #ISA_MASK

#else
    // 32-bit raw isa
    mov p16, $0

#endif

.endmacro

主要流程是:

  • 获取isa指针,判断是否为空,空则返回。
  • 非空时判断是否支持tagged pointer小对象类型,支持则走小对象流程。不支持则返回空。
  • 之后获取isa中的类信息。通过isa & ISA_MASK 获取bitsshiftcls位域的类信息class

第二步.CacheLookup查找缓存

#define CACHE            (2 * __SIZEOF_POINTER__)
.macro CacheLookup
    //
    // Restart protocol:
    //
    //   As soon as we're past the LLookupStart$1 label we may have loaded
    //   an invalid cache pointer or mask.
    //
    //   When task_restartable_ranges_synchronize() is called,
    //   (or when a signal hits us) before we're past LLookupEnd$1,
    //   then our PC will be reset to LLookupRecover$1 which forcefully
    //   jumps to the cache-miss codepath which have the following
    //   requirements:
    //
    //   GETIMP:
    //     The cache-miss is just returning NULL (setting x0 to 0)
    //
    //   NORMAL and LOOKUP:
    //   - x0 contains the receiver
    //   - x1 contains the selector
    //   - x16 contains the isa
    //   - other registers are set as per calling conventions
    //
LLookupStart$1:

    // p1 = SEL, p16 = isa
    //从isa平移16字节到cache_t
    ldr p11, [x16, #CACHE]              // p11 = mask|buckets

#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
    //p11 & 0x0000ffffffffffff 取出buckets放在p10
    and p10, p11, #0x0000ffffffffffff   // p10 = buckets
    //将p11右移48位,得出mask,p1(_cmd) & mask取出了缓存的下标 放在p12
    and p12, p1, p11, LSR #48       // x12 = _cmd & mask
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
    and p10, p11, #~0xf         // p10 = buckets
    and p11, p11, #0xf          // p11 = maskShift
    mov p12, #0xffff
    lsr p11, p12, p11               // p11 = mask = 0xffff >> p11
    and p12, p1, p11                // x12 = _cmd & mask
#else
#error Unsupported cache mask storage for ARM64.
#endif

    //buckets首地址向左平移 _cmd下标 * 1<<4(16),得到所在bucket,放在p12
    add p12, p10, p12, LSL #(1+PTRSHIFT)
                     // p12 = buckets + ((_cmd & mask) << (1+PTRSHIFT))
    //从p12拿到imp、sel,存入p17、p9
    ldp p17, p9, [x12]      // {imp, sel} = *bucket
    //比较p9上的sel是否等于p1的cmd
1:  cmp p9, p1          // if (bucket->sel != _cmd)
    //如果不相等,则跳到2f
    b.ne    2f          //     scan more
    //相等,则缓存命中,返回imp
    CacheHit $0         // call or return imp
    
    //2f:如果没有命中就走到这里
2:  // not hit: p12 = not-hit bucket
    //判断bucket的sel是否为空,空则执行CheckMiss,因为是NORMAL类型,所以__objc_msgSend_uncached,表示找不到缓存
    CheckMiss $0            // miss if bucket->sel == 0
    //比较p12的bucket和p10的buckets的首地址,也就是第一个bucket,也就是判断当前的bucket是否是第一个
    cmp p12, p10        // wrap if bucket == buckets
    //相等,则跳转第三步
    b.eq    3f
    //从p12的地址向前平移一个bucket的size,得到的bucket的imp和sel分别存入p17,p9
    ldp p17, p9, [x12, #-BUCKET_SIZE]!  // {imp, sel} = *--bucket
    //重复第一步,对比sel和cmd
    b   1b          // loop

//如果计算的下标是在第一个,则执行第三步
3:  // wrap: p12 = first bucket, w11 = mask
#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
    //p11(mask|buckets)右移44位,相当于mask左移4位,也就是mask * 16, 而mask是buckets最后一个元素的下标,16为存储着sel和imp的bucket的size,这一步相当于将地址平移到最后一个bucket,将该bucket存储于p12,缓存查找顺序是向前查找
    add p12, p12, p11, LSR #(48 - (1+PTRSHIFT))
                    // p12 = buckets + (mask << 1+PTRSHIFT)
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
    add p12, p12, p11, LSL #(1+PTRSHIFT)
                    // p12 = buckets + (mask << 1+PTRSHIFT)
#else
#error Unsupported cache mask storage for ARM64.
#endif

    // Clone scanning loop to miss instead of hang when cache is corrupt.
    // The slow path may detect any corruption and halt later.

    //将最后的bucket的imp、sel分别放在p17、p9
    ldp p17, p9, [x12]      // {imp, sel} = *bucket
//--- 比较p9的sel和传入参数cmd是否一致
1:  cmp p9, p1          // if (bucket->sel != _cmd)
    //--- 不一致则跳到步骤2f(继续往前查找)
    b.ne    2f          //     scan more
    //--- 一致则命中,返回imp
    CacheHit $0         // call or return imp
    
2:  // not hit: p12 = not-hit bucket
    //--- 判断是否为空,空则执行CheckMiss里的($0 == NORMAL)分支的指令__objc_msgSend_uncached,未命中缓存
    CheckMiss $0            // miss if bucket->sel == 0
    //--- 比较p12和第一个bucket p10 是否一致,也就是判断是否是当前比较的是第一个bucket了,再往前已经没有了
    cmp p12, p10        // wrap if bucket == buckets
    //--- 如果是第一个,则跳到3f
    b.eq    3f
    //--- 不是第一个,则向前平移BUCKET_SIZE,找前一个bucket,imp、sel分别放入p17,p9
    ldp p17, p9, [x12, #-BUCKET_SIZE]!  // {imp, sel} = *--bucket
    //--- 返回第一步,继续对比sel和cmd
    b   1b          // loop

LLookupEnd$1:
LLookupRecover$1:
3:  // double wrap
//--- 跳转到jumpMiss,因为是normal,跳转至__objc_msgSend_uncached,表示缓存没找到
    JumpMiss $0

.endmacro

// 以下是跳转的函数
// CacheHit: x17 = cached IMP, x12 = address of cached IMP, x1 = SEL, x16 = isa
.macro CacheHit
.if $0 == NORMAL
    TailCallCachedImp x17, x12, x1, x16 // authenticate and call imp
.elseif $0 == GETIMP
    mov p0, p17
    cbz p0, 9f          // don't ptrauth a nil imp
    AuthAndResignAsIMP x0, x12, x1, x16 // authenticate imp and re-sign as IMP
9:  ret             // return IMP
.elseif $0 == LOOKUP
    // No nil check for ptrauth: the caller would crash anyway when they
    // jump to a nil IMP. We don't care if that jump also fails ptrauth.
    AuthAndResignAsIMP x17, x12, x1, x16    // authenticate imp and re-sign as IMP
    ret             // return imp via x17
.else
.abort oops
.endif
.endmacro

.macro CheckMiss
    // miss if bucket->sel == 0
//--- $0:传入的第一个参数,也就是方法执行的类型,根据不同的类型,执行不同指令
.if $0 == GETIMP
    cbz p9, LGetImpMiss
.elseif $0 == NORMAL
    cbz p9, __objc_msgSend_uncached
.elseif $0 == LOOKUP
    cbz p9, __objc_msgLookup_uncached
.else
.abort oops
.endif
.endmacro

.macro JumpMiss
.if $0 == GETIMP
    b   LGetImpMiss
.elseif $0 == NORMAL
    b   __objc_msgSend_uncached
.elseif $0 == LOOKUP
    b   __objc_msgLookup_uncached
.else
.abort oops
.endif
.endmacro

这一步是查找缓存,CacheLookup传入的类型为normal64位处理器下的主要流程为:

  1. isa平移16字节获取到cache_tcache_t的首地址存放着 mask|buckets(32位处理器是buckets),放在一个8字节,将mask|buckets & 0x0000ffffffffffff得到了bucketsmask|buckets右移48位,得到mask,通过cmd & mask取出了缓存bucket的下标,cmd(sel) & mask的算法是在方法缓存的时候计算哈希下标的算法,所以查找缓存也是用这个算法。
static inline mask_t cache_hash(SEL sel, mask_t mask) 
{
    return (mask_t)(uintptr_t)sel & mask;
}

buckets + ((_cmd & mask) << (1+PTRSHIFT))buckets首地址向后平移下标*16。算出所在的下标的bucket。因为selimp各占8字节,即一个bucketsize16字节。这样得到了bucketimpsel

  • 步骤1:比较这个bucketsel是否等于我们传入的cmd,如果不相等,则跳到步骤2,相等则缓存命中,返回bucketimp
  • 步骤2:判断当前bucketsel是否为空,空则执行__objc_msgSend_uncached,表示这个方法没有缓存。非空,则判断bucket是不是第一个bucket,是第一个则跳转到步骤3,否则将bucket向前平移一个BUCKET_SIZE,找前面的一个bucket,返回执行步骤1。
  • 步骤3:如果是第一个bucket,将mask|buckets右移44位,相当于mask左移4位,也就是mask * 16, 而maskbuckets最后一个元素的下标,16为存储着selimpbucketsize,这一步相当于将地址平移到最后一个bucket,获得最后一个bucketselimp,这步骤3里也分了3个分支。
  1. 注意这里是双层嵌套,下面是第二层
  • 步骤3分支1:比较这个bucketsel是不是等于传入的cmd,不一致跳到分支2,一致则缓存命中,返回imp。
  • 步骤3分支2:如果是从最后一个元素遍历过来的,当前bucketsel0,也就是这个槽没有缓存,则执行CheckMiss,因为是NORMAL类型,所以__objc_msgSend_uncached,表示找不到缓存。如果sel不是0,判断这个bucket是不是第一个bucket,是的话就跳转到分支3,不是第一个,那么向前平移16字节获取前面一个bucket,获取它的selimp,返回执行分支1。
  • 步骤3分支3:跳转到jumpMiss,因为是NORMAL,跳转至__objc_msgSend_uncached,表示缓存没找到。

如果经历CacheLookup后没找到缓存,则会开始慢速查找,从methodList查找。

整个快速查找流程图:


objc_msgSend快速查找流程

你可能感兴趣的:(iOS底层之objc_msgSend快速查找流程)