iOS - objc_msgSend分析

Objective-C 是一个动态语言,在动态中创建类和对象、进行消息传递和转发。想要更好的理解 Objective-C 那就离不开 Runtime(运行时) 。

什么是Runtime?

Runtime是用C、C++、汇编编写的一套为OC提供运行时功能的api

初见objc_msgSend

创建一个Student的类

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        Student *student = [[Student alloc] init];
        [student study]; 
    }
    return 0;
}

在终端使用clang命令将main.m编译成main.cpp

clang -rewrite-objc main.m

此时我们会发现main.m文件的下方会多出一个main.cpp的文件,打开并移动到最下方我们看到如下一段代码:

int main(int argc, const char * argv[]) {
    /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool; 
        Student *student = ((Student *(*)(id, SEL))(void *)objc_msgSend)((id)((Student *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("Student"), sel_registerName("alloc")), sel_registerName("init"));
        ((void (*)(id, SEL))(void *)objc_msgSend)((id)student, sel_registerName("study"));
    }
    return 0;
}

我们发现在student创建和调用study的方法是,都调用了objc_msgSend,那么objc_msgSend到底是什么?其作用又是什么呢?

通过汇编初探objc_msgSend

通过打断点,查看汇编我们发现objc_msgSend的实现是在libobjc动态链接库中(objc4源码)。在libobjc源码库中全局搜索objc_msgSend,发现它的实现是用汇编写的。
下面我们就以arm64系统下的汇编就行分析,全部搜索objc_msgSend找到objc-msg-arm64.s文件,找到ENTRY _objc_msgSend,方法的进入是从ENTRY开始的:


    ENTRY _objc_msgSend
    UNWIND _objc_msgSend, NoFrame

    cmp p0, #0 //arm64下有31位寄存器; 对比0号寄存器是否为空, 如果为空则代表当前接受着没有,如果为空则返回nil

#if SUPPORT_TAGGED_POINTERS
    b.le    LNilOrTagged        //  (MSB tagged pointer looks negative)
#else
    b.eq    LReturnZero
#endif
    // [x0]是消息接收者
   //如果我们要对student发送消息,我们需要用到用到对象方法时我们就可以通过isa找到类Student,如果是类方法是我们则需要isa来找到元类
    ldr p13, [x0]       // p13 = isa
//通过isa寻找类
    GetClassFromIsa_p16 p13     // p16 = class
LGetIsaDone://查找isa完毕
    CacheLookup NORMAL//读取方法        // calls imp or objc_msgSend_uncached

#if SUPPORT_TAGGED_POINTERS
LNilOrTagged:
    b.eq    LReturnZero     // nil check
GetClassFromIsa_p16
.macro GetClassFromIsa_p16 /* src */

#if SUPPORT_INDEXED_ISA
    // Indexed isa
    mov p16, $0         // optimistically set dst = src
//判断当前是否为non-pointer isa 
    tbz p16, #ISA_INDEX_IS_NPI_BIT, 1f  // done if not non-pointer isa
    // isa in p16 is indexed
    adrp    x10, _objc_indexed_classes@PAGE
    add x10, x10, _objc_indexed_classes@PAGEOFF
    ubfx    p16, p16, #ISA_INDEX_SHIFT, #ISA_INDEX_BITS  // extract index
    ldr p16, [x10, p16, UXTP #PTRSHIFT] // load class from array
1:

#elif __LP64__
    // 64-bit packed isa
    and p16, $0, #ISA_MASK

#else
    // 32-bit raw isa
    mov p16, $0

#endif

.endmacro
CacheLookup
.macro CacheLookup
    // p1 = SEL, p16 = isa
    ldp p10, p11, [x16, #CACHE]//在cache_t一文中我们提到了要拿到方法缓存需要首地址平移16个字节    // p10 = buckets, p11 = occupied|mask
#if !__LP64__//w11用w是因为mask是32位的,不需要用64位的
    and w11, w11, 0xffff    // p11 = mask
#endif
/**
static inline mask_t cache_hash(cache_key_t key, mask_t mask) 
{
    return (mask_t)(key & mask);
}
*/
    and w12, w1, w11        // x12 = _cmd & mask
    add p12, p10, p12, LSL #(1+PTRSHIFT)
                     // p12 = buckets + ((_cmd & mask) << (1+PTRSHIFT))

    ldp p17, p9, [x12]      // {imp, sel} = *bucket
1:  cmp p9, p1          // if (bucket->sel != _cmd)
    b.ne    2f  //没找到就继续找2流程        //     scan more
    CacheHit $0 //缓存命中,即找到了直接返回     // call or return imp
    
2:  // not hit: p12 = not-hit bucket
    CheckMiss $0            // miss if bucket->sel == 0
    cmp p12, p10        // wrap if bucket == buckets
    b.eq    3f//找到了,再去走3流程,是为了存一份缓存,方便下一次填充缓存
    ldp p17, p9, [x12, #-BUCKET_SIZE]!  // {imp, sel} = *--bucket
    b   1b          // loop

3:  // wrap: p12 = first bucket, w11 = mask
    add p12, p12, w11, UXTW #(1+PTRSHIFT)
                                // p12 = buckets + (mask << 1+PTRSHIFT)

    // Clone scanning loop to miss instead of hang when cache is corrupt.
    // The slow path may detect any corruption and halt later.

    ldp p17, p9, [x12]      // {imp, sel} = *bucket
1:  cmp p9, p1          // if (bucket->sel != _cmd)
    b.ne    2f          //     scan more
    CacheHit $0         // call or return imp
    
2:  // not hit: p12 = not-hit bucket
    CheckMiss $0            // miss if bucket->sel == 0
    cmp p12, p10        // wrap if bucket == buckets
    b.eq    3f
    ldp p17, p9, [x12, #-BUCKET_SIZE]!  // {imp, sel} = *--bucket
    b   1b          // loop

3:  // double wrap
    JumpMiss $0
    
.endmacro
如果缓存没有命中的话会走CheckMiss方法
//CacheLookup NORMAL|GETIMP|LOOKUP 
.macro CheckMiss
    // miss if bucket->sel == 0
.if $0 == GETIMP
    cbz p9, LGetImpMiss
.elseif $0 == NORMAL
    cbz p9, __objc_msgSend_uncached
.elseif $0 == LOOKUP
    cbz p9, __objc_msgLookup_uncached
.else
.abort oops
.endif
.endmacro
NORMAL 模式下走__objc_msgSend_uncached方法
STATIC_ENTRY __objc_msgSend_uncached
    UNWIND __objc_msgSend_uncached, FrameWithNoSaves

    // THIS IS NOT A CALLABLE C FUNCTION
    // Out-of-band p16 is the class to search
    
    MethodTableLookup
    TailCallFunctionPointer x17

    END_ENTRY __objc_msgSend_uncached

有上面代码可知,接下来会进入MethodTableLookup流程:

MethodTableLookup
//方法存在bits->rw->ro的methodList中
.macro MethodTableLookup
    
    // push frame
    SignLR
    stp fp, lr, [sp, #-16]!
    mov fp, sp

    // save parameter registers: x0..x8, q0..q7
    sub sp, sp, #(10*8 + 8*16)
    stp q0, q1, [sp, #(0*16)]
    stp q2, q3, [sp, #(2*16)]
    stp q4, q5, [sp, #(4*16)]
    stp q6, q7, [sp, #(6*16)]
    stp x0, x1, [sp, #(8*16+0*8)]
    stp x2, x3, [sp, #(8*16+2*8)]
    stp x4, x5, [sp, #(8*16+4*8)]
    stp x6, x7, [sp, #(8*16+6*8)]
    str x8,     [sp, #(8*16+8*8)]

    // receiver and selector already in x0 and x1
    mov x2, x16
    bl  __class_lookupMethodAndLoadCache3

    // IMP in x0
    mov x17, x0
    
    // restore registers and return
    ldp q0, q1, [sp, #(0*16)]
    ldp q2, q3, [sp, #(2*16)]
    ldp q4, q5, [sp, #(4*16)]
    ldp q6, q7, [sp, #(6*16)]
    ldp x0, x1, [sp, #(8*16+0*8)]
    ldp x2, x3, [sp, #(8*16+2*8)]
    ldp x4, x5, [sp, #(8*16+4*8)]
    ldp x6, x7, [sp, #(8*16+6*8)]
    ldr x8,     [sp, #(8*16+8*8)]

    mov sp, fp
    ldp fp, lr, [sp], #16
    AuthenticateLR

.endmacro

由上面汇编可知,其最终要查找的是__class_lookupMethodAndLoadCache3方法,当我们在汇编中并搜索不到该方法的实现,通过前面x0..x8, q0..q7的准备工作我们猜想,其可能是为调用C或者C++的方法做准备,当我们全局搜索_class_lookupMethodAndLoadCache3时发现在objc-rutime-new.mm文件中找到了该方法的实现

IMP _class_lookupMethodAndLoadCache3(id obj, SEL sel, Class cls)
{
    return lookUpImpOrForward(cls, sel, obj, 
                              YES/*initialize*/, NO/*cache*/, YES/*resolver*/);
}

这个函数开始就是我们熟知的C/C++的代码了,我们终于也不用再看汇编部分的代码了,消息发送从快速查找过渡到了慢速查找流程。

总结:

在编译期调用 objc_msgSend 函数 , 在汇编代码执行缓存查找 sel 对应的 imp , 找到就会返回调用 , 找不到则由快速查找过渡到了慢速查找流程。

拓展isKindOfClass和isMemberOfClass
int main(int argc, const char * argv[]) {
    @autoreleasepool {

        BOOL re1 = [(id)[NSObject class] isKindOfClass:[NSObject class]];       //
        BOOL re2 = [(id)[NSObject class] isMemberOfClass:[NSObject class]];     //
        BOOL re3 = [(id)[LGPerson class] isKindOfClass:[LGPerson class]];       //
        BOOL re4 = [(id)[LGPerson class] isMemberOfClass:[LGPerson class]];     //
        NSLog(@" re1 :%hhd\n re2 :%hhd\n re3 :%hhd\n re4 :%hhd\n",re1,re2,re3,re4);

        BOOL re5 = [(id)[NSObject alloc] isKindOfClass:[NSObject class]];       //
        BOOL re6 = [(id)[NSObject alloc] isMemberOfClass:[NSObject class]];     //
        BOOL re7 = [(id)[LGPerson alloc] isKindOfClass:[LGPerson class]];       //
        BOOL re8 = [(id)[LGPerson alloc] isMemberOfClass:[LGPerson class]];     //
        NSLog(@" re5 :%hhd\n re6 :%hhd\n re7 :%hhd\n re8 :%hhd\n",re5,re6,re7,re8);
    }
    return 0;
}
+ (BOOL)isKindOfClass:(Class)cls;
+ (BOOL)isKindOfClass:(Class)cls {
    for (Class tcls = object_getClass((id)self); tcls; tcls = tcls->superclass) {
        if (tcls == cls) return YES;
    }
    return NO;
}

由self获取到元类,如果相等就返回YES,不相等就继续找元类的父类也就是NSObject, [NSObject class]的类明显就是NSObject因此[(id)[NSObject class] isKindOfClass:[NSObject class]]返回值为1,同理[(id)[LGPerson class] isKindOfClass:[LGPerson class]]的类为LGPerson,无论是元类还是元类的父类都不可能为LGPerson,因此此处返回为0;

+ (BOOL)isMemberOfClass:(Class)cls;
+ (BOOL)isMemberOfClass:(Class)cls {
//就是元类和类做对比,如果相等返回1,不想等返回0
    return object_getClass((id)self) == cls;
}

元类和类肯定是不一样的,因此[(id)[NSObject class] isMemberOfClass:[NSObject class]]和[(id)[LGPerson class] isMemberOfClass:[LGPerson class]]返回值皆为0;

- (BOOL)isKindOfClass:(Class)cls;
- (BOOL)isKindOfClass:(Class)cls {
    for (Class tcls = [self class]; tcls; tcls = tcls->superclass) {
        if (tcls == cls) return YES;
    }
    return NO;
}

第一步都是对比类,例如: [(id)[NSObject alloc] isKindOfClass:[NSObject class]]第一步就是对比该类是不是NSObject类,如果是直接返回1,明显[NSObject alloc]就是NSObject类,所以此时返回为1,同理 [(id)[LGPerson alloc] isKindOfClass:[LGPerson class]] 返回值也为1;

- (BOOL)isMemberOfClass:(Class)cls;
- (BOOL)isMemberOfClass:(Class)cls {
    return [self class] == cls;
}

对比cls和[self class]是都相同,和isKindOfClass区别在于, isKindOfClass如果第一步不同的时候还会往父类去查找,容错更高一些,明显[(id)[NSObject alloc] isMemberOfClass:[NSObject class]]和[(id)[LGPerson alloc] isMemberOfClass:[LGPerson class]]返回值皆为1;

至此我们可以知道答应的结果应该是:

2020-01-27 23:03:06.936314+0800 Test[8438:1379585]  re1 :1
 re2 :0
 re3 :0
 re4 :0
2020-01-27 23:03:06.938168+0800 Test[8438:1379585]  re5 :1
 re6 :1
 re7 :1
 re8 :1

你可能感兴趣的:(iOS - objc_msgSend分析)