OC底层-cache_t探索

前言

我们知道objc_class中有ISA、superclass、cache_t、class_data_bits_t、class_rw_t等变量,我们今天主要来研究下cache_t,看看这个结构体里面存储的是什么东西。

探索

我们现创建一个类LGPerson,.h中实现如下:

.m中实现如下:

main函数实现如下:

探索方式1-lldb验证

在我们没有加载方法的时候lldb指令打印的如下:

我们发现在没有加载任何方法的时候,bucket_t里面是没有任何sel和imp的,sel是我们的方法编号,imp是个函数指针,里面有我们方法的具体实现。

当我们调用方法后,我们调试如下:

我们发现我们直接 p $4.imp()时没有出来方法的imp,而且我们的sayCode方法并没有打印出来,这是为什么呢,我们打开objc源码,发现bucket_t中部分源码如下:

我们发现在调用imp()方法时,我们需要传入一个类,cache_t这个结构体中的部分源码如下:

我们发现buckets是一个指针数组,那我们打印这个数组应该就可以打印出我们想要的sayCode方法,lldb指令如下:

通过指针地址 +1的方式或者打印buckets这个数组中的元素也可以得到我们想要的结果,顺便再说下cache_t中的部分宏定义:

CACHE_MASK_STORAGE_OUTLINED:表示macOS或者模拟器;

CACHE_MASK_STORAGE_HIGH_16:表示64位真机;

CACHE_MASK_STORAGE_LOW_4:表示非64位真机

探索方式2-脱离源码

我们创建一个LGPerson类,里面声明几个实例方法,然后在main函数中调用,main函数中实现如下:

#import

#import "LGPerson.h"

#import

typedef uint32_tmask_t;  // x86_64 & arm64 asm are less efficient with 16-bits

structlg_bucket_t {

    SEL_sel;

    IMP_imp;

};

structlg_cache_t {

    structlg_bucket_t* _buckets;

    mask_t_mask;

    uint16_t_flags;

    uint16_t_occupied;

};

structlg_class_data_bits_t {

    uintptr_tbits;

};

structlg_objc_class {

    ClassISA;

    Classsuperclass;

    struct lg_cache_tcache;            // formerly cache pointer and vtable

    struct lg_class_data_bits_tbits;    // class_rw_t * plus custom rr/alloc flags

};

intmain(intargc,constchar* argv[]) {

    @autoreleasepool {

        LGPerson*p  = [LGPersonalloc];

        ClasspClass = [LGPersonclass];  // objc_clas

        [psay1];

        [psay2];

//        [p say3];

//        [p say4];


        // _occupied  _mask 是什么  cup - 1

        // 会变化 2-3 -> 2-7

        // bucket 会有丢失  重新申请

        // 顺序有点问题  哈希


        // cache_t 底层原理

        // 线索 :


        structlg_objc_class*lg_pClass = (__bridgestructlg_objc_class*)(pClass);

        NSLog(@"%hu - %u",lg_pClass->cache._occupied,lg_pClass->cache._mask);

        for(mask_ti =0; icache._mask; i++) {

            // 打印获取的 bucket

            structlg_bucket_tbucket = lg_pClass->cache._buckets[i];

            NSLog(@"%@ - %p",NSStringFromSelector(bucket._sel),bucket._imp);

        }


        NSLog(@"Hello, World!");

    }

    return0;

}

加上ISA属性后,增加两个方法的调用,其正确的打印结果应该是这样的:

在增加两个方法的调用,即解开say3、say4的注释,其打印结果如下

接下来我们需要探索_mask是什么吗?_occupied 是什么?

cache_t中有个函数incrementOccupied,然后我们发现它在cache_t::insert方法中调用部分源码如下:

insert方法,理解为cache_t的插入,而cache中存储的就是sel-imp,所以cache的原理从insert方法开始分析,以下是cache原理分析的流程图:

cache_t流程图

insert方法分析

根据occupied的值计算出当前的缓存占用量,当属性未赋值及无方法调用时,此时的occupied()为0,而newOccupied为1,如下所示

mask_t newOccupied=occupied()+1;

关于缓存占用量的计算,有以下几点说明:

alloc申请空间时,此时的对象已经创建,如果再调用init方法,occupied也会+1

当有属性赋值时,会隐式调用set方法,occupied也会增加,即有几个属性赋值,occupied就会在原有的基础上加几个

当有方法调用时,occupied也会增加,即有几次调用,occupied就会在原有的基础上加几个

如果是第一次创建,则默认开辟4个

如果缓存占用量小于等于3/4,则不作任何处理

如果缓存占用量超过3/4,则需要进行两倍扩容以及重新开辟空间

根据cache_hash方法,即哈希算法,计算sel-imp存储的哈希下标,分为以下三种情况:

如果哈希下标的位置未存储sel,即该下标位置获取sel等于0,此时将sel-imp存储进去,并将occupied占用大小加1

如果当前哈希下标存储的sel等于即将插入的sel,则直接返回

如果当前哈希下标存储的sel不等于即将插入的sel,则重新经过cache_next方法 即哈希冲突算法,重新进行哈希计算,得到新的下标,再去对比进行存储

总结

_mask是指掩码数据,用于在哈希算法或者哈希冲突算法中计算哈希下标,其中mask 等于capacity - 1

_occupied表示哈希表中sel-imp的占用大小(即可以理解为分配的内存中已经存储了sel-imp的的个数),init会导致occupied变化

属性赋值,也会隐式调用,导致occupied变化

方法调用,导致occupied变化

在cache初始化时,分配的空间是4个,随着方法调用的增多,当存储的sel-imp个数,即newOccupied + CACHE_END_MARKER(等于1)的和 超过 总容量的3/4,例如有4个时,当occupied等于2时,就需要对cache的内存进行两倍扩容

你可能感兴趣的:(OC底层-cache_t探索)