iOS-底层原理7:isa与类关联的原理

问题

OC对象的本质到底是什么?里面到底是什么结构呢?

探索

在探索oc对象本质前,先了解一个编译器:clang

clang

  • clang是一个由Apple主导编写,基于LLVMC/C++/OC的编译器
  • 主要是用于底层编译,将一些文件输出成c++文件,例如main.m 输出成main.cpp,其目的是为了更好的观察底层的一些结构 及 实现的逻辑,方便理解底层原理。

操作指令

//1、将 main.m 编译成 main.cpp
clang -rewrite-objc main.m -o main.cpp

//2、将 ViewController.m 编译成  ViewController.cpp
clang -rewrite-objc -fobjc-arc -fobjc-runtime=ios-13.0.0 -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator13.7.sdk ViewController.m

//以下两种方式是通过指定架构模式的命令行,使用xcode工具 xcrun
//3、模拟器文件编译
xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp 

//4、真机文件编译
xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp 

代码分析

Step1: 在main中自定义一个类LBHPerson,有一个属性name

@interface LBHPerson : NSObject
@property (nonatomic, copy) NSString *name;
@end

@implementation LBHPerson
@end

step2:打开终端,cdmain.m的文件夹,输入clang指令: clang -rewrite-objc main.m -o main.cppmain.m编译成 main.cpp

step3:找到main.cppLBHPerson定义相关的代码

//LGPerson的底层编译
struct LBHPerson_IMPL {
    struct NSObject_IMPL NSObject_IVARS;
    NSString *_name;
};

//NSObject 的底层编译
struct NSObject_IMPL {
    Class isa;
};
  • 可以直接搜索定义的类名,如:LBHPerson
  • 为了保证在.cpp中找到的代码是对的,可以在LBHPerson类中添加属性重新转成cpp代码,然后比较两份cpp代码,找到类定义的正确的c++代码

总结:

OC对象的本质是结构体,每一个结构体都有一个Class isa

探究属性get、set方法

iOS-底层原理7:isa与类关联的原理_第1张图片

isa

C++源码中得知类中存在一个isa,那么isa又是什么?有什么作用呢?

objc4源码分析

通过alloc --> _objc_rootAlloc --> callAlloc --> _objc_rootAllocWithZone --> _class_createInstanceFromZone方法路径,查找到initInstanceIsa

step1:在objc4源码中找到initInstanceIsa函数

inline void 
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
    ASSERT(!cls->instancesRequireRawIsa());
    ASSERT(hasCxxDtor == cls->hasCxxDtor());
    //调用initIsa函数
    initIsa(cls, true, hasCxxDtor);
}

step2:进入initIsa函数

inline void 
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor) 
{ 
    ASSERT(!isTaggedPointer()); 
    
    if (!nonpointer) {
        isa = isa_t((uintptr_t)cls);
    } else {
        ASSERT(!DisableNonpointerIsa);
        ASSERT(!cls->instancesRequireRawIsa());

        isa_t newisa(0);

#if SUPPORT_INDEXED_ISA
        ASSERT(cls->classArrayIndex() > 0);
        newisa.bits = ISA_INDEX_MAGIC_VALUE;
        // isa.magic is part of ISA_MAGIC_VALUE
        // isa.nonpointer is part of ISA_MAGIC_VALUE
        newisa.has_cxx_dtor = hasCxxDtor;
        newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
        newisa.bits = ISA_MAGIC_VALUE;
        // isa.magic is part of ISA_MAGIC_VALUE
        // isa.nonpointer is part of ISA_MAGIC_VALUE
        newisa.has_cxx_dtor = hasCxxDtor;
        newisa.shiftcls = (uintptr_t)cls >> 3;
#endif

        // This write must be performed in a single store in some cases
        // (for example when realizing a class because other threads
        // may simultaneously try to use the class).
        // fixme use atomics here to guarantee single-store and to
        // guarantee memory order w.r.t. the class index table
        // ...but not too atomic because we don't want to hurt instantiation
        isa = newisa;
    }
}

  • 方法不要找错,找到对应方法名和参数的函数

initIsa()函数里面,如果是!nonpointer, 通过初始化函数isa_t((uintptr_t)cls)并赋值给isa,否则新建isa_t,并对isa_t的位域里面的变量进行赋初始值

step3:进入isa_t,如果无法跳转进入,则直接全局搜索

union isa_t {
    isa_t() { }
    isa_t(uintptr_t value) : bits(value) { }

    Class cls;
    uintptr_t bits;
#if defined(ISA_BITFIELD)
    struct {
        ISA_BITFIELD;  // defined in isa.h
    };
#endif
};

这个出现一个新的类型union,联合体。

联合体(union)

构造数据类型的方式有以下两种:

  • 结构体(struct)
  • 联合体(union,也称为共用体)
结构体

结构体是指把不同的数据组合成一个整体,其变量是共存的,变量不管是否使用,都会分配内存。

  • 缺点:所有属性都分配内存,比较浪费内存,假设有4个int成员,一共分配了16字节的内存,但是在使用时,你只使用了4字节,剩余的12字节就是属于内存的浪费
  • 优点:存储容量较大,包容性强,且成员之间不会相互影响
联合体

联合体也是由不同的数据类型组成,但其变量是互斥的,所有的成员共占一段内存。而且共用体采用了内存覆盖技术,同一时刻只能保存一个成员的值,如果对新的成员赋值,就会将原来成员的值覆盖掉

  • 缺点:包容性弱
  • 优点:所有成员共用一段内存,使内存的使用更为精细灵活,同时也节省了内存空间

两者的区别

  • 内存占用情况
    结构体的各个成员会占用不同的内存,互相之间没有影响
    共用体的所有成员占用同一段内存,修改一个成员会影响其余所有成员

  • 内存分配大小
    结构体内存 >= 所有成员占用的内存总和(成员之间可能会有缝隙)
    共用体占用的内存等于最大的成员占用的内存

isa_t

isa_t类型使用联合体的原因也是基于内存优化的考虑,这里的内存优化是指在isa指针中通过char + 位域(即二进制中每一位均可表示不同的信息)的原理实现。

isa_t的定义中可以看出:

提供了两个成员,clsbits,由联合体的定义所知,这两个成员是互斥的,也就意味着,当初始化isa指针时,有两种初始化方式

  • 通过cls初始化,bits无默认值
  • 通过bits初始化,cls有默认值

还提供了一个结构体定义的位域,用于存储类信息及其他信息,结构体的成员ISA_BITFIELD,这是一个宏定义,有两个版本 arm64(对应ios 移动端) 和 x86_64(对应macOS),以下是它们的一些宏定义,如下图所示

名称 内容 长度 说明
nonpointer 表示自定义的类等 1 0:纯isa指针 1:不只是类对象地址,isa中包含了类信息、对象的引用计数等(自定义的类nonpointer为1)
has_assoc 关联对象标志 1 0:没有关联对象 1:存在关联对象
has_cxx_dtor 该对象是否有C++/OC的析构器(类似于dealloc) 1 如果有析构函数,则需要做析构逻辑, 如果没有,则可以更快的释放对象
shiftcls 存储类的指针的值(类的地址) arm64中占33x86_64中占44
magic 判断当前对象是真的对象还是没有初始化的空间 6
weakly_refrenced 指对象是否被指向 或者 曾经指向一个ARC的弱变量 1 没有弱引用的对象可以更快释放
deallocating 对象是否正在释放内存 1
has_sidetable_rc 当对象引用计数大于10时,则需要借用该变量存储进位 1
extra_rc 表示该对象的引用计数值 arm64中占19x86_64中占8 实际上是引用计数值减 1, 例如,如果对象的引用计数为 10,那么 extra_rc 为 9。如果引用计数大于 10, 则需要使用到 has_sidetable_rc

针对两种不同平台,其isa的存储情况如图所示

iOS-底层原理7:isa与类关联的原理_第2张图片
isa存储情况

isa指针 位域分析(0-64)

step1:找到initIsa函数源码(上面已经讲过步骤),打上断点,并将程序执行到isa_t初始化之后

initIsa源码

step2:执行lldb命令,p newisa,得到newisa的信息

通过lldb命令查看newisa

step3:继续执行,走到newisa.bits = ISA_MAGIC_VALUE;下一行

step4:重新执行lldb命令p newisa

iOS-底层原理7:isa与类关联的原理_第3张图片
重新执行llvm命令
对比step2step4中llvm命令输出结果,发现isa指针中有一些变化,如下图所示
iOS-底层原理7:isa与类关联的原理_第4张图片
magic为什么是59?

magic是59是由于将isa指针地址转换为二进制,从47(在x86_64上,因为前面有4个位域,共占用47位,地址是从0开始)位开始读取6位,再转换为十进制,如下图所示

将宏ISA_MAGIC_VALUE对应的16进制数据复制到计算器,转换成二进制数据为:110111
10进制的59转换成二进制为:110111

step5:执行到最后一步,重新执行lldb命令

根据打印结果,clsshiftcls有了新值, isa指针与cls类成功关联

isa成员值变化

问题 :为什么要强制转换成uintptr_t类型?

因为内存的存储不能存储字符串,机器码只能识别 0 、1这两种数字,所以需要将其转换为uintptr_t数据类型,这样shiftcls中存储的类信息才能被机器码理解, 其中uintptr_tlong

问题 :为什么需要右移三位,直接赋值不行吗?

iOS-底层原理7:isa与类关联的原理_第5张图片

因为bits的成员shiftcls不是在起始位置而是在中间位置,低位有三位存储其他信息,所以需要右移3位后开始存储,存到44位满了就停止存储。这样才能准确的存储到类的信息。

isa 与 类 的关联

clsisa 关联原理:isa指针中的shiftcls位域中存储了类信息,其中initInstanceIsa的过程是将 isa 指针 和当前的 类cls 关联起来,有以下几种验证方式:

way1: 通过initIsa方法中的newisa.shiftcls = (uintptr_t)cls >> 3;验证

way2: 通过isa指针地址与ISA_MSAK 的值 & 来验证

way3: 通过runtime的方法object_getClass验证

way4: 通过位运算验证

way1: 通过initIsa方法验证

step1:initIsa函数中运行至newisa.shiftcls = (uintptr_t)cls >> 3;

iOS-底层原理7:isa与类关联的原理_第6张图片

当前的clsLBHPerson,强制转换成uintptr_t类型后得到 (uintptr_t)cls = 4295000296,然后右移三位得到的数据赋值给shiftcls

cls右移三位

step2: 继续执行,在控制台执行lldb 命令p newisa

会发现cls变成了LBHPersonshiftcls变成一串数字

截屏2020-11-16 上午11.44.28.png

way2: 通过isa指针地址与ISA_MSAK 的值 & 来验证

step1:_class_createInstanceFromZone函数的如下位置打上断点

step2:在控制台执行x/4gx obj,得到isa指针的地址0x001d8001000080e9,然后&0x00007ffffffffff8

架构 ISA_MASK的值
arm64 0x0000000ffffffff8ULL
x86_64 0x00007ffffffffff8ULL

way3: 通过runtime的方法object_getClass验证

step1: main中导入#import

step2: 通过runtimeapi,即object_getClass函数

step3:进入object_getClass函数

step4: 进入getIsa()函数

step5: 进入ISA()函数

截屏2020-11-16 下午12.22.03.png

step6:ISA()函数中打上断点,等程序执行到此处,在控制台调用lldb命令

way4: 通过位运算

step1:_class_createInstanceFromZone函数的如下位置打上断点

step2:找到isa指针地址

step3: 我们要先了解isa指针的位域,其中shiftcls存储的是类信息,位置为(3,44)

  • isa地址右移3位p 0x001d8001000080e9 >> 3 ,得到1037939513495581
  • 1037939513495581左移20位,p 1037939513495581 << 20,得到562954278797312
  • 562954278797312右移17位,p 562954278797312 >> 17,得到4295000296
  • po 4295000296得到LBHPerson

你可能感兴趣的:(iOS-底层原理7:isa与类关联的原理)