问题
OC对象的本质到底是什么?里面到底是什么结构呢?
探索
在探索oc对象本质前,先了解一个编译器:clang
clang
-
clang
是一个由Apple
主导编写,基于LLVM
的C/C++/OC
的编译器 - 主要是用于
底层编译
,将一些文件
输出成c++文件
,例如main.m
输出成main.cpp
,其目的是为了更好的观察底层的一些结构 及 实现的逻辑,方便理解底层原理。
操作指令
//1、将 main.m 编译成 main.cpp
clang -rewrite-objc main.m -o main.cpp
//2、将 ViewController.m 编译成 ViewController.cpp
clang -rewrite-objc -fobjc-arc -fobjc-runtime=ios-13.0.0 -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator13.7.sdk ViewController.m
//以下两种方式是通过指定架构模式的命令行,使用xcode工具 xcrun
//3、模拟器文件编译
xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
//4、真机文件编译
xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
代码分析
Step1:
在main中自定义一个类LBHPerson,有一个属性name
@interface LBHPerson : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation LBHPerson
@end
step2:
打开终端,cd
到main.m
的文件夹,输入clang
指令: clang -rewrite-objc main.m -o main.cpp
将main.m
编译成 main.cpp
step3:
找到main.cpp
中LBHPerson
定义相关的代码
//LGPerson的底层编译
struct LBHPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
//NSObject 的底层编译
struct NSObject_IMPL {
Class isa;
};
- 可以直接搜索定义的类名,如:
LBHPerson
- 为了保证在
.cpp
中找到的代码是对的,可以在LBHPerson
类中添加属性重新转成cpp
代码,然后比较两份cpp
代码,找到类定义的正确的c++代码
总结:
OC对象的本质是结构体,每一个结构体都有一个
Class isa
探究属性get、set方法
isa
从C++源码
中得知类中存在一个isa
,那么isa又是什么?有什么作用呢?
objc4源码分析
通过alloc
--> _objc_rootAlloc
--> callAlloc
--> _objc_rootAllocWithZone
--> _class_createInstanceFromZone
方法路径,查找到initInstanceIsa
step1:
在objc4源码中找到initInstanceIsa
函数
inline void
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
ASSERT(!cls->instancesRequireRawIsa());
ASSERT(hasCxxDtor == cls->hasCxxDtor());
//调用initIsa函数
initIsa(cls, true, hasCxxDtor);
}
step2:
进入initIsa
函数
inline void
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor)
{
ASSERT(!isTaggedPointer());
if (!nonpointer) {
isa = isa_t((uintptr_t)cls);
} else {
ASSERT(!DisableNonpointerIsa);
ASSERT(!cls->instancesRequireRawIsa());
isa_t newisa(0);
#if SUPPORT_INDEXED_ISA
ASSERT(cls->classArrayIndex() > 0);
newisa.bits = ISA_INDEX_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
newisa.bits = ISA_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.shiftcls = (uintptr_t)cls >> 3;
#endif
// This write must be performed in a single store in some cases
// (for example when realizing a class because other threads
// may simultaneously try to use the class).
// fixme use atomics here to guarantee single-store and to
// guarantee memory order w.r.t. the class index table
// ...but not too atomic because we don't want to hurt instantiation
isa = newisa;
}
}
- 方法不要找错,找到对应方法名和参数的函数
在initIsa()
函数里面,如果是!nonpointer
, 通过初始化函数isa_t((uintptr_t)cls)
并赋值给isa
,否则新建isa_t
,并对isa_t
的位域里面的变量进行赋初始值
step3:
进入isa_t
,如果无法跳转进入,则直接全局搜索
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
这个出现一个新的类型union
,联合体。
联合体(union)
构造数据类型的方式有以下两种:
- 结构体(struct)
- 联合体(union,也称为共用体)
结构体
结构体是指把不同的数据组合成一个整体,其变量是共存的,变量不管是否使用,都会分配内存。
-
缺点
:所有属性都分配内存,比较浪费内存,假设有4个int成员,一共分配了16字节的内存,但是在使用时,你只使用了4字节,剩余的12字节就是属于内存的浪费 -
优点
:存储容量较大,包容性强,且成员之间不会相互影响
联合体
联合体也是由不同的数据类型组成,但其变量是互斥的,所有的成员共占一段内存。而且共用体采用了内存覆盖技术,同一时刻只能保存一个成员的值,如果对新的成员赋值,就会将原来成员的值覆盖掉
-
缺点
:包容性弱 -
优点
:所有成员共用一段内存,使内存的使用更为精细灵活,同时也节省了内存空间
两者的区别
:
内存占用情况
结构体的各个成员会占用不同的内存,互相之间没有影响
共用体的所有成员占用同一段内存,修改一个成员会影响其余所有成员内存分配大小
结构体内存 >= 所有成员占用的内存总和(成员之间可能会有缝隙)
共用体占用的内存等于最大的成员占用的内存
isa_t
isa_t
类型使用联合体
的原因也是基于内存优化
的考虑,这里的内存优化是指在isa
指针中通过char + 位域
(即二进制中每一位均可表示不同的信息)的原理实现。
从isa_t
的定义中可以看出:
提供了两个成员,cls
和 bits
,由联合体的定义所知,这两个成员是互斥的,也就意味着,当初始化isa
指针时,有两种初始化方式
- 通过
cls
初始化,bits
无默认值 - 通过
bits
初始化,cls
有默认值
还提供了一个结构体定义的位域,用于存储类信息及其他信息,结构体的成员ISA_BITFIELD
,这是一个宏定义,有两个版本 arm64(对应ios 移动端) 和 x86_64(对应macOS),以下是它们的一些宏定义,如下图所示
名称 | 内容 | 长度 | 说明 |
---|---|---|---|
nonpointer |
表示自定义的类等 |
1 | 0 :纯isa指针 1 :不只是类对象地址,isa中包含了类信息、对象的引用计数等(自定义的类nonpointer为1) |
has_assoc |
关联对象标志 |
1 | 0 :没有关联对象 1 :存在关联对象 |
has_cxx_dtor |
该对象是否有C++/OC的析构器(类似于dealloc) |
1 | 如果有析构函数,则需要做析构逻辑, 如果没有,则可以更快的释放对象 |
shiftcls |
存储类的指针的值(类的地址) |
arm64 中占33 位 x86_64 中占44 位 |
|
magic |
判断当前对象是真的对象 还是没有初始化的空间 |
6 | |
weakly_refrenced |
指对象是否被指向 或者 曾经指向一个ARC的弱变量 |
1 | 没有弱引用的对象可以更快释放 |
deallocating |
对象是否正在释放内存 |
1 | |
has_sidetable_rc |
当对象引用计数大于10时,则需要借用该变量存储进位 | 1 | |
extra_rc |
表示该对象的引用计数值 |
arm64 中占19 位 x86_64 中占8 位 |
实际上是引用计数值减 1 , 例如,如果对象的引用计数为 10,那么 extra_rc 为 9。如果引用计数大于 10, 则需要使用到 has_sidetable_rc |
针对两种不同平台,其isa
的存储情况如图所示
isa指针 位域分析(0-64)
step1:
找到initIsa
函数源码(上面已经讲过步骤),打上断点,并将程序执行到isa_t
初始化之后
step2:
执行lldb命令,p newisa
,得到newisa
的信息
step3:
继续执行,走到newisa.bits = ISA_MAGIC_VALUE;
下一行
step4:
重新执行lldb命令p newisa
对比step2
和step4
中llvm命令输出结果,发现isa指针中有一些变化,如下图所示
magic为什么是59?
magic是59是由于将isa指针地址转换为二进制,从47(在x86_64上,因为前面有4个位域,共占用47位,地址是从0开始)位开始读取6位,再转换为十进制,如下图所示
将宏ISA_MAGIC_VALUE
对应的16进制数据复制到计算器,转换成二进制数据为:110111
10进制的59转换成二进制为:110111
step5:
执行到最后一步,重新执行lldb命令
根据打印结果,cls
和shiftcls
有了新值, isa
指针与cls
类成功关联
问题
:为什么要强制转换成uintptr_t
类型?
因为内存的存储不能存储字符串
,机器码只能识别 0 、1
这两种数字,所以需要将其转换为uintptr_t
数据类型,这样shiftcls
中存储的类信息才能被机器码理解, 其中uintptr_t
是long
问题
:为什么需要右移三位,直接赋值不行吗?
因为bits
的成员shiftcls
不是在起始位置而是在中间位置,低位有三位存储其他信息,所以需要右移3位
后开始存储,存到44位满了就停止存储
。这样才能准确的存储到类的信息。
isa 与 类 的关联
cls
与 isa
关联原理:isa
指针中的shiftcls
位域中存储了类信息
,其中initInstanceIsa
的过程是将 isa
指针 和当前的 类cls
关联起来,有以下几种验证方式:
way1:
通过initIsa
方法中的newisa.shiftcls = (uintptr_t)cls >> 3;
验证
way2:
通过isa
指针地址与ISA_MSAK
的值 &
来验证
way3:
通过runtime
的方法object_getClass
验证
way4:
通过位运算验证
way1:
通过initIsa
方法验证
step1:
在initIsa
函数中运行至newisa.shiftcls = (uintptr_t)cls >> 3;
当前的cls
为LBHPerson
,强制转换成uintptr_t
类型后得到 (uintptr_t)cls = 4295000296
,然后右移三位得到的数据赋值给shiftcls
step2:
继续执行,在控制台执行lldb
命令p newisa
会发现cls
变成了LBHPerson
,shiftcls
变成一串数字
way2: 通过isa
指针地址与ISA_MSAK
的值 &
来验证
step1:
在_class_createInstanceFromZone
函数的如下位置打上断点
step2:
在控制台执行x/4gx obj
,得到isa
指针的地址0x001d8001000080e9
,然后&
上 0x00007ffffffffff8
架构 | ISA_MASK的值 |
---|---|
arm64 | 0x0000000ffffffff8ULL |
x86_64 | 0x00007ffffffffff8ULL |
way3: 通过runtime
的方法object_getClass
验证
step1:
main中导入#import
step2:
通过runtime
的api
,即object_getClass
函数
step3:
进入object_getClass
函数
step4:
进入getIsa()
函数
step5:
进入ISA()
函数
step6:
在ISA()
函数中打上断点,等程序执行到此处,在控制台调用lldb命令
way4: 通过位运算
step1:
在_class_createInstanceFromZone
函数的如下位置打上断点
step2:
找到isa
指针地址
step3:
我们要先了解isa
指针的位域,其中shiftcls
存储的是类信息,位置为(3,44)
- 将
isa
地址右移3位
,p 0x001d8001000080e9 >> 3
,得到1037939513495581
- 将
1037939513495581
左移20位,p 1037939513495581 << 20
,得到562954278797312
- 将
562954278797312
右移17位,p 562954278797312 >> 17
,得到4295000296
-
po 4295000296
得到LBHPerson