alloc & init & new 源码分析文章中,alloc有3个核心操作,其中一个就是obj->initInstanceIsa,即类与isa绑定。主要理解类与isa是如何关联的。
objc4中分析obj->initInstanceIsa源码
#import <Foundation/Foundation.h>
@interface ZMPerson : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation ZMPerson
@end
int main(int argc, char * argv[]) {
@autoreleasepool {
}
return 0;
}
//1、将 main.m 编译成 main.cpp
clang -rewrite-objc main.m -o main.cpp
//2、将 ViewController.m 编译成 ViewController.cpp clang -rewrite-objc
-fobjc-arc -fobjc-runtime=ios-13.0.0 -isysroot / /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator13.7.sdk
ViewController.m
//以下两种方式是通过指定架构模式的命令行,使用xcode工具 xcrun
//3、模拟器文件编译
- xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
//4、真机文件编译
- xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main- arm64.cpp
Clang
clang是一个由Apple主导编写,基于LLVM的C/C++/OC的编译器
主要是用于底层编译,将一些文件``输出成c++文件,例如main.m 输出成main.cpp,
其目的是为了更好的观察底层的一些结构 及 实现的逻辑,方便理解底层原理。
// ZMPerson的底层编译
struct ZMPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS; // isa
NSString *_name;
};
//NSObject 的底层编译
struct NSObject_IMPL {
Class isa;
};
//NSObject的定义
@interface NSObject <NSObject> {
Class isa OBJC_ISA_AVAILABILITY;
}
ZMPerson在底层会被编译成 struct 结构体
伪继承的方式是直接将NSObject结构体定义为ZMPerson_IMPL中的第一个属性,意味着ZMPerson_IMPL拥有 NSObject中的所有成员变量。
总结
所以从上述探索过程中可以得出:
除了ZMPerson的底层定义,我们发现还有属性 name 对应的 set 和 get方法,如下图所示,其中set方法的实现依赖于runtime中的objc_setProperty。
objc_setProperty方法的目的适用于关联 上层的set方法 以及 底层的set方法,其本质就是一个接口
这么设计的原因
上层的set方法有很多,如果直接调用底层set方法中,会产生很多的临时变量,当你想查找一个sel时,会非常麻烦
适配器设计模式(即将底层接口适配为客户端需要的接口)
- 对外提供一个接口,供上层的set方法使用
- 对内调用底层的set方法,使其相互不受影响
- 即无论上层怎么变,下层都是不变的
- 或者下层的变化也无法影响上层
- 主要是达到上下层接口隔离的目的
下图是上层、隔离层、底层之间的关系
构造数据类型的方式有以下两种:
结构体是指把不同的数据组合成一个整体,其变量是共存的,变量不管是否使用,都会分配内存。
优点:
存储容量较大,包容性强,且成员之间不会相互影响
缺点:
所有属性都分配内存,比较浪费内存,假设有4个int成员,一共分配了16字节的内存,但是在使用时,你只使用了4字节,剩余的12字节就是属于内存的浪费
联合体也是由不同的数据类型组成,但其变量是互斥的,所有的成员共占一段内存。而且共用体采用了内存覆盖技术,同一时刻只能保存一个成员的值,如果对新的成员赋值,就会将原来成员的值覆盖掉
优点:
所有成员共用一段内存,使内存的使用更为精细灵活,同时也节省了内存空间
缺点:
包容性弱
- 结构体的各个成员会占用不同的内存,互相之间没有影响
- 共用体的所有成员占用同一段内存,修改一个成员会影响其余所有成员
- 结构体内存 >= 所有成员占用的内存总和(成员之间可能会有缝隙)
2.共用体占用的内存等于最大的成员占用的内存
思考:为什么isa的类型isa_t(联合体)
以下是isa指针的类型isa_t的定义,从定义中可以看出是通过联合体(union)定义的。
union isa_t { //联合体
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
//提供了cls 和 bits ,两者是互斥关系
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
从isa_t的定义中可以看出:
由联合体的定义所知,这两个成员是互斥的,也就意味着,当初始化isa指针时,有两种初始化方式
用于存储类信息及其他信息,结构体的成员ISA_BITFIELD,这是一个宏定义,有两个版本 arm64(对应ios 移动端) 和 x86_64(对应macOS),以下是它们的一些宏定义,如下图所示
nonpointer有两个值,表示自定义的类等,占1位
has_cxx_dtor 表示该对象是否有C++/OC的析构器(类似于dealloc),占1位
如果有析构函数,则需要做析构逻辑
如果没有,则可以更快的释放对象
shiftclx表示存储类的指针的值(类的地址), 即类信息
arm64中占 33位,开启指针优化的情况下,在arm64架构中有33位用来存储类指针
x86_64中占 44位
magic 用于调试器判断当前对象是真的对象 还是 没有初始化的空间,占6位
weakly_refrenced是 指对象是否被指向 或者 曾经指向一个ARC的弱变量
没有弱引用的对象可以更快释放
deallocating 标志对象是是否正在释放内存
has_sidetable_rc表示 当对象引用计数大于10时,则需要借用该变量存储进位
extra_rc(额外的引用计数) — 导尿管表示该对象的引用计数值,实际上是引用计数值减1
如果对象的引用计数为10,那么extra_rc为9
针对两种不同平台,其isa的存储情况如图所示
也是基于内存优化的考虑,这里的内存优化是指在isa指针中通过char + 位域(即二进制中每一位均可表示不同的信息)的原理实现。isa指针占用的内存大小是8字节,即64位,已经足够存储很多的信息了,这样可以极大的节省内存,以提高性能
inline void
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
ASSERT(!cls->instancesRequireRawIsa());
ASSERT(hasCxxDtor == cls->hasCxxDtor());
initIsa(cls, true, hasCxxDtor);
}
该方法的逻辑主要分为两部分
isa里面不单单是一个指针,内部结构中还可能包括 是否正在释放、引用计数、weak、关联类、析构函数等
可以看到在initInstanceIsa方法中直接传入的是true,也就是非指针源,那这就给我们探究isa里面
到底存放了些什么铺开了路
cls 与 isa 关联原理就是isa指针中的shiftcls位域中存储了类信息,其中initInstanceIsa的过程是将 calloc 指针 和当前的 类cls 关联起来,有以下几种验证方式:
【方式一】通过initIsa方法中的newisa.shiftcls = (uintptr_t)cls >> 3;验证
【方式二】通过isa指针地址与ISA_MSAK 的值 & 来验证
【方式三】通过runtime的方法object_getClass验证
【方式四】通过位运算验证
运行至newisa.shiftcls = (uintptr_t)cls >> 3;前一步,其中 shiftcls存储当前类的值信息
此时查看cls,是ZMPerson类
shiftcls赋值的逻辑是将 ZMPerson进行编码后,右移3位
执行lldb命令p (uintptr_t)cls,结果为(uintptr_t) $2 = 4294975720,再右移三位,有以下两种方式(任选其一),将得到536871965存储到newisa的shiftcls中
p (uintptr_t)cls >> 3
继续执行程序到isa = newisa;部分,此时执行p newisa
与bits赋值结果的对比,bits的位域中有两处变化
cls 由默认值,变成了LGPerson,将isa与cls完美关联
shiftcls由0变成了536871965
所以isa中通过初始化后的成员的值变化过程,如下图所示
因为内存的存储不能存储字符串,机器码只能识别 0 、1这两种数字,所以需要将其转换为uintptr_t数据类型,这样shiftcls中存储的类信息才能被机器码理解, 其中uintptr_t是long
主要是由于shiftcls处于isa指针地址的中间部分,前面还有3个位域,为了不影响前面的3个位域的数据,需要右移将其抹零。
arm64中,ISA_MASK 宏定义的值为0x0000000ffffffff8ULL
x86_64中,ISA_MASK 宏定义的值为0x00007ffffffffff8ULL
通过查看object_getClass的源码实现,同样可以验证isa与类关联的原理,有以下几步:
1.main中导入#import
2.通过runtime的api,即object_getClass函数获取类信息
object_getClass(<#id _Nullable obj#>)
2.点击进入object_getClass 底层实现
3.点击ISA(),进入源码
(Class)(isa.bits & ISA_MASK);
(isa.bits & ISA_MASK) 结合之后强转成Class