本位的主要目的是分析isa是什么还有isa的结构。
那么,在介绍isa之前,我们首先必须了解几个概念
-
LVVM和Clang
LLVM是构架编译器(compiler)的框架系统,以C++编写而成,用于优化以任意程序语言编写的程序的编译时间(compile-time)、链接时间(link-time)、运行时间(run-time)以及空闲时间(idle-time),对开发者保持开放,并兼容已有脚本。
Clang是一个C++编写、基于LLVM、发布于LLVM BSD许可证下的C/C++/Objective-C/Objective-C++编译器。用于替代之前的GCC。
简单来说,Clang是LVVM的前端,LVVM是Clang的后端,如图:
- OC对象的本质是什么(这里需要使用到Clang)
新建工程,在main.m函数中添加如下类
@interface MCPerson : NSObject
@property (nonatomic,strong) NSString *name;
@end
@implementation MCPerson
@end
使用Clang对main.m进行编译
clang -rewrite-objc main.m -o main.cpp
会编译生成main.cpp文件,这里补充几个clang编译的命令
clang -rewrite-objc main.m -o main.cpp
// 把目标文件编译成c++文件 UIKit报错问题
clang -rewrite-objc -fobjc-arc -fobjc-runtime=ios-13.0.0 -isysroot / Applications/Xcode.app/Contents/Developer/Platforms/ iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator13.0.sdk main.m
//`xcode`安装的时候顺带安装了`xcrun`命令,`xcrun`命令在`clang`的基础上进行了 一些封装,要更好用一些
xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp (模拟器)
xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main- arm64.cpp (手机)
查看编译生成的main.cpp文件
struct NSObject_IMPL {//NSObject被编译成了结构体,里面有isa指针
Class isa;
};
struct MCPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
// @implementation MCPerson
//get、set方法
static NSString * _I_MCPerson_name(MCPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_MCPerson$_name)); }
static void _I_MCPerson_setName_(MCPerson * self, SEL _cmd, NSString *name) { (*(NSString **)((char *)self + OBJC_IVAR_$_MCPerson$_name)) = name; }
// @end
这里的isa是Class类型的,为什么isa是Class类型的呢?因为这里强转了,在alloc流程中isa是用isa_t声明的,而在NSObject定义中isa的类型是Class,其根本原因是由于isa 对外反馈的是类信息,为了让开发人员更加清晰明确,需要在isa返回时做了一个类型强制转换
- 总结下,OC对象的本质,其实就是结构体
- isa是从父类继承的
除了MCPersong的底层定义,我们发现还有属性 name 对应的 set 和 get方法,如下图所示,其中set方法的实现依赖于runtime中的objc_setProperty。
但是我们编译出来没有这个方法,很奇怪,没objc_setProperty这个方法呀?是什么问题呢?
// @implementation MCPerson
static NSString * _I_MCPerson_name(MCPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_MCPerson$_name)); }
static void _I_MCPerson_setName_(MCPerson * self, SEL _cmd, NSString *name) { (*(NSString **)((char *)self + OBJC_IVAR_$_MCPerson$_name)) = name; }
// @end
这里需要使用copy修饰属性,然后重新编译就可以了
// @implementation MCPerson
static NSString * _I_MCPerson_name(MCPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_MCPerson$_name)); }
extern "C" __declspec(dllimport) void objc_setProperty (id, SEL, long, id, bool, bool);
static void _I_MCPerson_setName_(MCPerson * self, SEL _cmd, NSString *name) { objc_setProperty (self, _cmd, __OFFSETOFIVAR__(struct MCPerson, _name), (id)name, 0, 1); }
// @end
然后再002-objc4-781源码找到这个函数
为了验证调用set方法是否走这几个函数,在源码工程文件中新建target,然后再target的main.m函数中新建类
#import
#import
@interface MCPerson : NSObject
@property (nonatomic,copy) NSString *name;
@end
@implementation MCPerson
@end
int main(int argc, const char * argv[]) {
@autoreleasepool {
MCPerson *p = [MCPerson alloc];
p.name = @"asdasdasd";
}
return 0;
}
在调用.name函数的时候打断点,发现住了objc_setProperty_nonatomic_copy这个方法,很奇怪,objc_setProperty的一个扩展吧,不多里面调用的内容是差不多的,这里做个记号,以后解析一下
reallySetProperty 分析
static inline void reallySetProperty(id self, SEL _cmd, id newValue, ptrdiff_t offset, bool atomic, bool copy, bool mutableCopy)
{
if (offset == 0) {
object_setClass(self, newValue);//设置isa指向
return;
}
id oldValue;
id *slot = (id*) ((char*)self + offset);
if (copy) {
newValue = [newValue copyWithZone:nil];
} else if (mutableCopy) {
newValue = [newValue mutableCopyWithZone:nil];
} else {
if (*slot == newValue) return;
newValue = objc_retain(newValue);//返回新值
}
if (!atomic) {
oldValue = *slot;
*slot = newValue;//
} else {
spinlock_t& slotlock = PropertyLocks[slot];
slotlock.lock();
oldValue = *slot;
*slot = newValue; //
slotlock.unlock();
}
objc_release(oldValue);//释放旧址
}
- objc_setProperty这个方法很有意思,相当于关联了上层的set和底层的set,本质是一个接口
- 这么设计的原因是可以服用,不需要每一个set单独编写一个方法
- 基于上述原因,苹果采用了适配器设计模式(即将底层接口适配为客户端需要的接口),对外提供一个接口,供上层的set方法使用,对内调用底层的set方法,使其相互不受影响,即无论上层怎么变,下层都是不变的,或者下层的变化也无法影响上层,主要是达到上下层接口隔离的目的
如图:
cls 与 类 的关联原理
在此之前,需要先了解什么是联合体,为什么isa的类型isa_t是使用联合体定义
构造数据类型的方式有以下两种:
- 结构体(struct)
- 联合体(union,也称为共用体)
结构体
结构体是指把不同的数据组合成一个整体,其变量是共存的,变量不管是否使用,都会分配内存。
缺点:所有属性都分配内存,比较浪费内存,假设有4个int成员,一共分配了16字节的内存,但是在使用时,你只使用了4字节,剩余的12字节就是属于内存的浪费
优点:存储容量较大,包容性强,且成员之间不会相互影响
联合体
联合体也是由不同的数据类型组成,但其变量是互斥的,所有的成员共占一段内存。而且共用体采用了内存覆盖技术,同一时刻只能保存一个成员的值,如果对新的成员赋值,就会将原来成员的值覆盖掉
缺点:包容性弱
优点:所有成员共用一段内存,使内存的使用更为精细灵活,同时也节省了内存空间
两者的区别
内存占用情况
结构体的各个成员会占用不同的内存,互相之间没有影响
共用体的所有成员占用同一段内存,修改一个成员会影响其余所有成员
内存分配大小
结构体内存 >= 所有成员占用的内存总和(成员之间可能会有缝隙)
共用体占用的内存等于最大的成员占用的内存(所以成员共享内存)
isa的类型 isa_t
以下是isa指针的类型isa_t的定义,从定义中可以看出是通过联合体(union)定义的。
union isa_t { //联合体
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
//提供了cls 和 bits ,两者是互斥关系
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
从isa_t的定义中可以看出:
- 提供了两个成员,cls 和 bits,由联合体的定义所知,这两个成员是互斥的,也就意味着,当初始化isa指针时,有两种初始化方式(根据nonpointer判断),属于alloc流程
inline void
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor)
{
ASSERT(!isTaggedPointer());
if (!nonpointer) {//此处判断如何初始化isa
//通过cls初始化,bits无默认值
isa = isa_t((uintptr_t)cls);
} else {//一般我们创建的类都是nonpointer=true
//通过bits初始化,cls有默认值
ASSERT(!DisableNonpointerIsa);
ASSERT(!cls->instancesRequireRawIsa());
isa_t newisa(0);
#if SUPPORT_INDEXED_ISA
ASSERT(cls->classArrayIndex() > 0);
newisa.bits = ISA_INDEX_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
newisa.bits = ISA_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.shiftcls = (uintptr_t)cls >> 3;
#endif
isa = newisa;
}
}
- 还提供了一个结构体定义的位域,用于存储类信息及其他信息,结构体的成员ISA_BITFIELD,这是一个宏定义,有两个版本 arm64(对应ios 移动端) 和 x86_64(对应macOS),以下是它们的一些宏定义,如下图所示
-
nonpointer有两个值,表示自定义的类等,占1位
- 0:纯isa指针
- 1:不只是类对象地址,isa中包含了类信息、对象的引用计数等//我们创建的一般都是这个
-
has_assoc表示关联对象标志位,占1位
- 0:没有关联对象
- 1:存在关联对象
-
has_cxx_dtor 表示该对象是否有C++/OC的析构器(类似于dealloc),占1位
- 如果有析构函数,则需要做析构逻辑
- 如果没有,则可以更快的释放对象
-
shiftclx表示存储类的指针的值(类的地址), 即类信息
- arm64中占 33位,开启指针优化的情况下,在arm64架构中有33位用来存储类指针
- x86_64中占 44位(mac电脑)
magic 用于调试器判断当前对象是真的对象 还是 没有初始化的空间,占6位
weakly_refrenced是 指对象是否被指向 或者 曾经指向一个ARC的弱变量
没有弱引用的对象可以更快释放
deallocating 标志对象是是否正在释放内存
- has_sidetable_rc表示 当对象引用计数大于10时,则需要借用该变量存储进位
- extra_rc(额外的引用计数) --- 导尿管表示该对象的引用计数值,实际上是引用计数值减1
- 如果对象的引用计数为10,那么extra_rc为9
针对两种不同平台,其isa的存储情况如图所示
- isa初始化流程
- alloc --> _objc_rootAlloc --> callAlloc --> _objc_rootAllocWithZone --> _class_createInstanceFromZone->initInstanceIsa->initIsa(上面贴了代码)