Objc源码之对象创建alloc和init
Objc源码之initialize实现
Objc源码之Load方法实现
Objc源码之NSObject和isa
Objc源码之引用计数实现
objc源码之Method消息发送
前言
在OC中,大部分对象都继承自NSObject,NSObject包含了包含了很多基础方法和协议,用来给它的子类使用,同时子类对象的创建和调用,也和NSObject的息息相关,因此了解NSObject对象结构是十分重要的。
一、NSObject对象结构
首先我们看下NSObject结构,NSObject包含一个名为Class的isa变量
@interface NSObject {
Class isa OBJC_ISA_AVAILABILITY;
}
而class是一个objc_class
类型的结构体
typedef struct objc_class *Class;
下面我们就看下objc_class
类型的结构体的实现:
struct objc_class : objc_object {
// Class ISA;
Class superclass;
cache_t cache; // formerly cache pointer and vtable
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
...
};
从objc_class
结构体,我们可以看出objc_class
主要由superclass、cache、bits组成的。objc_class
继承自objc_object
objc_object结构如下:
struct objc_object {
private:
isa_t isa;
}
isa_t结构如下:
union isa_t {
Class cls;
uintptr_t bits;
};
下面我们就来看看这三者的具体结构和作用:
1.superclass
从名字就可以看出这是当前对象的父类
2.cache结构
struct cache_t {
struct bucket_t *_buckets;
mask_t _mask;
mask_t _occupied;
...
};
从cache源码可以看出cache_t
主要由_buckets、_mask、_occupied
组成,其中_occupied和_mask都是mask_t类型的,_buckets是结构体bucket_t组成。
2.1 _buckets 结构
typedef uintptr_t cache_key_t;
struct bucket_t {
#if __arm64__
MethodCacheIMP _imp;
cache_key_t _key;
#else
cache_key_t _key;
MethodCacheIMP _imp;
#endif
...
};
我们可以看到_buckets
中主要由_key
和_imp
组成,这两个就是缓存中的key和具体方法实现,我们在调用方法的时候,为了优化效率会从缓存中读取方法,就是在这里进行的。
2.2_mask和_occupied
typedef uint32_t mask_t;
mask:分配用来缓存bucket的总数。
occupied:表明目前实际占用的缓存bucket的个数。
总结:
cache主要是用来存储方法缓存链表_buckets,和mask(分配用来缓存bucket的总数),还有当前实际占用的bucket个数。
3.bits结构
typedef unsigned long uintptr_t;
struct class_data_bits_t {
// Values are the FAST_ flags above.
uintptr_t bits;
class_rw_t* data() {
return (class_rw_t *)(bits & FAST_DATA_MASK);
}
}
在 objc_class 结构体中的注释写到class_data_bits_t
相当于class_rw_t
指针加上 rr/alloc 的标志。
bits中主要有两部分:
1)一个long类型的bits标志位,这个标志位存储了很多flags、比如:快速分配内存标志、是否有析构函数、是否有构造函数、是否有自定义控件等。
2)它为我们提供了便捷方法用于返回其中的 class_rw_t * 指针:
class_rw_t* data() {
return (class_rw_t *)(bits & FAST_DATA_MASK);
}
4.class_rw_t 和 class_ro_t
类中的属性、方法、协议等都在class_rw_t
的结构中,下面我们可以看下class_rw_t
结构:
struct class_rw_t {
// Be warned that Symbolication knows the layout of this structure.
uint32_t flags;
uint32_t version;
const class_ro_t *ro;
method_array_t methods;
property_array_t properties;
protocol_array_t protocols;
Class firstSubclass;
Class nextSiblingClass;
char *demangledName;
#if SUPPORT_INDEXED_ISA
uint32_t index;
#endif
...
}
flags 存放一些标志,比如在16位存放是否自定义allocWithZone的标志,17位存放是否有析构函数、18位存放构造函数标志等
ro 存放编译时期确定的OC属性、方法、协议
methods 方法列表
properties 属性列表
protocols 协议列表
下面看下class_ro_t
结构,其主要编译器确定的存储方法,属性,实例变量、协议等:
struct class_ro_t {
uint32_t flags;
uint32_t instanceStart;
uint32_t instanceSize;
#ifdef __LP64__
uint32_t reserved;
#endif
const uint8_t * ivarLayout;
const char * name;
method_list_t * baseMethodList;
protocol_list_t * baseProtocols;
const ivar_list_t * ivars;
const uint8_t * weakIvarLayout;
property_list_t *baseProperties;
method_list_t *baseMethods() const {
return baseMethodList;
}
};
在运行期通过调用realizeClass 方法,将ro的值,赋值给rw:
if (ro->flags & RO_FUTURE) {
// This was a future class. rw data is already allocated.
rw = cls->data();
ro = cls->data()->ro;
cls->changeInfo(RW_REALIZED|RW_REALIZING, RW_FUTURE);
} else {
// Normal class. Allocate writeable class data.
rw = (class_rw_t *)calloc(sizeof(class_rw_t), 1);
rw->ro = ro;
rw->flags = RW_REALIZED|RW_REALIZING;
cls->setData(rw);
}
下图是 realizeClass 方法执行过后的类所占用内存的布局:
二、isa结构
isa在对象的结构中,起着很重要的作用,连接着实例对象和类对象,类对象和元类,在方法调用的时候,正是通过isa指针,实现了方法的查找。
下面我们就来看一下isa指针的结构:
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
# if __arm64__
# define ISA_MASK 0x0000000ffffffff8ULL
# define ISA_MAGIC_MASK 0x000003f000000001ULL
# define ISA_MAGIC_VALUE 0x000001a000000001ULL
# define ISA_BITFIELD \
uintptr_t nonpointer : 1; \
uintptr_t has_assoc : 1; \
uintptr_t has_cxx_dtor : 1; \
uintptr_t shiftcls : 33; /*MACH_VM_MAX_ADDRESS 0x1000000000*/ \
uintptr_t magic : 6; \
uintptr_t weakly_referenced : 1; \
uintptr_t deallocating : 1; \
uintptr_t has_sidetable_rc : 1; \
uintptr_t extra_rc : 19
# define RC_ONE (1ULL<<45)
# define RC_HALF (1ULL<<18)
# elif __x86_64__
# define ISA_MASK 0x00007ffffffffff8ULL
# define ISA_MAGIC_MASK 0x001f800000000001ULL
# define ISA_MAGIC_VALUE 0x001d800000000001ULL
# define ISA_BITFIELD \
uintptr_t nonpointer : 1; \
uintptr_t has_assoc : 1; \
uintptr_t has_cxx_dtor : 1; \
uintptr_t shiftcls : 44; /*MACH_VM_MAX_ADDRESS 0x7fffffe00000*/ \
uintptr_t magic : 6; \
uintptr_t weakly_referenced : 1; \
uintptr_t deallocating : 1; \
uintptr_t has_sidetable_rc : 1; \
uintptr_t extra_rc : 8
# define RC_ONE (1ULL<<56)
# define RC_HALF (1ULL<<7)
首先isa指针是一个union
,而不是常用struct
结构体,那两者什么区别呢?
1.在存储多个成员信息时,编译器会自动给struct第个成员分配存储空间,struct 可以存储多个成员信息,而Union每个成员会用同一个存储空间,只能存储最后一个成员的信息。
2.都是由多个不同的数据类型成员组成,但在任何同一时刻,Union只存放了一个被先选中的成员,而结构体的所有成员都存在。
3.对于Union的不同成员赋值,将会对其他成员重写,原来成员的值就不存在了,而对于struct 的不同成员赋值 是互不影响的。
也就是union会以其成员中,占用存储空间最多的一个对象,来分配内存。在isa中也就是结构体决定了union的大小。
那么为什么会使用union而不使用struct结构呢?
我们可以从isa指针的初始化中看看:
inline void objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
initIsa(cls, true, hasCxxDtor);
}
inline void objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor)
{
if (!nonpointer) {
isa.cls = cls;
} else {
isa_t newisa(0);
newisa.bits = ISA_MAGIC_VALUE;
newisa.has_cxx_dtor = hasCxxDtor;
newisa.shiftcls = (uintptr_t)cls >> 3;
}
在initInstanceIsa的时候,会调用initInstanceIsa,也就是nonpointer会传true,nonpointer表示的是isa指针优化,具体可以看Tagged Pointer技术。
下面是在指针优化的时候,结构体64位的含义:
下面我们来看下这个结构体具体的含义:
nonpointer代表是否开启isa指针优化。关于什么是isa指针优化,可以看看Tagged Pointer技术
has_assoc 代表对象含有或者曾经含有关联引用,没有关联引用的可以更快地释放内存
has_cxx_dtor 表示该对象是否有 C++ 或者 Objc 的析构器
shiftcls :类的指针。arm64架构中有33位可以存储类指针。
magic 表示判断对象是否初始化完成,在arm64中0x16是调试器判断当前对象是真的对象还是没有初始化的空间。
weakly_referenced 表示对象被指向或者曾经指向一个 ARC 的弱变量,没有弱引用的对象可以更快释放
deallocating 对象是否正在释放内存
has_sidetable_rc 判断该对象的引用计数是否过大,如果过大则需要其他散列表来进行存储。
extra_rc 存放该对象的引用计数值减一后的结果。对象的引用计数超过 1,会存在这个这个里面,如果引用计数为 10,extra_rc的值就为 9。
从以上信息可以看出来isa指针不仅存储了类的指针,还存储了是否开启指针优化,是否有析构器、是否包含关联引用、是否正在释放等信息。
总结:
1.在方法调用时,查找缓存,是从objc_class的cache中取的bucket_t,通过key来查找对应的方法实现,实现方法的响应。
2.类对应的方法、属性、协议存储在objc_class中的bits里面,这里面有个结构体class_rw_t和结构体class_ro_t,class_ro_t是存储编译器的方法、属性、协议,运行期添加的方法属性协议,都是存储在class_rw_t中。
3.isa指针在arm64和x86_64位时,对应结构体中每位的含义不同,isa指针不仅存储了类的指针,还存储了是否开启指针优化,是否有析构器、是否包含关联引用、是否正在释放等信息。
参考:
objc4-750源码
从 NSObject 的初始化了解 isa.md
深入理解Objective-C:Category
深入解析 ObjC 中方法的结构
神经病院 Objective-C Runtime 入院第一天—— isa 和 Class
What is a meta-class in Objective-C?
objc_explain_Classes_and_metaclasses
isa详解