Objc源码之NSObject和isa

Objc源码之对象创建alloc和init
Objc源码之initialize实现
Objc源码之Load方法实现
Objc源码之NSObject和isa
Objc源码之引用计数实现
objc源码之Method消息发送

前言

   在OC中,大部分对象都继承自NSObject,NSObject包含了包含了很多基础方法和协议,用来给它的子类使用,同时子类对象的创建和调用,也和NSObject的息息相关,因此了解NSObject对象结构是十分重要的。

一、NSObject对象结构

首先我们看下NSObject结构,NSObject包含一个名为Class的isa变量

@interface NSObject  {
    Class isa  OBJC_ISA_AVAILABILITY;
}

而class是一个objc_class类型的结构体

typedef struct objc_class *Class;

下面我们就看下objc_class类型的结构体的实现:

struct objc_class : objc_object {
    // Class ISA;
    Class superclass;
    cache_t cache;             // formerly cache pointer and vtable
    class_data_bits_t bits;    // class_rw_t * plus custom rr/alloc flags
    ...
};

objc_class结构体,我们可以看出objc_class主要由superclass、cache、bits组成的。objc_class继承自objc_object

objc_object结构如下:

struct objc_object {
private:
    isa_t isa;
}

isa_t结构如下:

union isa_t {
    Class cls;
    uintptr_t bits;
};
Objc源码之NSObject和isa_第1张图片

下面我们就来看看这三者的具体结构和作用:

1.superclass

从名字就可以看出这是当前对象的父类

2.cache结构
struct cache_t {
    struct bucket_t *_buckets;
    mask_t _mask;
    mask_t _occupied;
    ...
};

从cache源码可以看出cache_t主要由_buckets、_mask、_occupied组成,其中_occupied和_mask都是mask_t类型的,_buckets是结构体bucket_t组成。

2.1 _buckets 结构
typedef uintptr_t cache_key_t;

struct bucket_t {
#if __arm64__
    MethodCacheIMP _imp;
    cache_key_t _key;
#else
    cache_key_t _key;
    MethodCacheIMP _imp;
#endif
...
};

我们可以看到_buckets中主要由_key_imp组成,这两个就是缓存中的key和具体方法实现,我们在调用方法的时候,为了优化效率会从缓存中读取方法,就是在这里进行的。

2.2_mask和_occupied
typedef uint32_t mask_t;

mask:分配用来缓存bucket的总数。
occupied:表明目前实际占用的缓存bucket的个数。

总结:
cache主要是用来存储方法缓存链表_buckets,和mask(分配用来缓存bucket的总数),还有当前实际占用的bucket个数。

3.bits结构
typedef unsigned long           uintptr_t;

struct class_data_bits_t {
    // Values are the FAST_ flags above.
    uintptr_t bits;
    class_rw_t* data() {
        return (class_rw_t *)(bits & FAST_DATA_MASK);
    }
}

在 objc_class 结构体中的注释写到class_data_bits_t相当于class_rw_t指针加上 rr/alloc 的标志。
bits中主要有两部分:
1)一个long类型的bits标志位,这个标志位存储了很多flags、比如:快速分配内存标志、是否有析构函数、是否有构造函数、是否有自定义控件等。
2)它为我们提供了便捷方法用于返回其中的 class_rw_t * 指针:

class_rw_t* data() {
   return (class_rw_t *)(bits & FAST_DATA_MASK);
}
4.class_rw_t 和 class_ro_t

类中的属性、方法、协议等都在class_rw_t的结构中,下面我们可以看下class_rw_t结构:

struct class_rw_t {
    // Be warned that Symbolication knows the layout of this structure.
    uint32_t flags;
    uint32_t version;

    const class_ro_t *ro;

    method_array_t methods;
    property_array_t properties;
    protocol_array_t protocols;

    Class firstSubclass;
    Class nextSiblingClass;

    char *demangledName;

#if SUPPORT_INDEXED_ISA
    uint32_t index;
#endif
  ...
}


flags 存放一些标志,比如在16位存放是否自定义allocWithZone的标志,17位存放是否有析构函数、18位存放构造函数标志等

ro 存放编译时期确定的OC属性、方法、协议

methods 方法列表

properties 属性列表

protocols 协议列表

下面看下class_ro_t结构,其主要编译器确定的存储方法,属性,实例变量、协议等:

struct class_ro_t {
    uint32_t flags;
    uint32_t instanceStart;
    uint32_t instanceSize;
#ifdef __LP64__
    uint32_t reserved;
#endif

    const uint8_t * ivarLayout;
    
    const char * name;
    method_list_t * baseMethodList;
    protocol_list_t * baseProtocols;
    const ivar_list_t * ivars;

    const uint8_t * weakIvarLayout;
    property_list_t *baseProperties;

    method_list_t *baseMethods() const {
        return baseMethodList;
    }
};

在运行期通过调用realizeClass 方法,将ro的值,赋值给rw:

    if (ro->flags & RO_FUTURE) {
        // This was a future class. rw data is already allocated.
        rw = cls->data();
        ro = cls->data()->ro;
        cls->changeInfo(RW_REALIZED|RW_REALIZING, RW_FUTURE);
    } else {
        // Normal class. Allocate writeable class data.
        rw = (class_rw_t *)calloc(sizeof(class_rw_t), 1);
        rw->ro = ro;
        rw->flags = RW_REALIZED|RW_REALIZING;
        cls->setData(rw);
    }

下图是 realizeClass 方法执行过后的类所占用内存的布局:

Objc源码之NSObject和isa_第2张图片
NSObject对象结构
二、isa结构

isa在对象的结构中,起着很重要的作用,连接着实例对象和类对象,类对象和元类,在方法调用的时候,正是通过isa指针,实现了方法的查找。
下面我们就来看一下isa指针的结构:

union isa_t {
    isa_t() { }
    isa_t(uintptr_t value) : bits(value) { }

    Class cls;
    uintptr_t bits;
#if defined(ISA_BITFIELD)
    struct {
        ISA_BITFIELD;  // defined in isa.h
    };
#endif
};

# if __arm64__
#   define ISA_MASK        0x0000000ffffffff8ULL
#   define ISA_MAGIC_MASK  0x000003f000000001ULL
#   define ISA_MAGIC_VALUE 0x000001a000000001ULL
#   define ISA_BITFIELD                                                      \
      uintptr_t nonpointer        : 1;                                       \
      uintptr_t has_assoc         : 1;                                       \
      uintptr_t has_cxx_dtor      : 1;                                       \
      uintptr_t shiftcls          : 33; /*MACH_VM_MAX_ADDRESS 0x1000000000*/ \
      uintptr_t magic             : 6;                                       \
      uintptr_t weakly_referenced : 1;                                       \
      uintptr_t deallocating      : 1;                                       \
      uintptr_t has_sidetable_rc  : 1;                                       \
      uintptr_t extra_rc          : 19
#   define RC_ONE   (1ULL<<45)
#   define RC_HALF  (1ULL<<18)

# elif __x86_64__
#   define ISA_MASK        0x00007ffffffffff8ULL
#   define ISA_MAGIC_MASK  0x001f800000000001ULL
#   define ISA_MAGIC_VALUE 0x001d800000000001ULL
#   define ISA_BITFIELD                                                        \
      uintptr_t nonpointer        : 1;                                         \
      uintptr_t has_assoc         : 1;                                         \
      uintptr_t has_cxx_dtor      : 1;                                         \
      uintptr_t shiftcls          : 44; /*MACH_VM_MAX_ADDRESS 0x7fffffe00000*/ \
      uintptr_t magic             : 6;                                         \
      uintptr_t weakly_referenced : 1;                                         \
      uintptr_t deallocating      : 1;                                         \
      uintptr_t has_sidetable_rc  : 1;                                         \
      uintptr_t extra_rc          : 8
#   define RC_ONE   (1ULL<<56)
#   define RC_HALF  (1ULL<<7)

首先isa指针是一个union,而不是常用struct结构体,那两者什么区别呢?

1.在存储多个成员信息时,编译器会自动给struct第个成员分配存储空间,struct 可以存储多个成员信息,而Union每个成员会用同一个存储空间,只能存储最后一个成员的信息。

2.都是由多个不同的数据类型成员组成,但在任何同一时刻,Union只存放了一个被先选中的成员,而结构体的所有成员都存在。

3.对于Union的不同成员赋值,将会对其他成员重写,原来成员的值就不存在了,而对于struct 的不同成员赋值 是互不影响的。

也就是union会以其成员中,占用存储空间最多的一个对象,来分配内存。在isa中也就是结构体决定了union的大小。
那么为什么会使用union而不使用struct结构呢?
我们可以从isa指针的初始化中看看:

inline void objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
    initIsa(cls, true, hasCxxDtor);
}

inline void objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor) 
{ 
    
    if (!nonpointer) {
        isa.cls = cls;
    } else {
        isa_t newisa(0);
        newisa.bits = ISA_MAGIC_VALUE;
        newisa.has_cxx_dtor = hasCxxDtor;
        newisa.shiftcls = (uintptr_t)cls >> 3;
}

在initInstanceIsa的时候,会调用initInstanceIsa,也就是nonpointer会传true,nonpointer表示的是isa指针优化,具体可以看Tagged Pointer技术。

下面是在指针优化的时候,结构体64位的含义:


arm64中isa中结构体每位的含义.png

下面我们来看下这个结构体具体的含义:

  • nonpointer代表是否开启isa指针优化。关于什么是isa指针优化,可以看看Tagged Pointer技术

  • has_assoc 代表对象含有或者曾经含有关联引用,没有关联引用的可以更快地释放内存

  • has_cxx_dtor 表示该对象是否有 C++ 或者 Objc 的析构器

  • shiftcls :类的指针。arm64架构中有33位可以存储类指针。

  • magic 表示判断对象是否初始化完成,在arm64中0x16是调试器判断当前对象是真的对象还是没有初始化的空间。

  • weakly_referenced 表示对象被指向或者曾经指向一个 ARC 的弱变量,没有弱引用的对象可以更快释放

  • deallocating 对象是否正在释放内存

  • has_sidetable_rc 判断该对象的引用计数是否过大,如果过大则需要其他散列表来进行存储。

  • extra_rc 存放该对象的引用计数值减一后的结果。对象的引用计数超过 1,会存在这个这个里面,如果引用计数为 10,extra_rc的值就为 9。

从以上信息可以看出来isa指针不仅存储了类的指针,还存储了是否开启指针优化,是否有析构器、是否包含关联引用、是否正在释放等信息。

总结:
1.在方法调用时,查找缓存,是从objc_class的cache中取的bucket_t,通过key来查找对应的方法实现,实现方法的响应。
2.类对应的方法、属性、协议存储在objc_class中的bits里面,这里面有个结构体class_rw_t和结构体class_ro_t,class_ro_t是存储编译器的方法、属性、协议,运行期添加的方法属性协议,都是存储在class_rw_t中。
3.isa指针在arm64和x86_64位时,对应结构体中每位的含义不同,isa指针不仅存储了类的指针,还存储了是否开启指针优化,是否有析构器、是否包含关联引用、是否正在释放等信息。

参考:
objc4-750源码
从 NSObject 的初始化了解 isa.md
深入理解Objective-C:Category
深入解析 ObjC 中方法的结构
神经病院 Objective-C Runtime 入院第一天—— isa 和 Class
What is a meta-class in Objective-C?
objc_explain_Classes_and_metaclasses
isa详解

你可能感兴趣的:(Objc源码之NSObject和isa)