iOS底层类结构分析

类 的分析

类的分析 主要是分析 isa的走向 以及 继承关系

定义两个类

  • 继承自NSObject的类LGPerson
@interface LGPerson : NSObject
{
    NSString *hobby;
}
@property (nonatomic, copy) NSString *lg_name;
- (void)sayHello;
+ (void)sayBye;
@end

@implementation LGPerson
- (void)sayHello
{}
+ (void)sayBye
{}
@end

  • 继承自LGPerson的类LGTeacher
@interface LGTeacher : LGPerson
@end

@implementation LGTeacher
@end

  • 在main中分别用两个定义两个对象:person & teacher
int main(int argc, const char * argv[]) {
    @autoreleasepool {
        //ISA_MASK  0x00007ffffffffff8ULL
        LGPerson *person = [LGPerson alloc];
        LGTeacher *teacher = [LGTeacher alloc];
        NSLog(@"Hello, World! %@ - %@",person,teacher);  
    }
    return 0;
}

元类

首先,我们先通过一个案例的lldb调试先引入元类

  • 在main中LGTeacher部分加一个断点,运行程序

  • 开启lldb调试,调试的过程如下图所示

    image

根据调试过程,我们产生了一个疑问:为什么图中的p/x 0x001d8001000022dd & 0x00007ffffffffff8ULLp/x 0x00000001000022b0 & 0x00007ffffffffff8ULL 中的类信息打印出来都是LGPerson

  • 0x001d8001000022ddperson对象的isa指针地址,其&后得到的结果创建person的类LGPerson
  • 0x00000001000022b0是isa中获取的类信息所指的类的isa的指针地址,即 LGPerson类的类isa指针地址,在Apple中,我们简称LGPerson类的类元类
  • 所以,两个打印都是LGPerson的根本原因就是因为元类导致的

元类的说明

下面来解释什么是元类

  • 我们都知道 对象isa 是指向的其实也是一个对象,可以称为类对象,其isa的位域指向苹果定义的元类

  • 元类系统给的,其定义创建都是由编译器完成,在这个过程中,归属来自于元类

  • 元类类对象,每个都有一个独一无二的元类用来存储 类方法的相关信息

  • 元类本身是没有名称的,由于与关联,所以使用了同类名一样的名称

下面通过lldb命令来探索元类的走向,也就是isa走位,如下图所示,可以得出一个关系链:对象 --> 类 --> 元类 --> NSobject, NSObject 指向自身

总结

从图中可以看出

  • 对象isa 指向 (也可称为类对象
  • isa 指向 元类
  • 元类isa 指向 根元类,即NSObject
  • 根元类isa 指向 它自己

NSObject到底有几个?

从图中可以看出,最后的根元类NSObject,这个NSObject 与我们日开开发中所知道的NSObject是同一个吗?

有以下两种验证方式

  • 【方式一】lldb命令验证
  • 【方式二】代码验证

【方式一】lldb命令验证

我们也通过lldb调试,来验证这两个NSObject是否是同一个,如下图所示

image

从图中可以看出,最后NSObject类的元类 也是NSObject,与上面的LGPerson中的根元类(NSObject)的元类,是同一个,所以可以得出一个结论:内存中只存在存在一份根元类NSObject,根元类的元类是指向它自己

【方式二】代码验证

通过三种不同的方式获取类,看他们打印的地址是否相同

//MARK:--- 分析类对象内存 存在个数
void testClassNum(){
    Class class1 = [LGPerson class];
    Class class2 = [LGPerson alloc].class;
    Class class3 = object_getClass([LGPerson alloc]);
    NSLog(@"\n%p-\n%p-\n%p-\n%p", class1, class2, class3);
}

以下是代码运行的结果

image

从结果中可以看出,打印的地址都是同一个,所以NSObject只有一份,即NSObject(根元类)在内存中永远只存在一份

由于类的信息在内存中永远只存在一份,所以 类对象只有一份

著名的 isa走位 & 继承关系 图

根据上面的探索以及各种验证,对象、类、元类、根元类的关系如下图所示

image

isa走位

isa的走向有以下几点说明:

  • 实例对象(Instance of Subclass)isa 指向 类(class)

  • 类对象(class) isa 指向 元类(Meta class)

  • 元类(Meta class)isa 指向 根元类(Root metal class)

  • 根元类(Root metal class)isa 指向它自己本身,形成闭环,这里的根元类就是NSObject

superclass走位

superclass(即继承关系)的走向也有以下几点说明:

  • 之间 的继承关系:

    • 类(subClass) 继承自 父类(superClass)

    • 父类(superClass) 继承自 根类(RootClass),此时的根类是指NSObject

    • 根类 继承自 nil,所以根类NSObject可以理解为万物起源,即无中生有

  • 元类也存在继承,元类之间的继承关系如下:

    • 子类的元类(metal SubClass) 继承自 父类的元类(metal SuperClass)

    • 父类的元类(metal SuperClass) 继承自 根元类(Root metal Class

    • 根元类(Root metal Class) 继承于 根类(Root class),此时的根类是指NSObject

  • 【注意】实例对象之间没有继承关系之间有继承关系

举例说明

以前文提及的的LGTeacher及对象teacherLGPerson及对象person举例说明,如下图所示

WeChat6e0fdb8378fdb1126945ffa5d1aae1da.png

objc_class & objc_object

isa走位我们理清楚了,又来了一个新的问题:为什么 对象都有isa属性呢?这里就不得不提到两个结构体类型:objc_class & objc_object

下面在这两个结构体的基础上,对上述问题进行探索。

  • NSObject的底层编译是NSObject_IMPL结构体,
    • 其中 Classisa指针的类型,是由objc_class定义的类型,
    • objc_class是一个结构体。在iOS中,所有的Class都是以 objc_class 为模板创建的`
struct NSObject_IMPL {
    Class isa;
};

typedef struct objc_class *Class;

以下是编译后的main.cpp中的objc_object的定义

struct objc_object {
    Class _Nonnull isa __attribute__((deprecated));
};

  • 结构体类型objc_class 继承自objc_object类型,其中objc_object也是一个结构体,且有一个isa属性,所以objc_class也拥有了isa属性

  • mian.cpp底层编译文件中,NSObject中的isa在底层是由Class 定义的,其中class的底层编码来自 objc_class类型,所以NSObject也拥有了isa属性

  • NSObject 是一个类,用它初始化一个实例对象objc,objc 满足 objc_object 的特性(即有isa属性),主要是因为isa 是由 NSObjectobjc_class继承过来的,而objc_class继承自objc_objectobjc_objectisa属性。所以对象都有一个 isa,isa表示指向,来自于当前的objc_object

  • objc_object(结构体) 是 当前的 根对象所有的对象都有这样一个特性 objc_object,即拥有isa属性

总结

  • 所有的对象 + + 元类 都有isa属性

  • 所有的对象都是由objc_object继承来的

  • 简单概括就是万物皆对象,万物皆来源于objc_object,有以下两点结论:

    • 所有以 objc_object为模板 创建的对象,都有isa属性

    • 所有以objc_class为模板,创建的,都有isa属性

  • 在结构层面可以通俗的理解为上层OC底层对接

    • 下层是通过 结构体 定义的 模板,例如objc_class、objc_object
    • 上层 是通过底层的模板创建的 一些类型,例如LGPerson

objc_class、objc_object、isa、object、NSObject等的整体的关系,如下图所示

类结构分析

主要是分析类信息中存储了哪些内容

补充知识-内存偏移

在分析类结构之前,需要先了解内存偏移,因为类信息中访问时,需要使用内存偏移

【普通指针】

//普通指针
    int a = 10; //变量
    int b = 10;
    NSLog(@"%d -- %p", a, &a);
    NSLog(@"%d -- %p", b, &b);

打印结果如下图所示

  • a、b都指向10,但是a、b的地址不一样,这是一种拷贝,属于值拷贝,也称为深拷贝

  • a,b的地址之间相差 4 个字节,这取决于a、b的类型

其地址指向如图所示

image

【对象指针】

//对象
    CJLPerson *p1 = [CJLPerson alloc]; // p1 是指针
    CJLPerson *p2 = [CJLPerson alloc];
    NSLog(@"%d -- %p", p1, &p1);
    NSLog(@"%d -- %p", p2, &p2);

打印结果如图所示

[图片上传失败...(image-b24a60-1650970310620)]

  • p1、p2 是指针,p1 是 指向 [CJLPerson alloc]创建的空间地址,即内存地址,p2 同理

  • &p1、&p2是 指向 p1、p2对象指针的地址,这个指针 就是 二级指针

其指针的指向如下图所示

[图片上传失败...(image-975329-1650970310620)]

【数组指针】

//数组指针
    int c[4] = {1, 2, 3, 4};
    int *d = c;
    NSLog(@"%p -- %p - %p", &c, &c[0], &c[1]);
    NSLog(@"%p -- %p - %p", d, d+1, d+2);

  • &c&c[0] 都是取 首地址,即数组名等于首地址
  • &c&c[1] 相差4个字节,地址之间相差的字节数,主要取决于存储的数据类型
  • 可以通过 首地址+偏移量取出数组中的其他元素,其中偏移量是数组的下标,内存中首地址实际移动的字节数 等于 偏移量 * 数据类型字节数

探索类信息中都有哪些内容

探索类信息中有什么时,事先我们并不清楚类结构是什么样的,但是我们可以通过得到一个首地址,然后通过地址平移去获取里面所有的值

根据前文提及的objc_class 的新版定义(objc4-781版本)如下,有以下几个属性

struct objc_class : objc_object {
    // Class ISA; //8字节
    Class superclass; //Class 类型 8字节
    cache_t cache;             // formerly cache pointer and vtable
    class_data_bits_t bits;    // class_rw_t * plus custom rr/alloc flags

    //....方法部分省略,未贴出
}

  • isa属性:继承自objc_objectisa,占 8字节

  • superclass 属性:Class类型,Class是由objc_object定义的,是一个指针,占8字节

  • cache属性:简单从类型class_data_bits_t目前无法得知,而class_data_bits_t是一个结构体类型,结构体内存大小需要根据内部的属性来确定,而结构体指针才是8字节

  • bits属性:只有首地址经过上面3个属性的内存大小总和的平移,才能获取到bits

计算 cache 类的内存大小

进入cache类cache_t的定义(只贴出了结构体中非static修饰的属性,主要是因为static类型的属性 不存在结构体的内存中),有如下几个属性

struct cache_t {
#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_OUTLINED
    explicit_atomic _buckets; // 是一个结构体指针类型,占8字节
    explicit_atomic _mask; //是mask_t 类型,而 mask_t 是 unsigned int 的别名,占4字节
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
    explicit_atomic _maskAndBuckets; //是指针,占8字节
    mask_t _mask_unused; //是mask_t 类型,而 mask_t 是 uint32_t 类型定义的别名,占4字节

#if __LP64__
    uint16_t _flags;  //是uint16_t类型,uint16_t是 unsigned short 的别名,占 2个字节
#endif
    uint16_t _occupied; //是uint16_t类型,uint16_t是 unsigned short 的别名,占 2个字节

  • 计算前两个属性内存大小,有以下两种情况,最后的内存大小总和都是12字节

    • 【情况一】if流程

      • buckets 类型是struct bucket_t *,是结构体指针类型,占8字节

      • maskmask_t 类型,而 mask_tunsigned int 的别名,占4字节

    • 【情况二】elseif流程

      • _maskAndBucketsuintptr_t类型,它是一个指针,占8字节

      • _mask_unusedmask_t 类型,而 mask_tuint32_t 类型定义的别名,占4字节

  • _flagsuint16_t类型,uint16_t是 unsigned short 的别名,占 2个字节

  • _occupieduint16_t类型,uint16_t是 unsigned short 的别名,占 2个字节

总结:所以最后计算出cache类的内存大小 = 12 + 2 + 2 = 16字节

获取bits

所以有上述计算可知,想要获取bits的中的内容,只需通过首地址平移32字节即可

  • 获取类的首地址有两种方式

    • 通过p/x LGPerson.class直接获取首地址

    • 通过x/4gx LGPerson.class,打印内存信息获取

  • 其中的data()获取数据,是由objc_class提供的方法

  • $2指针的打印结果中可以看出bits中存储的信息,其类型是class_rw_t,也是一个结构体类型。但我们还是没有看到属性列表、方法列表等,需要继续往下探索

探索 属性列表,即 property_list

通过查看class_rw_t定义的源码发现,结构体中有提供相应的方法去获取 属性列表、方法列表等,如下所示

获取bits并打印bits信息的基础上,通过class_rw_t提供的方法,继续探索 bits中的属性列表

  • p $8.properties()命令中的propertoes方法是由class_rw_t提供的,方法中返回的实际类型property_array_t

  • 由于list的类型是property_list_t,是一个指针,所以通过 p *$10获取内存中的信息,同时也证明bits中存储了 property_list,即属性列表

  • p $11.get(1),想要获取LGPerson中的成员变量``bobby, 发现会报错,提示数组越界了,说明 property_list 中只有 一个属性lg_name

【问题】探索成员变量的存储

由此可得出property_list 中只有属性,没有成员变量,属性与成员变量的区别就是有没有set、get方法,如果有,则是属性,如果没有,则是成员变量。

那么问题来了,成员变量存储在哪里?为什么会有这种情况?请移至文末的分析与探索

探索 方法列表,即methods_list

准备工作:在前文提及的LGPerson中增加两个方法(实例方法 & 类方法)

//LGPerson.h
@property (nonatomic, copy) NSString *lg_name;
- (void)sayHello;
+ (void)sayBye;
@end

//LGPerson.m
@implementation LGPerson
- (void)sayHello
{}
+ (void)sayBye
{}
@end

  • 通过 p $4.methods() 获得具体的方法列表list结构,其中methods也是class_rw_t提供的方法

  • 通过打印的count = 4可知,存储了4个方法,可以通过p $7.get(i)内存偏移的方式获取单个方法,i 的范围是0-3

  • 如果在打印 p $7.get(4),获取第五个方法,也会报错,提示数组越界

新问题的探索

【问题】探索成员变量的存储

由上面的属性列表分析可得出property_list 中只有属性,没有成员变量,那么问题来了,成员变量存储在哪里?为什么会有这种情况?

通过查看objc_classbits属性中存储数据的类class_rw_t的定义发现,除了methods、properties、protocols方法,还有一个ro方法,其返回类型是class_ro_t,通过查看其定义,发现其中有一个ivars属性,我们可以做如下猜测:是否成员变量就存储在这个ivar_list_t类型的ivars属性中呢?

  • class_ro_t结构体中的属性如下所示,想要获取ivars,需要ro的首地址平移48字节
struct class_ro_t {
    uint32_t flags;     //4
    uint32_t instanceStart;//4
    uint32_t instanceSize;//4
#ifdef __LP64__
    uint32_t reserved;  //4
#endif

    const uint8_t * ivarLayout; //8

    const char * name; //1 ? 8
    method_list_t * baseMethodList; // 8
    protocol_list_t * baseProtocols; // 8
    const ivar_list_t * ivars;

    const uint8_t * weakIvarLayout;
    property_list_t *baseProperties;

    //方法省略
}

通过图中可以看出,获取的ivars属性,其中的count2,通过打印发现 成员列表中除了有hobby,还有name,所以可以得出以下一些结论:

  • 通过{}定义的成员变量,会存储在类的bits属性中,通过bits --> data() -->ro() --> ivars获取成员变量列表,除了包括成员变量,还包括属性定义的成员变量

  • 通过@property定义的属性,也会存储在bits属性中,通过bits --> data() --> properties() --> list获取属性列表,其中只包含属性

【问题】探索类方法的存储

由此可得出methods list 中只有 实例方法,没有类方法,那么问题来了,类方法存储在哪里?为什么会有这种情况?下面我们来仔细分析下

在文章前半部分,我们曾提及了元类类对象isa指向就是元类元类是用来存储类的相关信息的,所以我们猜测:是否类方法存储在元类的bits中呢

  • 实例方法存储在类的bits属性中,通过bits --> methods() --> list获取实例方法列表,例如LGPerson类的实例方法sayHello 就存储在 LGPerson类的bits属性中,类中的方法列表除了包括实例方法,还包括属性的set方法get方法`

  • 类方法存储在元类的bits属性中,通过元类bits --> methods() --> list获取类方法列表,例如LGPerson中的类方法sayBye 就存储在LGPerson类的元类(名称也是LGPerson)的bits属性中

你可能感兴趣的:(iOS底层类结构分析)