iOS底层原理探究 - 对象的本质和isa探索

前言

我们都知道OC是一门面向对象的开发语言,那么在开发中免不了经常会提起的一个词,就是对象。我们也经常会说万物皆对象,说到对象就不得不说另外一个isa,那么对象的本质是什么呢?对象isa到底是什么关系呢?接下来让我们一起探索。

一、对象

我们探索对象本质之前需要先了解一个编译器Clang

Clang
  • Clang是⼀个由Apple主导编写,基于LLVMC/C++/Objective-C编译器。
  • Clang可以将源文件编译成.cpp,可执行文件。

Clang常用编译命令:

  • 把⽬标⽂件编译成c++⽂件
    -o:输出
    clang -rewrite-objc main.m -o main.cpp
  • UIKit报错问题
    clang -rewrite-objc -fobjc-arc -fobjc-runtime=ios-13.0.0 -isysroot /
    Applications/Xcode.app/Contents/Developer/Platforms/
    iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator13.0.sdk main.m
  • xcode安装的时候顺带安装了xcrun命令,xcrun命令在clang的基础上进⾏了⼀些封装,要更好⽤⼀些
    (模拟器)
    xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
    (⼿机)
    xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main�-arm64.cpp
对象的本质

下面我们通过Clang来探索对象的本质,实例代码如下:

@interface JPerson : NSObject
{
    int age;
    
}
@property (nonatomic, strong) NSString *JCName;
@property (nonatomic, assign) float height;
@end

@implementation JPerson

@end

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        // insert code here...
        NSLog(@"Hello, World!");
    }
    return 0;
}

首先cd到我们需要编译的文件路径下,然后执行clang -rewrite-objc main.m -o main.cpp命令,生成.cpp的一个文件,我们打开.cpp文件来分析底层实现。
全局搜索JPerson类:

#ifndef _REWRITER_typedef_JPerson
#define _REWRITER_typedef_JPerson
typedef struct objc_object JPerson;
typedef struct {} _objc_exc_JPerson;
#endif

extern "C" unsigned long OBJC_IVAR_$_JPerson$_JCName;
extern "C" unsigned long OBJC_IVAR_$_JPerson$_height;
struct JPerson_IMPL {
    struct NSObject_IMPL NSObject_IVARS;
    int age;
    float _height;
    NSString *_JCName;
};
// @property (nonatomic, strong) NSString *JCName;
// @property (nonatomic, assign) float height;
/* @end */

// @implementation JPerson
static NSString * _I_JPerson_JCName(JPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_JPerson$_JCName)); }
static void _I_JPerson_setJCName_(JPerson * self, SEL _cmd, NSString *JCName) { (*(NSString **)((char *)self + OBJC_IVAR_$_JPerson$_JCName)) = JCName; }

static float _I_JPerson_height(JPerson * self, SEL _cmd) { return (*(float *)((char *)self + OBJC_IVAR_$_JPerson$_height)); }
static void _I_JPerson_setHeight_(JPerson * self, SEL _cmd, float height) { (*(float *)((char *)self + OBJC_IVAR_$_JPerson$_height)) = height; }
// @end

从源码我们可以看出

  • JPerson的底层就是结构体JPerson_IMPL,里面包括我们定义的属性成员变量
  • JPerson继承自NSObject,底层是JPerson_IMPL继承自NSObject_IMPL,属于伪继承
  • 定义的属性在底层都统一变成带_ 的成员变量 ,底层实现了settergetter方法,
  • NSObject_IVARS就是NSObject中的isa指针
扩展:
  • 为什么底层JPersonobjc_object结构体类型呢?那是因为在上层JPerson继承NSObject,但是NSObject真正的底层实现是objc_object
  • Class是一个objc_class的结构体指针类型,objc_class是类的底层实现
  • id在底层也是一个objc_object结构体指针类型,所以可以使用id person的方式修饰,而不需要加*
typedef struct objc_object JPerson;
# 对象的底层实现
struct objc_object {
    Class _Nonnull isa __attribute__((deprecated));
};

typedef struct objc_object *id;

# NSObject的底层实现
struct NSObject_IMPL {
    Class isa;
};

typedef struct objc_class *Class;
# 类的底层实现
struct objc_class {
    Class _Nonnull isa __attribute__((deprecated));
} __attribute__((unavailable));
  • 属性的getter方法为什么是通过(*(NSString **)((char *)self + OBJC_IVAR_$_JPerson$_JCName))去获取值的呢?因为在我们的堆空间里面是不知道值的具体位置的,而是通过首地址+变量的偏移量去得到相应的值

二、NonPointerIsa

首先我们来看一下结构体位域联合体是什么?

1. 结构体位域(bit)

我们知道一个字节=8位(bit),有些数据存储并不需要一个字节,比如Bool类型的数据,只有01两种状态,我们可以用1位来存储达到节省内存空间的作用。下面看一下具体代码实现

# 4字节 * 8位(Bit) = 32  0000 0000 0000 0000 0000 0000 0000 1111
# 只需要4 位
# 1 字节 3倍浪费
struct NormalCar1 {
    BOOL front; // 0 1
    BOOL back;
    BOOL left;
    BOOL right;
};
# 位域
struct BitCar2 {
    BOOL front: 1;      #代表1位,也可以随便自定义多少位
    BOOL back : 1;
    BOOL left : 1;
    BOOL right: 1;
};
#二进制输出为: 0000 1111
int main(int argc, const char * argv[]) {
    @autoreleasepool {
        struct NormalCar1 car1;
        struct BitCar2 car2;
        NSLog(@"%ld-%ld",sizeof(car1),sizeof(car2));
    }
    return 0;
}
2021-06-15 22:50:43.793511+0800 001-联合体位域[99097:1645306] 4-1

从输出结果可以看到,不用位域的方式输出是4个字节,而位域的方式只需要1个字节。这就是差别

2. 联合体(union)

# 共存
struct NormalTeacher {
    char        *name;
    int         age;
    double      height ;
};
# 联合体  互斥
union UnionTeacher {
    char        *name;
    int         age;
    double      height ;
};
int main(int argc, const char * argv[]) {
    @autoreleasepool {
        struct NormalTeacher   teacher1;
        teacher1.name = "CC";
        teacher1.age  = 18;

        union UnionTeacher    teacher2;
        teacher2.name = "CC";
        teacher2.age  = 18;

        NSLog(@"%ld-%ld",sizeof(teacher1),sizeof(teacher2));
    }
    return 0;
}
(lldb) p teacher1
(NormalTeacher) $1 = (name = "CC", age = 18, height = 0)
(lldb) p teacher2
(UnionTeacher) $2 = (name = "", age = 18, height = 2.1219957998584539E-314)
2021-06-15 23:56:12.676728+0800 001-联合体位域[370:1673124] 24-8

从打印信息可以看出,尽管我们对name进行了赋值,但是在union中只打印出了后面赋值的属性值,而结构体会将赋值的属性值全部打印出来。

总结:

  • 联合体的内存大小由其中最大的成员变量的大小决定。
  • 联合体中的所有变量共用一块内存,变量之间互斥

优缺点:

  • 内存使用灵活,节省内存空间。
  • 不够包容,变量互斥。

3. isa指针结构

alloc一个对象底层核心的三个方法是cls->instanceSize(),calloc(1, size),obj->initIsa(cls),我们知道obj->initIsa(cls)方法是对象isa进行关联,那么isa是怎么来的呢?

通过断点进入到objc_object::initIsa()方法

inline void 
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor) 
{ 
    ASSERT(!isTaggedPointer()); 
    # 是否是纯的isa
    if (!nonpointer) { 
        # 如果是纯的isa的话直接赋值类
        isa = isa_t((uintptr_t)cls); 
    } else {
        ASSERT(!DisableNonpointerIsa);
        ASSERT(!cls->instancesRequireRawIsa());
        isa_t newisa(0);
#if SUPPORT_INDEXED_ISA
        ASSERT(cls->classArrayIndex() > 0);
        newisa.bits = ISA_INDEX_MAGIC_VALUE;
        newisa.has_cxx_dtor = hasCxxDtor;
        newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
        newisa.bits = ISA_MAGIC_VALUE;
        newisa.has_cxx_dtor = hasCxxDtor;
        newisa.shiftcls = (uintptr_t)cls >> 3;
#endif
        instantiation
        isa = newisa;
    }
}

我们可以发现其中比较重要的一个类型isa_t,看一下isa_t的实现

union isa_t {
    isa_t() { }
    isa_t(uintptr_t value) : bits(value) { }

    Class cls;
    uintptr_t bits;
#if defined(ISA_BITFIELD)
    struct {
        ISA_BITFIELD;  // defined in isa.h
    };
#endif
};

源码分析: isa_t是联合体,里面包括两个析构函数,cls,bits,而联合体是互斥的,这意味着:

  • cls被赋值了,那么bits就没有值或者被覆盖
  • bits被赋值了,那么cls就没有值或者被覆盖

isa_t联合体中还有一个结构体,里面放着一个ISA_BITFIELD成员变量,这是一个,主要通过位域的方式来存储信息,具体信息如下:

ISA_BITFIELD描述.png

总结:
  • isa指针分为nonPointerIsa非nonPointerIsa非nonPointerIsa是一个纯isa指针类型,只包含类指针的值;而nonPointerIsa还包含一些其他类的信息
  • isa联合体+位域的方式存储信息的,主要目的是为了节省内存空间;

4. isa关联类的方式

  • isa位运算
  • isa&ISA_MASK 掩码

接下来验证这两种方式:
(这里需要扩展一个知识,iOS是属于小端模式,所以读取数据是从后往前读取的)

  • isa位运算:

类信息是存储在isa指针中的,在位域中用shiftcls来存储,x86_64中从第17位开始存储,大小为44位。位运算的目的就是为了只保留shiftcls信息,其他的位置全部归零。如下图

isa位运算.png

isa位运算图示.png

总结:通过一系列的位运算的最终可以得到类信息,这就是一个纯的isa,这说明isa已经和类进行了关联

  • isa&ISA_MASK

ISA_MASK是一个宏定义。__x86_64__下的值是0x00007ffffffffff8ULL__arm64__下的值是0x0000000ffffffff8ULL。我们通过宏定义来验证一下结果。如下图

isa&ISA_MASK.png

图中可以看出isa & ISA_MASK可以得到JCPerson,说明isa和类已经进行了关联。通过打印ISA_MASK的二进制数据,可以看出前面17位和后面3位都为0,中间44位1ISA_MASK就像一个面具,需要将哪里露出来就&上,其他的部分全部抹掉。

你可能感兴趣的:(iOS底层原理探究 - 对象的本质和isa探索)