OC对象底层结构

首先,代码要运行肯定也必须要经过编译转换为机器语言才能执行,所以OC代码最终执行的当然也是01表示的机器码。另外,我们一般认为OC代码会先转化为C/C++代码,然后再执行。实际在llvm的工作中,是不是如我们所想,先将OC转化为C/C++,转再化为机器码执行,我目前不能确定,但从效率上来讲,没有必要多这一步,为啥不直接转为机器码?
研究OC对象的本质也就是研究OC对象转换为C++之后的代码逻辑。例如,OC对象在C++里是什么结构表示的?数组,类,结构体还是其他什么结构。OC类的继承功能,多态功能是怎么通过C++实现的,这里的逻辑是什么。runtime为什么可以给OC的类添加方法,交换方法实现等等,这些功能在C++里是怎么实现的?
如果我们要研究C的机构体是怎么实现的,那么就要去读汇编了,汇编就是C的底层逻辑。
还好,OC的底层实现是C++,毕竟还是人类可读的语言,没有读汇编那么痛苦。
这么看来,OC有点像是C++的一个语法糖,难以理解。为什么一个语言可以转换为另一个语言,我始终难以理解。
OC的编译器是ClangLLVM的一个前端模块),可以通过ClangOC转换为C++代码(如果可以通过头文件进去查看源代码也不需要重写这么麻烦)。要搞清楚,这里的C++代码不是一种翻译,而是一种解析,类似于“反编译”。

ClangOC代码解析为C++代码的命令:

clang -rewrite-objc xxx.m -o xxx.cpp

上面的命令的意思是,将OC文件xxx.m转为C++文件xxx.cpp。但是没有指定平台和架构。

xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc xxx.m -o xxx.cpp

我们一般用这个命令,生成的文件会比较小,因为限制了平台和架构。

先建一个最简单的工程,Command Line工程:

命令行工程

main.m文件里加上两个最简单的类,Person继承NSObjectTeacher继承Person

@interface Person : NSObject
{
    NSString *_name;
}
@end
@implementation Person
@end

@interface Teacher : Person
{
    NSString *_age;
}
@end
@implementation Teacher
@end

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        // insert code here...
    }
    return 0;
}

通过clang命令,生成C++文件:

xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o xxx.cpp

打开xxx.cpp文件,搜索PersonTeacher,可以找到下面的两个结构体,可以看到里面有我们定义的属性,由此可以推断,这个就是PersonTeacher的底层实现,并且Teacher里可以找到父类Person
Person里面继承的父类当然就是NSObject:

struct Person_IMPL {
    struct NSObject_IMPL NSObject_IVARS;
    NSString *_name;
};
struct Teacher_IMPL {
    struct Person_IMPL Person_IVARS;
    NSString *_age;
};

可以推测,NSObject的底层实现是NSObject_IMPL,找到其实现:

struct NSObject_IMPL {
    Class isa;
};

所以,可以看到NSObject的本质就是一个结构体,里面只有一个成员变量isa。那这个类的方法放在那里了呢?就在这个isa指针里。

跳到Class的定义里:

typedef struct objc_class *Class;

再看objc_class结构体定义:

struct objc_class {
    Class _Nonnull isa  OBJC_ISA_AVAILABILITY;

#if !__OBJC2__
    Class _Nullable super_class                              OBJC2_UNAVAILABLE;
    const char * _Nonnull name                               OBJC2_UNAVAILABLE;
    long version                                             OBJC2_UNAVAILABLE;
    long info                                                OBJC2_UNAVAILABLE;
    long instance_size                                       OBJC2_UNAVAILABLE;
    struct objc_ivar_list * _Nullable ivars                  OBJC2_UNAVAILABLE;
    struct objc_method_list * _Nullable * _Nullable methodLists                    OBJC2_UNAVAILABLE;
    struct objc_cache * _Nonnull cache                       OBJC2_UNAVAILABLE;
    struct objc_protocol_list * _Nullable protocols          OBJC2_UNAVAILABLE;
#endif

} OBJC2_UNAVAILABLE;

通过这些变量的名字,就可以猜到:

super_class 指向父类的指针

objc_ivar_list 成员变量列表

objc_method_list 方法列表

objc_protocol_list 协议列表

所以,NSObject的底层结构是C++的机构体,结构体里只存储成员变量,方法存储在isa指针指向的另外的地方。所以,方法不是不占内存,只不过是,没有存放在结构体里。

你可能感兴趣的:(OC对象底层结构)