OC底层原理02:alloc、init、new的底层源码

准备工作:

  • 下载源码
  • 编译源码

在分析alloc之前,上文介绍了三种探索源码的方式,细心的同学应该发现第二种和第三种都进入的objc_alloc而不是我们期待的alloc。下面先探究为什么会出现这种情况。

来到OC的源码,全局搜索objc_alloc,显示如下:

alloc->objc_alloc

可以看到在这里对一些消息进行了处理,其中就包括alloc,使我们实际调用了调用的objc_allocimp

再全局搜索fixupMessageRef,结果如下图:

fixupMessageRef的调用

通过上图可以发现在_read_images这一步(即dyld启动主程序加载动态库的时候)对消息进行了修复。

接下来再看看编译后的Mach-O文件,如下图:


Mach-O中的objc_alloc

我们发现在Mach-O中有objc_alloc这个符号,这充分说明是在编译的时候就存在了。所以接下在LLVM中全局搜索objc_alloc,如下图:

alloc->objc_alloc

CGObjc.cpp这个文件的tryGenerateSpecializedMessageSend函数中发现了端倪,接下里进入EmitObjCAlloc这个函数。

EmitObjCAlloc

这只是一个中间层代码,继续进入emitObjCValueOperation这个函数。

emitObjCValueOperation

根据注释,在这一步我们调用方法,继续进入EmitCallOrInvoke这个函数。

EmitCallOrInvoke

根据上方注释是我意思是根据EH堆栈的当前状态,向给定的函数发出调用或调用指令。
Callee这个参数是前面的CGM.getObjCEntrypoints().objc_alloc获取到的(即objc_alloc)。至此,可以的出调用allocLLVM编译期间就会来到objc_alloc

源码跟进alloc流程

新建一个target并依赖编译好的objc,创建一个类。在main文件导入objc/runtime.h和自己的类头文件。然后alloc一个自己的类,打上断点。

alloc一个自定义的类

然后通过Step into来到了NSObjectalloc方法。

NSObjec alloc

根据左侧调用栈明确看到会先调用objc_alloc,点进去。

objc_alloc

在这里没有做任何操作,代码下沉。接着通过来到callAlloc

callAlloc

可能这里有些许疑问,没有自定义的allocWithZone应该调用_objc_rootAllowWithZone才对。然而这里却通过objc_msgSend找到并调用了父类(即NSObject)的alloc方法。

先来到hasCustomAWZ的源码,如下图:

hasCustomAWZ

可以看到这里是取的当前类缓存中的FAST_CACHE_HAS_DEFAULT_AWZ,而当一个类第一次被加载的时候缓存还没有值,所以这里必定是false。而通过非运算返回出去了一个true,最后通过callAlloc里面的非运算又再次变成了false,所以不会调用_objc_rootAllocWithZone。当通过objc_msgSend之后,缓存就会就会改变。所以同志们可以试试,连续两次初始化同样一个类的对象,看看流程是否一样。

倒叙完成了,接下来来到NSObjec alloc的下一步,如下图:

_objc_rootAlloc

依旧代码下沉,调用了callAlloc,继续跟进。

第二次来到callAlloc

由于类的缓存已经改变,所以第二次进入了_objc_rootAllocWithZone了,继续跟进。

_objc_rootAllocWithZone

代码下沉,没有操作,继续跟进。

关联isa之前

关联isa之后

这一步为alloc底层中核心步骤,在这里一共有三个关键的地方:

  • 计算所需的内存大小
  • 申请对应大小的内存
  • 将类和isa关联

如图中lldb调试那样,关联之后就能拿到类的信息了。
这里总结出了一副alloc底层流程图。

alloc底层流程图

至此alloc的底层就探索完毕了,接下来探索一下底层是怎样计算内存大小的。
进入instanceSize源码,如下图:

instanceSize

  • 先判断是否缓存了内存大小,如果已经缓存就直接从缓存读取。
  • 如果没有缓存则获取所有成员变量的大小+额外的字节数并且以8字节对齐,最后如果没有16个字节则至少要开辟16个字节。

通过断点调试,这里会进入缓存读取内存大小,进入源码。


fastInstanceSize

其中align16为16字节对齐算法,此外前面还有word_align为8字节对其算法。

对齐算法

内存字节对齐原则

在解释为什么需要16字节对齐之前,首先需要了解内存字节对齐的原则,主要有以下三点:

  • 数据成员对齐规则:struct或者union的数据成员,第一个数据成员放在offset0的地方,以后每个数据成员存储的起始位置要从该成员大小或者成员的子成员大小(只要该成员有子成员,比如数据、结构体等)的整数倍开始(例如int在32位机中是4字节,则要从4的整数倍地址开始存储)。
  • 数据成员为结构体:如果一个结构里有某些结构体成员,则结构体成员要从其内部最大元素大小的整数倍地址开始存储(例如:struct a里面存有struct b,b里面有char、int、double等元素,则b应该从8的整数倍开始存储)。
  • 结构体的整体对齐规则:结构体的总大小,即sizeof的结果,必须是其内部做大成员的整数倍,不足的要补齐。

为什么需要16字节对齐有以下几点:

  • 通常内存是由一个个字节组成的,cpu在存取数据时,并不是以字节为单位存储,而是以块为单位存取,块的大小为内存存取力度。频繁存取字节未对齐的数据,会极大降低cpu的性能,所以可以通过减少存取次数来降低cpu的开销
  • 16字节对齐,是由于在一个对象中,第一个属性isa8字节,当然一个对象肯定还有其他属性,当无属性时,会预留8字节,即16字节对齐,如果不预留,相当于这个对象的isa和其他对象的isa紧挨着,容易造成访问混乱。
  • 16字节对齐后,可以加快CPU读取速度,同时使访问更安全,不会产生访问混乱的情况。

init源码分析

通过断点进入源码


init

_objc_rootInit

init其实返回的就是self

new源码分析

同样通过断点进入源码


objc_opt_new

NSObject new

new在底层会被替换成objc_opt_new,不同的是根据头文件是在iOS 13.0之后。第一次加载同样会通过objc_msgSend调用[NSObject new]

最终会调用callAllocinit,所以new相当于alloc+init

另外如果在iOS 12.2之后[[Class alloc] init]这种嵌套初始化会在底层调用objc_alloc_init


objc_alloc_init

你可能感兴趣的:(OC底层原理02:alloc、init、new的底层源码)