准备工作:
- 下载源码
- 编译源码
在分析alloc
之前,上文介绍了三种探索源码的方式,细心的同学应该发现第二种和第三种都进入的objc_alloc
而不是我们期待的alloc
。下面先探究为什么会出现这种情况。
来到OC的源码,全局搜索objc_alloc
,显示如下:
可以看到在这里对一些消息进行了处理,其中就包括alloc
,使我们实际调用了调用的objc_alloc
的imp
。
再全局搜索fixupMessageRef
,结果如下图:
通过上图可以发现在_read_images
这一步(即dyld
启动主程序加载动态库的时候)对消息进行了修复。
接下来再看看编译后的Mach-O文件,如下图:
我们发现在Mach-O
中有objc_alloc
这个符号,这充分说明是在编译的时候就存在了。所以接下在LLVM
中全局搜索objc_alloc
,如下图:
在CGObjc.cpp
这个文件的tryGenerateSpecializedMessageSend
函数中发现了端倪,接下里进入EmitObjCAlloc
这个函数。
这只是一个中间层代码,继续进入emitObjCValueOperation
这个函数。
根据注释,在这一步我们调用方法,继续进入EmitCallOrInvoke
这个函数。
根据上方注释是我意思是根据EH堆栈的当前状态,向给定的函数发出调用或调用指令。
Callee
这个参数是前面的CGM.getObjCEntrypoints().objc_alloc
获取到的(即objc_alloc
)。至此,可以的出调用alloc
在LLVM
编译期间就会来到objc_alloc
。
源码跟进alloc流程
新建一个target
并依赖编译好的objc
,创建一个类。在main
文件导入objc/runtime.h
和自己的类头文件。然后alloc
一个自己的类,打上断点。
然后通过Step into
来到了NSObject
的alloc
方法。
根据左侧调用栈明确看到会先调用objc_alloc
,点进去。
在这里没有做任何操作,代码下沉。接着通过来到callAlloc
。
可能这里有些许疑问,没有自定义的allocWithZone
应该调用_objc_rootAllowWithZone
才对。然而这里却通过objc_msgSend
找到并调用了父类(即NSObject)的alloc
方法。
先来到hasCustomAWZ
的源码,如下图:
可以看到这里是取的当前类缓存中的FAST_CACHE_HAS_DEFAULT_AWZ
,而当一个类第一次被加载的时候缓存还没有值,所以这里必定是false。而通过非运算返回出去了一个true,最后通过callAlloc
里面的非运算又再次变成了false,所以不会调用_objc_rootAllocWithZone
。当通过objc_msgSend
之后,缓存就会就会改变。所以同志们可以试试,连续两次初始化同样一个类的对象,看看流程是否一样。
倒叙完成了,接下来来到NSObjec alloc
的下一步,如下图:
依旧代码下沉,调用了callAlloc
,继续跟进。
由于类的缓存已经改变,所以第二次进入了_objc_rootAllocWithZone
了,继续跟进。
代码下沉,没有操作,继续跟进。
这一步为alloc
底层中核心步骤,在这里一共有三个关键的地方:
- 计算所需的内存大小
- 申请对应大小的内存
- 将类和isa关联
如图中lldb
调试那样,关联之后就能拿到类的信息了。
这里总结出了一副alloc
底层流程图。
至此alloc
的底层就探索完毕了,接下来探索一下底层是怎样计算内存大小的。
进入instanceSize
源码,如下图:
- 先判断是否缓存了内存大小,如果已经缓存就直接从缓存读取。
- 如果没有缓存则获取所有成员变量的大小+额外的字节数并且以8字节对齐,最后如果没有16个字节则至少要开辟16个字节。
通过断点调试,这里会进入缓存读取内存大小,进入源码。
其中align16
为16字节对齐算法,此外前面还有word_align
为8字节对其算法。
内存字节对齐原则
在解释为什么需要16字节对齐之前,首先需要了解内存字节对齐的原则,主要有以下三点:
- 数据成员对齐规则:
struct
或者union
的数据成员,第一个数据成员放在offset
为0
的地方,以后每个数据成员存储的起始位置要从该成员大小或者成员的子成员大小(只要该成员有子成员,比如数据、结构体等)的整数倍开始(例如int在32位机中是4字节,则要从4的整数倍地址开始存储)。 - 数据成员为结构体:如果一个结构里有某些结构体成员,则结构体成员要从其内部最大元素大小的整数倍地址开始存储(例如:struct a里面存有struct b,b里面有char、int、double等元素,则b应该从8的整数倍开始存储)。
- 结构体的整体对齐规则:结构体的总大小,即
sizeof
的结果,必须是其内部做大成员的整数倍,不足的要补齐。
为什么需要16字节对齐有以下几点:
- 通常内存是由一个个字节组成的,cpu在存取数据时,并不是以字节为单位存储,而是以块为单位存取,块的大小为内存存取力度。频繁存取字节未对齐的数据,会极大降低cpu的性能,所以可以通过减少存取次数来降低cpu的开销。
- 16字节对齐,是由于在一个对象中,第一个属性
isa
占8
字节,当然一个对象肯定还有其他属性,当无属性时,会预留8字节,即16字节对齐,如果不预留,相当于这个对象的isa和其他对象的isa紧挨着,容易造成访问混乱。 - 16字节对齐后,可以加快CPU读取速度,同时使访问更安全,不会产生访问混乱的情况。
init源码分析
通过断点进入源码
init
其实返回的就是self
。
new源码分析
同样通过断点进入源码
new
在底层会被替换成objc_opt_new
,不同的是根据头文件是在iOS 13.0
之后。第一次加载同样会通过objc_msgSend
调用[NSObject new]
。
最终会调用callAlloc
和init
,所以new
相当于alloc
+init
。
另外如果在iOS 12.2
之后[[Class alloc] init]
这种嵌套初始化会在底层调用objc_alloc_init
。