OC对象原理(二) 内存对齐探索&malloc源码分析

iOS底层原理篇 主要是围绕底层进行源码分析-LLDB调试-源码断点-汇编调试,让自己以后回顾复习Runtime底层之美的
目录如下:
OC对象原理(一) alloc&init探索
OC对象原理(二) 内存对齐探索&malloc源码分析
持续更新中....更新有点慢请谅解....
文中有误的地方请指正,大家一起学习


如何查看对象属性在内存中的显示

来看下图代码:

OC对象原理(二) 内存对齐探索&malloc源码分析_第1张图片

有四个属性,那他们在内存中是如何显示的呢?
我们一起来看看呗:

OC对象原理(二) 内存对齐探索&malloc源码分析_第2张图片

我们应先给对应的属性赋值,不然的话他们在内存中就是假的地址.因为内存是连续的,如果没去用的话,在内存中就是野指针.
那我们如何去查看呢?有两种方式:
第一种方式LLDB指令:(x p):以十六进制打印这个对象的地址空间.
OC对象原理(二) 内存对齐探索&malloc源码分析_第3张图片

第二种方式:Debug->Debug Workflow->View Memory(shift + Command +M)

一般不推荐用第二种方式.


内存对齐的原则

先补充一点sizeof()知识:sizeof()是获取类型的大小,它是一个运算符,而不是方法,在编译的时候就是一个确定的数据.

Interger data type ILP32 size ILP64 size
char 1 byte 1 byte
BOOL,bool 1 byte 1 byte
short 2 byte 2 byte
float 4 byte 4 byte
CGFloat 8 byte 8 byte
int 4 byte 4 byte
long 4 byte 8 byte
long long 8 byte 8 byte
double 8 byte 8 byte
pointer 4 byte 8 byte
结构体 最大属性内存的倍数 最大属性内存的倍数

接下来我们来看一个问题:CGPoint在内存中如何分配?
CGPoint在OC中是一个结构体,结构体一般采用内存对齐的方式分配.

内存对齐的原则

  • 数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员存储的起始位置要从该成员大小或者子成员大小(只要该成员有子成员,比如说是数组,结构体等)的整数倍开始(比如int为4字节,则要从4的整数倍地址开始存储)存储.(比如min(当前开始的位置m n) m = 9 n = 4,9不是4的整数倍,那么要舍弃填充 9 10 11,从12(12是4的整数倍) 开始存储).

  • 结构体作为成员:如果一个结构里面有某些结构体成员,则结构体成员要从其内部最大元素大小的整数倍地址开始存储.(struct A里存有struct B,B里有char,int,double等元素,那B应该从8的整数倍开始存储.)但在确定复合类型成员的偏移位置时则是将复合类型作为整体看待。

  • 结构体的总大小,也就是sizeof的结果:必须是其内部最大成员的整数倍,不足的要补齐.

  • 总结:结构体的大小等于最后一个成员的偏移量加上其大小再加上末尾的填充字节数目.即:sizeof(struct) = offset(last item) + sizeof(last item) + sizeof( training padding)

    前面的地址必须是后面的地址整数倍,不是就补齐。
    整个结构体的地址必须是最大字节的整数倍。
    在确定复合类型成员的偏移位置时则是将复合类型作为整体看待。

结构体的sizeof() 长度用 补、偏、长结构体长度按成员最大长度对齐 结合的方式来计算有助于我们理解内存对齐的原则.
例一:

OC对象原理(二) 内存对齐探索&malloc源码分析_第4张图片

例二:成员个数与每个成员类型都一样,只不过顺序不一样,占内存大小就不一样。

OC对象原理(二) 内存对齐探索&malloc源码分析_第5张图片

例三:复合型结构体(结构体里嵌套结构体)

OC对象原理(二) 内存对齐探索&malloc源码分析_第6张图片

例子中的struct2 struct3 是例二中的 struct2 struct3.

那么为什么要对齐呢?

现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。
对齐的作用和原因:各个硬件平台在对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐.其他平台可能没有这种情况,但是最常见的是如果不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出这32bit,而如果存放在奇地址开始的地方,就需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。显然在读取效率上下降很多。

对象的内存对齐

问题:一个OC对象占据了多少内存空间呢?下面让我们用代码实际验证一下.

OC对象原理(二) 内存对齐探索&malloc源码分析_第7张图片

通过代码我们创建了一个NSObject对象,分别调用了class_getInstanceSize和malloc_size方法来查看占据的内存空间。我们看到打印输出了8和16,这是怎么回事呢?
我们通过查看OC源码可知,class_getInstanceSize是返回类的成员变量占据内存的大小.而malloc_size是获取obj指针指向内存的大小.
通过命令行将OC的main.m文件转换成C++,生成main.cpp.

   clang -rewrite-objc main.m -o main.cpp 
/***rewrite代表 重写
   *-o代表 输出
   *cpp代表 c++(c plus plus)
**/

需要注意这种方式没有指定运行平台和架构模式,我们可以通过命令行设置参数,来指定运行平台和架构模式

   xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main.cpp 
/***xcrun代表 xcode
   * iphoneos代表 运行在iPhone上
   *-arch代表 架构模式,arm64参数代表64位的架构模式
**/

生成的main.cpp 文件就是main.m转换c++后的文件,直接拖拽到工程中,就可以查看底层实现了。我们在main.cpp 文件中搜索NSObjcet,可以找到NSObjcet_IMPL(IMPL即 implementation 的缩写,代表实现)。


OC对象原理(二) 内存对齐探索&malloc源码分析_第8张图片

可以看到,NObject的底层实现就是一个结构体.我们进一步查看Class

我们发现Class其实就是一个指针,指向了objc_class类型的结构体.
那么创建的NSObject对象obj的结构体只有一个成员:isa指针,而指针在64位架构中占8个字节,所以第一次打印输出了8。但是系统为obj对象分配了16个字节的内存,第二次打印输出16.
我们在通过objc源码来看一下:

OC对象原理(二) 内存对齐探索&malloc源码分析_第9张图片

通过alloc底层源码可以看到,如果一个对象占据的内存小于16时,则会直接返回16,也就是说,系统在为对象分配内存空间时,最小为16个字节。
至此我们知道了系统在创建一个对象的时候会为其分配最少16字节的内存空间,其中对象的isa指针占据8个字节。
到此处相信大家都理解,为什么打印8和16了吧.
接下来,在解释一下为什么打印40和48?
根据前面我们说的结构体内存对齐,相信大家很快就能知道为啥打印40.
首先TCJTeacher继承NSObject,内部包含一个isa占8字节,name属性占8字节,age为int修饰占4字节,height为long修饰占8字节,hobby属性占8字节,一共占36,又36不是8的整数倍,根据结构体内存对齐原则:整个结构体的地址必须是最大字节的整数倍,所以会打印40.
接下来我们来分析为什么打印48?

OC对象原理(二) 内存对齐探索&malloc源码分析_第10张图片

从图上我们可以看到calloc方法在malloc源码里面.至此我们换一份源码分析:

OC对象原理(二) 内存对齐探索&malloc源码分析_第11张图片

之后进入calloc流程,进行具体的内存开辟,在使用calloc申请内存的过程中,首先调用malloc_zone_calloc方法

OC对象原理(二) 内存对齐探索&malloc源码分析_第12张图片
在其内部调用zone->calloc初始化并且返回了一个ptr指针
OC对象原理(二) 内存对齐探索&malloc源码分析_第13张图片

断点到此处,并且打印 zone->calloc ,根据提示找到default_zone_calloc

OC对象原理(二) 内存对齐探索&malloc源码分析_第14张图片

default_zone_calloc方法内部又看到熟悉的zone->calloc,继续打印得到提示nano_calloc

OC对象原理(二) 内存对齐探索&malloc源码分析_第15张图片

malloc的源码中搜索nano_calloc,于nano_calloc.c文件中找到该方法,其中的核心代码_nano_malloc_check_clear,进行内存申请,并且返回一个成熟的指针ptr

OC对象原理(二) 内存对齐探索&malloc源码分析_第16张图片

其中_nano_malloc_check_clear方法内部的segregated_size_to_fit则是对象开启内存的大小的算法,表明其实际对齐原则为16字节对齐

OC对象原理(二) 内存对齐探索&malloc源码分析_第17张图片
OC对象原理(二) 内存对齐探索&malloc源码分析_第18张图片
OC对象原理(二) 内存对齐探索&malloc源码分析_第19张图片

到这知道为什么会打印48了吧.
总结:
对象内存的申请按照8字节对齐,不满16字节按照16字节计算;但是实际上calloc实际开辟内存的时候,则是进行了16字节对齐.
最后附上calloc流程图:

OC对象原理(二) 内存对齐探索&malloc源码分析_第20张图片
calloc流程图.png

你可能感兴趣的:(OC对象原理(二) 内存对齐探索&malloc源码分析)