先来看一段简单的程序,运行环境,x64位操作系统,visual studio 2019编译器:
#include
using namespace std;
struct s1 {
char a;
int b;
} ss;
int main()
{
cout << "sizeof(char):" << sizeof(ss.a) << endl;
cout << "sizeof(int):" << sizeof(ss.b) << endl;
cout << "sizeof(struct):" << sizeof(ss) << endl;
}
运行结果如下:
是不是和想象的不太一样,按照常理来说结构体中char成员占1字节,int成员占4字节,所以该及结构体总共应该占5字节内存大小, 但是实际情况却是该结构体占8字节内存,这是怎么回事呢?其实在内存中该结构体是这么存放的,如下图所示(蓝色:存储数据,白色:空闲):
这其实就是结构体中的内存对齐(边界对齐)。
一、首先,为什么要进行内存对齐,即在内存中为什么要这么存放数据呢???
原因一:在内存中存放数据是为了给CPU使用,但是CPU从内存中读取数据并非是一个字节一个字节进行读取的,而是一块一块进行读取的,块的大小(具体和数据总线宽度等有关)称为内存读取粒度(memory granularity)。例如:CPU一次从内存读取8字节,而当一个int(4字节)存储在如下位置时,CPU如何获取该int值呢?
第一步:读取0x00~0x07, 8个字节,获取 int 的前两个字节;
第二步:读取0x08~0x0F, 8个字节,获取 int 的后两个字节;
可以看到,CPU从内存中读取int的四字节数据需要读取两次,大大降低了CPU效率。
原因二:有些硬件平台不能访问任意地址上的任意数据,遇到上述情况,会发生抛出异常或者发生程序崩溃等问题。
因此,为了提升效率、避免异常,就要进行内存对齐,也就是以空间换时间,提高效率。
二、结构体内存对齐的规则,即在内存中结构体数据是按照什么规则进行存放的。
规则一:结构体中元素是按照定义顺序,依次放入到内存中。在存放的过程中,每个成员按照一定的偏移量进行存放,其中第一个成员的偏移量为0,其余成员的偏移量是 对齐数 = min(编译器默认的数字,该成员的大小) 的整数倍(以结构体变量首地址为0计算)。即每个类型成员都会有一个属于自己的对齐数。visual studio中编译器默认的数字是8(windows),gcc默认是4(Linux)。
规则二:在经过规则一存放结构体中的数据后,计算总的存储单元是否是所有元素中最大对齐数的整数倍,是,则结束;不是,则补齐为它的整数倍。
注1:结构体中内存对齐是针对基本类型的(char,short,int,long,float,double等);
注2:对于含有指针的情况,只要记住指针本身所占的存储空间是4个字节就行了,而不必看它是指向什么类型的指针,见例4;
注3:对于含有数组的情况,按数组的类型对齐,如int a[2],则按照int类型对齐,见例5;
注4:对于含有其他结构体变量的情况,该结构体变量存储位置从自己的最大对齐数的整数倍处开始,而结构体的整体大小就是所有最大对齐数(含嵌套的结构体的对齐数)的整数倍,见例6。
三、当用户觉得默认的结构体对齐方式占用内存较大时,可使用预处理指令指定结构体的对齐方式
使用预处理指令#pragma pack(n)可以指定结构体的内存对齐方式,其中n的取值必须是2的幂次方,即1、2、4、8、16等;在没有参数的情况下调用pack会将n设置为编译器默认的数字。该指令成对出现的,用完后恢复默认值。
使用该指令后,实际对齐长度=Min(设置字节长度,结构体成员的大小);
若未使用该指令,实际对齐长度 = Min(编译器默认的数字,结构体成员的大小);
即该指令可以设置编译器默认的对齐数字,其余仍然按照规则一和规则二进行计算。
如下,该结构体变量的存储大小为5个字节:char类型变量的对齐数是1,存储在第0个字节,int类型变量的对齐数是1=Min(1,4),存储在第1-4字节,因此存储大小一共5个字节。
#pragma pack(1) //设置以1个字节为对齐长度
struct S {
char cb;
int ia;
}s;
#pragma pack () //设置默认值为对齐长度
示例如下:
(1)如下结构体,先按照规则一进行存放。首先将字符型变量a存入第0个字节(该结构体在内存开辟的首地址,相对地址);然后再存放整形变量b时,会以4个字节为单位进行存储(对齐数为4=min(8, 4)),由于第一个四字节模块已有数据,因此它会存入第二个四字节模块,也就是存入到第4~7字节;存放双精度实型变量c时,会以8个字节为单位进行存储(对齐数为8=min(8, 8)),即会找到第一个空的且是8的整数倍的位置开始存储,此例中,由于头一个8字节模块已被占用,所以将c存入第二个8字节模块。最后按照规则二进行检查,总的存储单元为16个字节,是最大对齐数8的整数倍,所以结束。存储示意图如下图所示。
struct S{
char a;
int b;
double c;
}S1;
(2)首先按照规则一:字符型变量a存放在第0个字节,然后double存放在第8-15字节,int存放在第16-19字节;然后按照规则二:总的存储大小为20个字节,不是最大对齐数(double类型对齐数)的整数倍,所以末尾再补充四个字节,最终该结构体总的存储大小为24个字节。
struct S{
char a;
double c;
int b;
}S1;
(3)首先按照规则一,double a存储在第0-7字节,char b存储在第8字节,int c存储在第12-15字节,char d存储在第16字节;再按照规则二,此时总的存储大小是17个字节,不是最大对齐数8的整数倍,所以进行补齐,最后总的存储大小为24个字节。
struct S{
double a;
char b;
int c;
char d;
}S1;
(4)结构体中含有指针变量的情况,三个结构体中含有不同类型的指针变量,其结构体大小都为4个字节,因此对于含有指针变量的结构体对于指针变量存储大小按照4个字节进行计算,然后计算其对齐数,然后再按照规则一和规则二进行对齐即可。如下s4的存储大小为8,存储示意图如下。
struct S1 {
char *a;
} s1;
struct S2 {
int *b;
} s2;
struct S3 {
double* a;
} s3;
struct S4 {
char a;
double* b;
} s4;
(5) 含有数组的情况,按照数据的类型,进行对齐即可;char a存储在第0字节,int b[2]存储在第4-11字节。
struct S5 {
char a;
int b[2];
} s5;
(6) 含有其他结构体的情况,S2中char a存储在第0字节,然后因为结构体变量S1 b的最大对齐数是8,因此从第8个字节开始存储,存储在第8-23字节,然后按照规则二检查存储大小是否是最大对齐数的整数倍,满足,则结束(最大对齐数是8(double类型变量的对齐数),总的存储大小是24)。
struct S1 {
char a;
int b;
double c;
};
struct S2 {
char a;
S1 b;
};