前两天参加了360测试实习生的笔试,碰到了一个有关c语言内存对齐的题目,回来后实现了一下,下面是代码:
1 #include <stdio.h> 2 #include <stdlib.h> 3 //#pragma pack(2) 4 struct s1{ 5 int a; 6 char b; 7 char c; 8 double d; 9 }; 10 struct s2{ 11 char b; 12 int a; 13 char c; 14 }; 15 struct s3{ 16 char b; 17 char c; 18 int a; 19 }; 20 struct s4{ 21 char b; 22 int a; 23 short c; 24 }; 25 int 26 main(void){ 27 printf("%d %d\n",sizeof(int),sizeof(char)); 28 struct s1 s1; 29 printf("s1(int, char, char, double): %d, %lx, %lx, %lx, %lx\n",sizeof(struct s1),&s1.a,&s1.b,&s1.c,&s1.d); 30 struct s2 s2; 31 printf("s2(char, int, char): %d, %lx, %lx, %lx\n",sizeof(struct s2),&s2.b,&s2.a,&s2.c); 32 struct s3 s3; 33 printf("s3(char, char, int): %d, %lx, %lx, %lx\n",sizeof(struct s3),&s3.b,&s3.c,&s3.a); 34 struct s4 s4; 35 printf("s4(char, int, short): %d, %lx, %lx, %lx\n",sizeof(struct s4),&s4.b,&s4.a,&s4.c); 36 return 0; 37 }
结果如图:
下面就是理论知识了。
现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况并非如此。一些平台对某些特定类型的数据只能从某些特定地址开始存取,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放。这就是所谓的字节对齐。字节对齐是为了提高CPU的读取效率。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出这32bit,而如果存放在奇地址开始的地方,就需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据.显然在读取效率上下降很多。
编译器对对齐值的选择:
1.数据类型自身对齐值:对于char型数据,其自身对齐值为1,对于short型为2,对于int、float类型,其自身对齐值为4,单位字节。
2.结构体或者类的自身对齐值:其成员中自身对齐值最大的那个值。
3.指定对齐值:#pragma pack (value)时的指定对齐值value。
4.数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中小的那个值。
在c语言中数据结构的对齐就更复杂些了,windows平台和Linux平台又有些不同。
Win32平台下的微软C编译器(cl.exe for 80×86)的对齐策略:
(1)结构体变量的首地址能够被其最宽基本类型成员的大小所整除;
编译器在给结构体开辟空间时,首先找到结构体中最宽的基本数据类型,然后寻找内存地址能被该基本数据类型所整除的位置,作为结构体的首地址。将这个最宽的基本数据类型的大小作为上面介绍的对齐模数。
(2)结构体每个成员相对于结构体首地址的偏移量(offset)都是成员大小的整数倍,如有需要编译器会在成员之间加上填充字节(internal adding);
为结构体的一个成员开辟空间之前,编译器首先检查预开辟空间的首地址相对于结构体首地址的偏移是否是本成员的整数倍,若是,则存放本成员,反之,则在本成员和上一个成员之间填充一定的字节,以达到整数倍的要求,也就是将预开辟空间的首地址后移几个字节。
(3)结构体的总大小为结构体最宽基本类型成员大小的整数倍,如有需要,编译器会在最末一个成员之后加上填充字节(trailing padding)。
结构体总大小是包括填充字节,最后一个成员满足上面两条以外,还必须满足第三条,否则就必须在最后填充几个字节以达到本条要求。
在GCC中,对齐模数的准则是:对齐模数最大只能是4,也就是说,即使结构体中有double类型,对齐模数还是4,所以对齐模数只能是1,2,4。而且在上述的三条中,第2条里,offset必须是成员大小的整数倍,如果这个成员大小小于等于4则按照上述准则进行,但是如果大于4了,则结构体每个成员相对于结构体首地址的偏移量(offset)只能按照是4的整数倍来进行判断是否添加填充。
如果结构体中含有位域(bit-field),那么VC中准则又要有所更改:
(1)如果相邻位域字段的类型相同,且其位宽之和小于类型的sizeof大小,则后面的字段将紧邻前一个字段存储,直到不能容纳为止;
(2)如果相邻位域字段的类型相同,但其位宽之和大于类型的sizeof大小,则后面的字段将从新的存储单元开始,其偏移量为其类型大小的整数倍;
(3)如果相邻的位域字段的类型不同,则各编译器的具体实现有差异,VC6采取不压缩方式(不同位域字段存放在不同的位域类型字节中),Dev-C++和GCC都采取压缩方式;
(4)如果位域字段之间穿插着非位域字段,则不进行压缩;
(5)整个结构体的总大小为最宽基本类型成员大小的整数倍。