探讨struct对齐

毕业前找工作的经历让我发现,很多公司的笔试、面试题中都涉及到了struct的对齐的问题!今天我们就深入探索其中的奥秘!

首先,让我们分析下面的代码:

struct AT
{
    char a;
    char b;
    int  c;
    char d;
};

int main(void)
{
    AT at;
    cout<<sizeof(at)<<endl;

    return 0;
}

执行结果为:

12
请按任意键继续. . .

------------------------------------

在程序执行前,可能很多人已经预见了其执行结果为12,在struct AT中最长字节的成员是c,有四个字节,在编译过程因为会对其进行字节对齐处理,c占4个字节,d占4个字节,又因为a和b都各有1个字节,而且和不足对齐的4个字节,所以a和b共同占4个字节,这样,总共加起来,一个AT对象有12个字节(4(a+b)+4(c)+4(d))。ok,如果你对上面的分析很是透彻,那恭喜你,你已经知其然了!俗话说:不知其然,庸人!知其然,强人!知其所以然,则是圣人!作为强人的你是否还想成为万人仰视的圣人呢?那我们就再进一步探个究竟。

到底为啥编译器要对struct做对齐处理呢?其实这句话有点片面,编译器会对所有的代码进行对齐处理,不值struct,那到底为啥要这么做呢?那我们就引用下前人的研究成果来做下说明:

      现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。
      对齐的作用和原因:各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐.其他平台可能没有这种情况,但是最常见的是如果不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出这32bit,而如果存放在奇地址开始的地方,就需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。显然在读取效率上下降很多。【1】

注释:【1】来源于:http://blog.ednchina.com/sealove518/55803/message.aspx

 

经过上面的介绍,你是否已经对字节对齐,以及为啥做字节对齐有了深刻的认识了!可能桀骜不驯的你会提出,我不管这么多,就是不想做字节对齐!那也有办法,因为所有内置变量都是以字节为单位的,那你就可以通过预编译命令#pragma pack(push,1) 和 #pragma pack(pop)来将对齐单位设置成1字节!我们看看下面示例:

 

#pragma pack(push, 1)
struct AT
{
    char a;
    char b;
    int  c;
    char d;
};

#pragma pack(pop)

 

int main(void)
{
    AT at;
    cout<<sizeof(at)<<endl;

    return 0;
}

执行结果:

7
请按任意键继续. . .

 

怎么样?是否达到了目的?AT中a的1个字节+b的1个字节+c的4个字节+d的1个字节 = 7 字节。但是在用#pragma pack的时候一定要注意,在你定义的头文件中#pragma pack(push,1) 和 #pragma pack(pop)必须成对出现,并且只用于设置你的代码部分,不然其他人的代码包了你的库的头文件就会发生错误,比如别人是按默认字节对齐编译的库,结果你是按1字节进行的设置,包了你的头文件时,字节对齐就变成了1字节,但二进制库里还是原来默认字节对齐,就会导致在程序运行时取值错误!而且这种错误有时很难发现!

 

 ok,今天就唠叨到这里吧,知识无限大,探索无止境!

你可能感兴趣的:(c,struct,面试,byte,平台,编译器)