sizeof求值问题(结构体,数组,联合体,指针,函数)

结构体的sizeof

结构体的sizeof涉及到字节对齐问题。

为什么需要字节对齐?计算机组成原理教导我们这样有助于加快计算机的取数速度,否则就得多花指令周期了。为此,编译器默认会对结构体进行处理(实际上其它地方的数据变量也是如此),让宽度为2的基本数据类型(short等)都位于能被2整除的地址上,让宽度为4的基本数据类型(int等)都位于能被4整除的地址上,依次类推。这样,两个数中间就可能需要加入填充字节,所以整个结构体的sizeof值就增长了。

字节对齐的细节和编译器的实现相关,但一般而言,满足三个准则:

1)  结构体变量的首地址能够被其最宽基本类型成员的大小所整除。

2)  结构体的每个成员相对于结构体首地址的偏移量(offset)都是成员大小的整数倍,如有需要,编译器会在成员之间加上填充字节(internal adding)。

3)  结构体的总大小为结构体最宽基本类型成员大小的整数倍,如有需要,编译器会在最末一个成员后加上填充字节(trailing padding)。


    注意:空结构体(不含数据成员)的sizeof值为1。试想一个“不占空间“的变量如何被取地址、两个不同的“空结构体”变量又如何得以区分呢,于是,“空结构体”变量也得被存储,这样编译器也就只能为其分配一个字节的空间用于占位了。


例子:

struct S1  
{  
    char a;  
    int b;  
};  
sizeof(S1); //值为8,字节对齐,在char之后会填充3个字节。  
  
struct S2  
{  
    int b;  
    char a;  
};  
sizeof(S2); //值为8,字节对齐,在char之后会填充3个字节。  
  
struct S3  
{  
};  
sizeof(S3); //值为1,空结构体也占内存。  


联合体的sizeof

结构体在内存组织上市顺序式的,联合体则是重叠式,各成员共享一段内存;所以整个联合体的sizeof也就是每个成员sizeof的最大值。


例子:

union u  
{  
    int a;  
    float b;  
    double c;  
    char d;  
};  
  
sizeof(u); //值为8  


数组的sizeof

数组的sizeof值等于数组所占用的内存字节数。

注意:1)当字符数组表示字符串时,其sizeof值将’/0’计算进去。

            2)当数组为形参时,其sizeof值相当于指针的sizeof值。 

例子1:

char a[10];  
char n[] = "abc";   
  
cout<<"char a[10]                 "<   
cout<<"char n[] = /"abc/"           "<   
   


例子2:

void func(char a[3])  
{  
    int c = sizeof(a); //c = 4,因为这里a不在是数组类型,而是指针,相当于char *a。  
}  
  
void funcN(char b[])  
{  
    int cN = sizeof(b); //cN = 4,理由同上。  
}  


指针的sizeof

指针是用来记录另一个对象的地址,所以指针的内存大小当然就等于计算机内部地址总线的宽度。

在32位计算机中,一个指针变量的返回值必定是4。

指针变量的sizeof值与指针所指的对象没有任何关系。


      例子:

  
char *b = "helloworld";  
char *c[10];  
double *d;  
int **e;  
void (*pf)();    
  
cout<<"char *b = /"helloworld/"     "< cout<<"char *b                    "< cout<<"double *d                  "< cout<<"double *d                  "< cout<<"int **e                  "< cout<<"char *c[10]                "< cout<<"void (*pf)();              "<


函数的sizeof

sizeof也可对一个函数调用求值,其结果是函数返回值类型的大小,函数并不会被调用。

对函数求值的形式:sizeof(函数名(实参表))

注意:1)不可以对返回值类型为空的函数求值。 

            2)不可以对函数名求值。

           3)对有参数的函数,在用sizeof时,须写上实参表。


      例子:


#include   
using namespace std;  
  
float FuncP(int a, float b)  
{  
    return a + b;  
}  
  
int FuncNP()  
{  
    return 3;  
}  
  
void Func()  
{  
}  
  
int main()  
{  
cout< cout< /*cout< /*cout< }  
--------------------- 

 

pragma pack的使用

这是给编译器用的参数设置,有关结构体字节对齐方式设置, #pragma pack是指定数据在内存中的对齐方式。

#pragma pack (n) 作用:C编译器将按照n个字节对齐。 
#pragma pack () 作用:取消自定义字节对齐方式。

#pragma pack (push,1) 作用:是指把原来对齐方式设置压栈,并设新的对齐方式设置为一个字节对齐

#pragma pack(pop) 作用:恢复对齐状态

因此可见,加入push和pop可以使对齐恢复到原来状态,而不是编译器默认,可以说后者更优,但是很多时候两者差别不大

如:

#pragma pack(push) //保存对齐状态

#pragma pack(4)//设定为4字节对齐

相当于 #pragma pack (push,4)

#pragma pack (1) 作用:调整结构体的边界对齐,让其以一个字节对齐;<使结构体按1字节方式对齐>

#pragma pack ()

例如:

#pragma pack(1)

struct sample 

char a; 
double b; 
};

#pragma pack()

注:若不用#pragma pack(1)和#pragma pack()括起来,则sample按编译器默认方式对齐(成员中size最大的那个)。即按8字节(double)对齐,则sizeof(sample)==16.成员char a占了8个字节(其中7个是空字节);若用#pragma pack(1),则sample按1字节方式对齐sizeof(sample)==9.(无空字节),比较节省空间啦,有些场和还可使结构体更易于控制。

应用实例

在网络协议编程中,经常会处理不同协议的数据报文。一种方法是通过指针偏移的方法来得到各种信息,但这样做不仅编程复杂,而且一旦协议有变化,程序修改起来也比较麻烦。在了解了编译器对结构空间的分配原则之后,我们完全可以利用这一特性定义自己的协议结构,通过访问结构的成员来获取各种信息。这样做,不仅简化了编程,而且即使协议发生变化,我们也只需修改协议结构的定义即可,其它程序无需修改,省时省力。下面以TCP协议首部为例,说明如何定义协议结构。其协议结构定义如下:

#pragma pack(1) // 按照1字节方式进行对齐 
struct TCPHEADER 

short SrcPort; // 16位源端口号 
short DstPort; // 16位目的端口号 
int SerialNo; // 32位序列号 
int AckNo; // 32位确认号 
unsigned char HaderLen : 4; // 4位首部长度 
unsigned char Reserved1 : 4; // 保留6位中的4位 
unsigned char Reserved2 : 2; // 保留6位中的2位 
unsigned char URG : 1; 
unsigned char ACK : 1; 
unsigned char PSH : 1; 
unsigned char RST : 1; 
unsigned char SYN : 1; 
unsigned char FIN : 1; 
short WindowSize; // 16位窗口大小 
short TcpChkSum; // 16位TCP检验和 
short UrgentPointer; // 16位紧急指针 
}; 
#pragma pack()

你可能感兴趣的:(sizeof求值问题(结构体,数组,联合体,指针,函数))