目录
结构体
结构体的声明
结构体的自引用
结构体的定义和初始化
结构体内存对齐
编辑
结构体的对齐规则:
为什么存在内存对齐?
修改默认对齐数
结构体传参
位段
什么是位段
位段的内存分配
位段的跨平台问题
枚举
联合(共用体)
联合体的大小计算
结构是一些值的集合,这些值称为成员变量,结构的每个成员可以是不同类型的变量。
结构体的关键字是struct 后面的Stu是结构体类型名,由我们自己定义,s1,s2是结构体变量,age和name是成员,即结构体变量中有各自的成员。
结构体还有一种特殊的声明,即匿名结构体。如下图:
这种声明省略了结构体类型名,该声明不常用,因为他是一次性的,即在后面就不能继续对他定义了。
结构体的自引用就是在结构体成员中包含自身结构体类型的指针。
如上图, p指针可以用来指向下一节点。
如上图,在初始化时,我们用花括号括起来,在里面赋值。初始化时,如果我们也可乱序定义。
先用.(成员运算符)然后加上成员名,再进行初始化即可,如下图。
如下图,我们可以在结构体中嵌套结构体。
如上图,可以看到,结构体的内存大小并不是平常的类型大小相加。这里涉及了结构体内存的对齐。
offsetof是一个宏,可以直接使用,是用来计算结构体成员相较于起始位置的偏移量的。
上图是S1占用空间的示意图,结合下面的规则,我们来分析。
分析:c1是第一个成员,起始位置从0开始。i是int型,与8相比,4为较小值,他的对齐数则为4,寻找最近的4的倍数,则从4开始占用,接着c2是char型,对齐数则为1,直接补在i后面即可,这3个成员中,对齐数分别为1,4,1,最大对齐数是4,总大小就是4的倍数,就需要再浪费3个空间。
1.平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的,某些硬件平 台只能在某些地址处取得某些特定类型的数据,否则抛出硬件异常。
2.性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对 齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
总的来说,结构体的内存对齐是拿空间来换取时间的做法。
举个例子:
红框是存储的数据,当我们 要读取i时,第一次只读取到前3个字节,需要读取两次才能完全读取到i,这是不对齐的情况。
当结构体内存对齐时,虽然中间的空间浪费了,但这时我们能一次读取到需要的数据,减少了花费的时间。
所以在设计结构体的时候,我们既要节省空间,又要满足对齐,就需要让占用空间小的成员尽量集中在一起 。
#pragma这个预处理指令,可以改变我们的默认对齐数。
如上图,第一个指令,把默认的对齐数改为4,最后一个指令,是恢复成原本的默认对齐数。
如上图,第一种是传值,第二种是传址。函数传参的时候,参数是要压栈的,会有时间和空间上的系统开销。如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能的下能。因此,结构体传参的时候,要传结构体的地址。
位段的声明和结构体是类似的,但有两个不同:
1.位段的成员必须是int,unsigned int,或signed int。
2.位段的成员名后边有一个冒号和一个数字。
如上图, 是位段的声明,a占用了两个bit位的空间,位段能节省空间的占用。例如,假设a只可能是0,1,2,3,即二进制为00,01,10,11,如果我们不使用位段的方式,一个整形就要占32个bit位,实际上,位段也会浪费少量的空间。
1.位段的成员可以是int,unsigned int,或signed int或者是char(属于i整形家族)类型。
2.位段的空间上是按照需要以4个字节(int)或1个字节(char)的方式开辟的。
3.位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
总结:跟结构相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在。
枚举,顾名思义就是一一列举,把可能的取值一一列举。
花括号中的内容是枚举类型的可能取值,也叫枚举常量。
这些可能取值都是有值的,默认从0开始,依次递增1。当然,在声明枚举类型的时候也可以赋初值。
联合也是一种特殊的自定义类型。
这种类型定义的变量也包含一系列的成员,特征是这些成员共用一块空间(所以联合也叫共用体)。
联合体的大小并不是最大成员的大小。
联合体的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
如上图, 实际上,c是数组,因为有5个元素,占了五个字节,但他的对齐数依旧是1,而i的对齐数是4,比5大的4的倍数最小是8,所以大小就是8。 c和i和该联合体的起始地址都是一样的,他们共用一块空间,因此可以节省空间。