纸上得来终觉浅, 绝知此事要躬行。
主页:June-Frost
专栏:C语言
该文章将探讨结构体,位段,共用体的存储形式。
结构体(struct)是一种用于存储一组不同类型数据的复合数据类型。为了提高内存访问效率,许多计算机系统对结构体进行内存对齐。内存对齐是一种优化内存访问效率的方式,通过将数据存储在特定的内存地址上,使得CPU的内存访问速度更快。对于一些特定的硬件平台和体系结构,内存对齐的要求是必需的。为了更好的理解,我们可以通过计算结构体的大小引入。
struct S1
{
char c1;
int i;
char c2;
};
//大小为12
struct S2
{
int i;
char c1;
char c2;
};
//大小为8
struct S3
{
char c3;
struct S1;
char c4;
};
//大小为20
通过offsetof计算一下结构体(S1)成员相较于结构体起始位置的偏移量,发现分别是0,4,8 。
这也就意味着S1在内存中的分布是这样的:
通过上面的现象分析,可以发现结构成员不是按照顺序在内存中连续存放的,而是有一定的对齐规则。
结构体内存对齐的规则:
对齐数:结构体成员自身的大小和默认对齐数的较小值。
VS 上默认对齐数是8。
gcc上没有默认对齐数,对齐数就是结构体成员自身的大小。
最大对齐数:所有成员的对齐数中最大的值。
为什么会有内存对齐呢?
1.平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2.性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
总的来说,结构体的内存对齐是拿空间来换取时间的做法。
所以我们在设计结构体的时候,既要满足对齐,又要节省空间:让占用空间小的成员尽量集中在一起。
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
int i;
char c1;
char c2;
};
这两个结构体的成员一摸一样,但是S1需要12个字节,而S2只需要8个字节。
通过 #pragma 这个预处理指令,就可以改变默认对齐数。
例如:
#include
#pragma pack(1)//设置默认对齐数为1
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
printf("%zd", sizeof(struct S1));//结果为6
return 0;
}
位段是 C 语言中的一种数据类型,用于将一组数值存储到计算机内存中的二进制位中。位段通常用于在内存节省空间的同时,以一种可读性较高的方式存储多个二进制标志或数据。每个位段可以指定其所占用的二进制位数。
⚠注意:
由于位段不跨平台,所以在此浅谈一下VS的位段存储。
#include
struct S
{
char a : 3;
char b : 4;
char c : 5;
char d : 4;
};
int main()
{
struct S s = { 0 };
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
printf("%d", sizeof(s));
return 0;
}
位段在网络底层非常有用,例如:IP数据包的格式。
联合体(union)是一种特殊的数据类型,它允许在内存中创建多个变量,但只能存储其中一个变量的值。联合体的目的是节省内存空间,因为它可以重复利用同一块内存存储不同的变量值。
⚠规则:
union Un
{
char c[5];//对齐数是1
int i;//对齐数是4
};
//最大对齐数是4
//大小为8字节
char c[5] 的大小为5字节,int i 的大小为4字节,所以至少为5个字节,但是这里最大对齐数是4,所以总大小会增加至 8个字节。
文章到这里就结束了,如果对你有帮助,你的点赞将会是我的最大动力,如果大家有什么问题或者不同的见解,欢迎大家的留言~