【C语言】探讨常见自定义类型的存储形式

纸上得来终觉浅, 绝知此事要躬行。
主页:June-Frost
专栏:C语言

该文章将探讨结构体,位段,共用体的存储形式。

目录:

  • 结构体内存对齐
    • ✉️修改默认对齐数
  • 位段
  • 联合
  • ❤️ 结语

结构体内存对齐

 结构体(struct)是一种用于存储一组不同类型数据的复合数据类型。为了提高内存访问效率,许多计算机系统对结构体进行内存对齐。内存对齐是一种优化内存访问效率的方式,通过将数据存储在特定的内存地址上,使得CPU的内存访问速度更快。对于一些特定的硬件平台和体系结构,内存对齐的要求是必需的。为了更好的理解,我们可以通过计算结构体的大小引入。

struct S1
{
	char c1;
	int i;
	char c2;
};
//大小为12
struct S2
{
	int i;
	char c1;
	char c2;
};
//大小为8
struct S3
{
	char c3;
	struct S1;
	char c4;
};
//大小为20

 通过offsetof计算一下结构体(S1)成员相较于结构体起始位置的偏移量,发现分别是0,4,8 。
 这也就意味着S1在内存中的分布是这样的:
【C语言】探讨常见自定义类型的存储形式_第1张图片

 通过上面的现象分析,可以发现结构成员不是按照顺序在内存中连续存放的,而是有一定的对齐规则。

结构体内存对齐的规则:

  1. 第一个成员永远存放在与结构体变量偏移量为0的地址处。
  2. 从第二个成员开始,往后的每个成员都要对齐到某个对齐数的整数倍处。

对齐数:结构体成员自身的大小和默认对齐数的较小值。
VS 上默认对齐数是8。
gcc上没有默认对齐数,对齐数就是结构体成员自身的大小。

  1. 结构体的总大小,必须是最大对齐数的整数倍。

最大对齐数:所有成员的对齐数中最大的值。

  1. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处。

为什么会有内存对齐呢?

1.平台原因(移植原因):
 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2.性能原因:
 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
【C语言】探讨常见自定义类型的存储形式_第2张图片

总的来说,结构体的内存对齐是拿空间来换取时间的做法。

 所以我们在设计结构体的时候,既要满足对齐,又要节省空间:让占用空间小的成员尽量集中在一起。

struct S1
{
	char c1;
	int i;
	char c2;
};

struct S2
{
	int i;
	char c1;
	char c2;
};

这两个结构体的成员一摸一样,但是S1需要12个字节,而S2只需要8个字节。

✉️修改默认对齐数

通过 #pragma 这个预处理指令,就可以改变默认对齐数。
例如:

#include
#pragma pack(1)//设置默认对齐数为1
struct S1
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
	printf("%zd", sizeof(struct S1));//结果为6
	return 0;
}

位段

 位段是 C 语言中的一种数据类型,用于将一组数值存储到计算机内存中的二进制位中。位段通常用于在内存节省空间的同时,以一种可读性较高的方式存储多个二进制标志或数据。每个位段可以指定其所占用的二进制位数。

⚠注意:

  1. 位段的成员可以是 int ,unsigned int ,signed int 或者是 char (属于整形家族)类型。
  2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
  3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

由于位段不跨平台,所以在此浅谈一下VS的位段存储。

#include
struct S 
{
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};
int main()
{
	struct S s = { 0 };
	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;
	printf("%d", sizeof(s));
	return 0;
}

【C语言】探讨常见自定义类型的存储形式_第3张图片
【C语言】探讨常见自定义类型的存储形式_第4张图片
事实确实如此:

位段在网络底层非常有用,例如:IP数据包的格式。

【C语言】探讨常见自定义类型的存储形式_第5张图片


联合

 联合体(union)是一种特殊的数据类型,它允许在内存中创建多个变量,但只能存储其中一个变量的值。联合体的目的是节省内存空间,因为它可以重复利用同一块内存存储不同的变量值。

⚠规则:

  1. 联合的大小至少是最大成员的大小。
  2. 最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
union Un
{
	char c[5];//对齐数是1
	int i;//对齐数是4
};
//最大对齐数是4
//大小为8字节

char c[5] 的大小为5字节,int i 的大小为4字节,所以至少为5个字节,但是这里最大对齐数是4,所以总大小会增加至 8个字节。


❤️ 结语

 文章到这里就结束了,如果对你有帮助,你的点赞将会是我的最大动力,如果大家有什么问题或者不同的见解,欢迎大家的留言~

你可能感兴趣的:(c语言,c语言,内存对齐,存储,自定义类型)