C语言进阶——chapter4——自定义类型之结构体

前言

大家好呀,我是Humble,今天要给大家带来的内容是自定义类型

关于自定义类型,有结构体,联合和枚举

今天我们先来分享结构体,这个概念我们在讲操作符详解的时候已经粗略涉及过,今天我们就来详细讲解一下结构体这个概念吧

接下来,开始今天的分享

 

一.结构体类型的声明

首先,我们先来复习一下之前学过的结构体的知识

1.结构体回顾

我们知道,结构是一些值的集合,这些值称为成员变量,结构的每个成员可以是不同类型的变量

a.结构的声明

比如我们想描述一个学生,我们可以这样创建结构体变量

struct Stu
{
	char name[20];//名字
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号
}; //分号不能丢!!!!

 

b.结构体变量的初始化

这里的初始化又可以分为2类,分别是:按照结构体成员的顺序初始化和按照指定的顺序初始化

 

首先是按照结构体成员的顺序初始化

struct Stu s1 = { "张三", 20, "男", "20230818001" };
printf("name: %s\n", s1.name);
printf("age : %d\n", s1.age);
printf("sex : %s\n", s1.sex);
printf("id : %s\n", s1.id);

然后是按照指定的顺序初始化

	struct Stu s2 = { .age = 18, .name = "lisi", .id = "20230818002", .sex = "⼥"};
	printf("name: %s\n", s2.name);
	printf("age : %d\n", s2.age);
	printf("sex : %s\n", s2.sex);
	printf("id : %s\n", s2.id);

 

2.结构的特殊声明

其实,在声明结构的时候,可以不完全的声明

例如:

//2个匿名结构体类型

struct

{
	int a;
	char b;
	float c;
}x;


struct
{
	int a;
	char b;
	float c;
} *p;

 

这样子看起来很方便,在声明的时候省略掉了结构体标签,

那么问题来了:

在上面代码的基础上,

 p = &x;   这句代码合法吗?

答:这是非法的,如果我们运行一下的话就会发现编译器报警告了

8e84d414666d4013bccdf02a8c306920.png

 因为编译器会把上面的两个声明当成完全不同的两个类型

所以说,匿名的结构体类型,如果没有对结构体类型重命名的话,基本上只能使用⼀次

 

 

3.结构的自引用

 

在结构中包含一个类型为该结构本身的成员是否可以呢?

比如,定义一个链表的节点

注意:链表是我们后期学习数据结构的时候会专门讲的一种结构,这里暂时先不讲

 

我们看下面代码

struct Node
{
 int data;  //存放数据
 struct Node next;  //在结构中包含一个类型为该结构本身的成员
};

上述代码正确吗?,如果正确,那 sizeof(struct Node) 是多少?

仔细分析,其实是不行的,因为一个结构体中再包含一个同类型的结构体变量,这样结构体变量的大小就会无穷的大,是不合理的

 

 正确的自引用方式:

struct Node
{
 int data;  //存放数据
 struct Node* next;  //存放下一个节点的地址
};  //这是可行的

所以说,在结构体里有一个同类型的结构指针是可行的

好,我们再来思考一个问题:

看看 下面的代码,可行吗?

typedef struct
{
 int data;
 Node* next;
}Node;

答案是不行的,因为Node是对前面的匿名结构体类型的重命名产生的

但是在匿名结构体内部提前使用Node类型来创建成员变量,这是不行的。

 

所以我们定义结构体不要使用匿名结构体了

typedef struct Node
{
 int data;
 struct Node* next;
}Node;  //这是可行的

二.结构体内存对齐

好了,我们现在已经掌握了结构体的基本使用了

 现在我们深入讨论一个问题:计算结构体的大小

 

这也是一个特别热门的考点: 结构体内存对齐

 

大家先来看下面这个代码,我们以它作为一个引子

我们看一下下面两个结构体的大小关系是怎么样的,它们会一样吗?

C语言进阶——chapter4——自定义类型之结构体_第1张图片

C语言进阶——chapter4——自定义类型之结构体_第2张图片

一个是8,一个是12

这是为什么呢?是怎么计算的呢?

 

好,我们带着问题开始下面的学习吧!

1.对齐规则

首先得掌握结构体的对齐规则:

1. 在内存中,结构体的第⼀个成员对⻬到和结构体变量偏移量为0(也就是起始位置)的地址处

下面是图示,方便大家理解:

C语言进阶——chapter4——自定义类型之结构体_第3张图片

2. 其他成员变量要对齐到某个数字(即对齐数)的整数倍的地址处

对齐数 = 编译器默认的⼀个对⻬数 与 该成员变量大小的较小值

(在VS 中默认的值为 8 。在Linux中 gcc 没有默认对齐数,对齐数就是成员自身的大小)

 

3. 结构体总大小为最大对齐数(结构体中每个成员变量都有一个对齐数,所有对齐数中最大的)的 整数倍

4. 如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数

 

好了,有了这几点,我们就可以解释上面引子中为什么strust S1大小是8,struct S2的大小是12了

我们先看strust S1

首先,c1是char类型,作为结构体的第一个成员,存在起始位置偏移值为0的地址处

c2也是char类型,大小是1,它属于其他成员变量,所以要对齐到1的整数倍的地址处,也就是1的地址处

i是int类型,大小是4,它属于其他成员变量,所以要对齐到4的整数倍的地址处也就是4的地址处

因为3和4的地址处没有存放,所以这块空间是浪费的

因为结构体总带线啊哦为最大对齐数的整数倍,即4的倍数,8是满足的,所以总空间占用了8

下面是理解图:

C语言进阶——chapter4——自定义类型之结构体_第4张图片

 

好,接下来我们再看一下strust S2

首先,c1是char类型,作为结构体的第一个成员,存在起始位置偏移值为0的地址处

然后我们放i,i是int类型,大小是4,它属于其他成员变量,所以要对齐到4的整数倍的地址处也就是4的地址处  占了4567这些地址

c2是char类型,大小是1,它也属于其他成员变量,所以要对齐到1的整数倍的地址处,也就是8的地址处

这时因为结构体总大小不是最大对齐数的整数倍,大小是9,要使它为4的倍数满足,就要使得大小为12,这样9 10  11的空间就浪费了

所以总空间占用了12

 

下面是理解图:

C语言进阶——chapter4——自定义类型之结构体_第5张图片

 

紧接着,我们先来练上几题,想一下输出结果会是多少?

struct S3
{
	double d;
	char c;
	int i;
};
int main()
{
	printf("%d\n", sizeof(struct S3));
}

下面是运行结果:(先自己思考一下哦)

C语言进阶——chapter4——自定义类型之结构体_第6张图片

 

我们也来分析一下吧:

首先,d是double类型,作为结构体的第一个成员,存在起始位置偏移值为0的地址处占01234567

c是char类型,大小是1,它也属于其他成员变量,所以要对齐到1的整数倍的地址处,也就是8的地址处

然后我们放i,i是int类型,大小是4,它属于其他成员变量,所以要对齐到4的整数倍的地址处也就是12的地址处  占了12 13 14 15这些地址

这时因为结构体总大小是最大对齐数的整数倍,大小是16,它为4的倍数满足

所以总空间占用了16

下面是理解图:

 

C语言进阶——chapter4——自定义类型之结构体_第7张图片

再看一道题,(温馨提示:这个练习会涉及对齐规则的第4点:结构体嵌套)

 

C语言进阶——chapter4——自定义类型之结构体_第8张图片

 

 

下面是运行结果:(请先自己思考一下哦)

 

C语言进阶——chapter4——自定义类型之结构体_第9张图片

 

我们来分析一下:

首先,c1是char类型,作为结构体的第一个成员,存在起始位置偏移值为0的地址处占一个字节

 

然后是s3,是struct S3类型,大小是16(这是我们在上一题算过的),它属于其他成员变量而且是嵌套了结构体的情况

嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,(即double的8)

所以要对齐到8的整数倍的地址处,也就是8的地址处,一直占16个字节到23的地址处

 

最后我们放d,d是double类型,大小是8,它属于其他成员变量,所以要对齐到8的整数倍的地址处也就是24的地址处 占了24 25 26 27 28 29 30 31

这时因为结构体总大小是最大对齐数的整数倍,大小是32,它为8的倍数满足(S3中的最大元素是8,在S4中除了这个嵌套的类型外,其他类型最大也是8,所以取8)

所以总空间占用了32

下面是理解图:

C语言进阶——chapter4——自定义类型之结构体_第10张图片

 

2.为什么存在内存对齐?

我们在学习上面的内存对齐的时候一定会有疑惑,为什么一定要浪费空间呢?

这里我们分2个原因来讲:

a.平台问题(移植问题)

不是所有的硬件平台都能访问任意地址上的任意数据的

某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常

b.性能问题

数据结构(尤其是栈)应该尽可能地在自然边界上对齐

原因在于:为了访问未对齐的内存,处理器需要作两次内存访问,而对齐的内存访问仅需要一次访问。假设一个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对齐成8的倍数,那么就可以 用一个内存操作来读或者写值了。否则,我们可能需要执行两次内存访问,因为对象可能被分放在两个8字节内存块中

总体来说:结构体的内存对齐是拿空间来换取时间的做法

 

那在设计结构体的时候,我们既要满足对齐又要节省空间,如何做到?

//让占用空间小的成员尽量集中在⼀起
//例如:
struct S1
{
	char c1;
	char c2;
	int i;
};
struct S2
{
	char c1;
	int i;
    char c2;
};

这里的S1 和 S2 类型的成员一模⼀样,但是 S1 和 S2 所占空间的大小有了一些区别

一个是8,一个是12;

 

3.修改默认对齐数

我们在讲对齐规则的第2点提到了默认对齐数,这意味着对齐数是可以修改的

#pragma 这个预处理指令,可以改变编译器的默认对⻬数

#pragma pack(1)  //设置默认对齐数为1
struct S
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的对齐数,还原为默认

那我们来练一下

#pragma pack(1)  //设置默认对齐数为1
struct S
{
	char c1;
	int i;
	char c2;
};


int main()
{
	//输出的结果是什么?
	printf("%d\n", sizeof(struct S));
	return 0;
}

输出结果如下:

C语言进阶——chapter4——自定义类型之结构体_第11张图片

当我们认为结构体在对齐方式不合适的时候,我们就可以自己更改默认对齐数了~

三.结构体传参

 

下面的 print1 和 print2 函数哪个好些

C语言进阶——chapter4——自定义类型之结构体_第12张图片

答案是:选print2函数。 原因:

函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销

如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降

结论: 结构体传参的时候,要传结构体的地址

四.结构体实现位段

结构体讲完就得讲讲结构体实现位段的能力

1.什么是位段

位段是基于结构体的

位段的声明和结构是类似的,但有两个不同:

1.位段的成员必须是 int、unsigned int 或signed int 。不过在C99中,位段成员的类型也可以选择其他类型

2.位段的成员名后边有一个冒号和一个数字

下面来举个例子:

C语言进阶——chapter4——自定义类型之结构体_第13张图片

A就是一个位段类型

那位段A所占内存的大小是多少?

int main()
{
  printf("%d\n", sizeof(struct A));
  return 0;
}

C语言进阶——chapter4——自定义类型之结构体_第14张图片

 

我们如果按结构体大小方式去算,打印会得到16

但我们打印的结果却是8

冒号后面表示这个变量需要几个bit(比特位)

上面的2+5+10+30=47个比特位,因为8个字节就可以存下47个比特位,所以打印结果是8不是16

所以从结果上,我们可以看出:位段的出现就是为了节省空间

我们可能有个问题,就是6个字节也可以存下47个比特位,那为什么结果不是6呢?

所以接下面我们具体看一下位段的内存分配

 

2.位段的内存分配

1. 位段的成员可以是 int ,unsigned int  或者是 char 等类型

2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的⽅式来开辟的

 3. 位段涉及很多不确定因素位段是不跨平台的注重可移植的程序应该避免使⽤位段

//⼀个例⼦
struct S
{
 char a:3;
 char b:4;
 char c:5;
 char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
//空间是如何开辟的?

为了解出上面的代码,我们下面来讲一下VS的存储习惯:

1.从右向左使用

2.如果剩余的空间不够下一个成员使用,就浪费,然后开辟新的空间

 

那按照这个想法,我们只需开辟3个字节,然后我们可以得到s中的存储应该是:

01100010 00000011 00000100

转换成16进制就是 62 03 04

我们调试一下,看一下结果是否如我们所想:

C语言进阶——chapter4——自定义类型之结构体_第15张图片

我们发现,结果正如我们所想

如果我们打印s的大小,结果也肯定只有3个字节的大小

C语言进阶——chapter4——自定义类型之结构体_第16张图片

当然,所有的这些仅仅针对VS,对于其他编译器是不确定的,这就是为什么上面说:

位段是不跨平台的

那么既然说到这个,接下来给大家聊聊4个位段的跨平台问题

3.位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的

2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32。写成27,在16位机器会 出问题

 3. 位段中的成员在内存中从左向右分配,还是从右向左分配,标准尚未定义

 4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃 剩余的位还是利用,这是不确定的

总结: 跟结构相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台问题的存在

 

4.位段使用的注意事项

位段的几个成员共有同一个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位 置处是没有地址的。内存中每个字节分配一个地址,一个字节内部的bit位是没有地址的

所以不能对位段的成员使用&操作符,这样就不能使用scanf直接给位段的成员输入值

只能是先输入放在一个变量中,然后赋值给位段的成员

struct A
{
 int _a : 2;
 int _b : 5;
 int _c : 10;
 int _d : 30;
};

int main()
{
 struct A sa = {0};

 scanf("%d", &sa._b);//这是错误的!!!
 
 //正确的⽰范
 int b = 0;
 scanf("%d", &b);
 sa._b = b;

 return 0;
}

 

结语

好了,今天的分享就到这里了

在学习C语言的道路上Humble与各位同行,加油吧各位!

最后希望大家点个免费的赞或者关注吧(感谢感谢)

让我们在接下来的时间里一起成长,一起进步吧!

1d8bd2383fe54a7aa576bdd8d41dc462.png

 

 

 

 

你可能感兴趣的:(C语言语法进阶,c语言,开发语言,后端)