探索结构体的奥秘

目录

结构体

1,结构体的声明

1.1 结构的基础知识

1.2 结构的声明

1.3 特殊的声明

1.4 结构的自引用

1.5 结构体变量的定义和初始化

1.6 结构体内存对齐

1.6.1 如何计算

1.6.2 为什么存在内存对齐 

1.7 修改默认对齐数

1.8 结构体传参

2,位段

2.1 什么是位段

2.2 位段的内存分配

2.3 位段的跨平台问题

2.4 位段的应用

3,枚举

3.1 枚举类型的定义

3.2 枚举的优点

3.3 枚举的使用

4,联合(共用体)

4.1 联合类型的定义

4.2 联合的特点

4.3 联合大小的计算


结构体

1,结构体的声明

1.1 结构的基础知识

结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。

1.2 结构的声明

struct tag//struct是结构体关键字,不能省略、tag是自己设定的
{
	member_list;//成员列表,可以有一个,也可以有多个
}variable_list;//变量列表(可有可无)

 例如描述一个学生:

struct Student
{
	char name[20];//姓名
	int age;//年龄
	char sex[5];//性别
	float score;//学号
}s1, s2, s3;//s1,s2,s3是三个结构体变量 - 全局变量

int main()
{
	struct Student s4, s5, s6;//s4,s5,s6也是三个结构体变量 - 局部变量
	return 0;
}

1.3 特殊的声明

 在声明结构体的时候,可以不完全的声明,即匿名结构体类型。

//匿名结构体类型
struct
{
	char name[20];//姓名
	char author[12];//作者
	float price;//价格
}b;

struct
{
	char name[20];//姓名
	char author[12];//作者
	float price;//价格
}*p;

上面的两个结构在声明的时候省略掉了结构体标签(tag),我们就叫称它为匿名结构体类型。

那么问题来了?

//在上面代码的基础上,下面的代码合法吗?
p = &b;

答案是不合法的。虽然它们的成员看起来都一样,但是编译器依然认为这是两种结构体类型。所以当要把b的地址取出来放在p变量里边去的时候,编译器会认为等号两边的类型是不一样的。

1.4 结构的自引用

在结构中包含一个类型为该结构本身的成员就叫结构体的自引用,那我们该怎么写代码呢?

struct Node
{
	int date;
	struct Node n;
};

这样写可以吗?如果可以,那sizeof(struct Node)是多少呢?

这种写法是错误的,因为date 占4个字节,而n就会占4+n个字节,4+n里边的n又会占4+n个字节,这样无休止的下去,编译器都会崩溃的。

正确的自引用方式如下:

struct Node
{
	int date;//存放数据 - 数据域
	struct Node* n;//存放下一个节点的地址 - 指针域
};

打印结果:

探索结构体的奥秘_第1张图片


那像这样写代码可不可以呢? 

typedef struct
{
	int date;
	Node* n;
}Node;

 上面这段代码给匿名的结构体类型起名为Node,但现在这个Node还没有产生呢,结构体里边就想用Node,这就相当于先有鸡还是先有蛋的问题,所以这样写代码是错误的。

正确写法如下: 

typedef struct Node
{
	int date;
	struct Node* n;
}Node;

1.5 结构体变量的定义和初始化

有了结构体类型,那如何定义变量呢,其实很简单。

#include 

struct Point
{
	int x;
	int y;
}p1;//声明类型的同时定义变量p1

struct Point p2;//定义结构体变量p2

struct Point p3 = { 4, 5 };//初始化:定义变量的同时赋初值。

struct stu//类型声明
{
	char name[20];//姓名
	int age;//年龄
};

//结构体嵌套
struct Node
{
	int data;
	struct Point p;
	struct Node* next;
};

int main()
{
	int a = 10;
	int b = 20;
	struct Point p4 = { a, b };

	struct stu s = { "zhangsan", 20 };//顺序初始化
	struct stu s2 = { .age = 18, .name = "lisi" };//乱序初始化

	printf("%s %d\n", s.name, s.age);
	printf("%s %d\n", s2.name, s2.age);

	struct Node n = { 100, {10, 20}, NULL };
	printf("%d x=%d y=%d\n", n.data, n.p.x, n.p.y);
	return 0;
}

1.6 结构体内存对齐

接下来我们深入讨论一个问题:计算结构体的大小,先看代码:

#include 

struct s1
{
	char c1;
	int i;
	char c2;
};

struct  s2
{
	char c1;
	char c2;
	int i;
};

int main()
{
	printf("%d\n", sizeof(struct s1));
	printf("%d\n", sizeof(struct s2));

	return 0;
}

 运行结果:
探索结构体的奥秘_第2张图片

我们可以看到上边代码运行后第一个的结果为12个字节,第二个为8个字节,但是我们两个结构体的成员一摸一样,只是它们成员的顺序不同,运行出来的结果就差了4个字节,这是为什么呢?这里我们要先介绍一个宏 --- offsetof。 


offsetof 宏:

offsetof是C语言中的一个宏,它用于计算结构体成员相较于起始位置的偏移量。

offsetof宏的定义: 

#define offsetof(type, member)
  • 这个宏接收两个参数:
  • type:结构体的类型
  • member:结构体中的成员名
  • offsetof宏返回一个size_t类型的值,表示member在type结构体中的偏移量。 

示例: 

#include 
#include 

struct Mystruct
{
	int a;
	char b;
	double c;
};

int main()
{
	size_t offset = offsetof(struct Mystruct, b);
	printf("%zd\n", offset);

	return 0;
}

  运行结果:

在这个示例中,offsetof宏计算了结构体Mystruct中成员b的偏移量,并输出到控制台。 


接下来我们探究一下偏移量: 

探索结构体的奥秘_第3张图片

下面我们可以用offsetof宏分别计算一下结构体s1和s2中成员的偏移量:

探索结构体的奥秘_第4张图片

 探索结构体的奥秘_第5张图片


探索结构体的奥秘_第6张图片

探索结构体的奥秘_第7张图片


1.6.1 如何计算

有了上边知识的铺垫后,接下来我们再来学习一下该如何计算结构体的大小,首先得掌握结构体的对齐规则:

我们以 struct s1 为例:

struct s1
{
	char c1;//偏移量为0
	int i;//偏移量为4
	char c2;//偏移量为8
};

1,第一个成员在与结构体变量偏移量为0的地址处。

探索结构体的奥秘_第8张图片

2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。对齐数 = 编译器默认的一个对齐数该成员大小较小值,VS中默认的值为8。Linux中没有默认对齐数,对齐数就是成员自身的大小。

探索结构体的奥秘_第9张图片

 3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。

在s1结构体里边,c1的对齐数为1、c2的对齐数为1、i的对齐数为4,那三个成员里边最大对齐数就是4,我们说结构体总大小为最大对齐数的整数倍,而我们刚才计算的这个结构体的总大小为8,刚好是4的整数倍。这就是计算结构体总大小的方法。

4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整
体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

计算struct S2结构体的总大小:

struct S1
{
	char c1;
	int i;
	char c2;
};

struct  S2
{
	char c1;
	struct S1 s1;
	int i;
};

 探索结构体的奥秘_第10张图片

1.6.2 为什么存在内存对齐 

1,平台原因(移植原因):

不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。

2,性能原因:

数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

总的来说:结构体的内存对齐是拿空间来换取时间的做法。

那在设计结构体的时候,我们既要满足对齐,又要节省空间,该如何做到呢:
其实很简单,那就是让占用空间小的成员尽量集中在一起

//例如:
struct S1
{
	char c1;
	int i;
	char c2;
};
struct S2
{
	char c1;
	char c2;
	int i;
};

S1和S2类型的成员一模一样,但是S1和S2所占空间的大小却有区别。

1.7 修改默认对齐数

在前面的学习中我们说在VS中默认对齐数为8,而Linux环境下没有默认对齐数。那这个默认对齐数可不可以修改呢,其实是可以的,用#pragma 这个预处理指令就可以修改我们的默认对其数。

#include 

#pragma pack(8)//设置默认对齐数为8
struct S1
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认

#pragma pack(1)//设置默认对齐数为1
struct S2
{
	char c1;
	char c2;
	int i;
};
#pragma pack()//取消设置的默认对齐数,还原为默认

int main()
{
    //输出的结果是什么?
	printf("%d\n", sizeof(struct S1));
	printf("%d\n", sizeof(struct S2));

	return 0;
}

运行结果:

探索结构体的奥秘_第11张图片

从上面这个代码示例我们可以得出一个结论:结构体在对齐方式不合适的时候,我们可以自己更改默认对齐数。 

1.8 结构体传参

先看一段代码:

struct S 
{
	int date[1000];
	int num;
};

//结构体传参
void print1(struct S t)
{
	printf("%d %d %d %d %d\n", t.date[0], t.date[1], t.date[2], t.date[3], t.num);
}
//结构体地址传参
void print2(struct S *ps)
{
	printf("%d %d %d %d %d\n", ps->date[0], ps->date[1], ps->date[2], ps->date[3], ps->num);
}

int main()
{
	struct S s = { {1,2,3,4}, 1000 };
	print1(s);//传值调用
	print2(&s);//传址调用

	return 0;
}

上面的 print1 和 print2 函数哪个好些呢?

答案是:首选print2函数。

原因:

  • 函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
  • 如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
  • 传值调用是把s这个对象直接传给了t,当实参传给形参的时候,形参将是实参的一份临时拷贝,形参也会创建一份独立的变量,如果s这个结构体所占空间过大,当我们要传给t的时候,t也要在内存里边在开辟一块和s一样大的空间,这不就浪费了吗。实参把数据给形参,会浪费时间;形参把数据放在空间里边,又会浪费一块独立的空间,这就造成了时间和空间双重浪费,所以说这种效率不够高。
  • 传址调用传的是地址,一个地址的大小无非就是4或8个字节,在函数调用的过程中,压栈的开销就只有4个字节,它的效率就会高一些。

结论:

结构体传参的时候,要传结构体的地址。

2,位段

前面我们讲,结构体会牺牲一部分空间,换来效率上的提升,它会浪费空间,而位段设计之初就是为了节省空间的。下面我们就来了解一下结构体实现位段的能力。

2.1 什么是位段

位段的声明和结构是类似的,但有两个不同:

  • 位段的成员必须是 int、unsigned int 或signed int 。在C99之后,也可以是其它类型,但是基本上都是int,char类型。
  • 位段的成员名后边有一个冒号和一个数字。

例如:

//位段 -- 位是二进制位
struct A
{
	int _a : 2;//:2 代表占用2个bit位的空间
	int _b : 5;//:5 代表占用5个bit位的空间
	int _c : 10;//:10 代表占用10个bit位的空间
	int _d : 30;//:30 代表占用30个bit位的空间
};

在结构体创建的时候,有一些成员它的取值范围可能会非常有限 ,我们举例来说:

struct A
{
	int _a;
	int _b;
	int _c;
	int _d;
};

假设-a这个成员的取值只能是0、1、2、3这几个值,0的二进制为00;1的二进制位01;2的二级制位10;3的二进制为11,这时我们会发现只要两个bit位就能把这4种情况全部表示出来,而如果我们没有把它实现成位段的方式,而是直接定义成整型的话,1个整型是4个字节即32个bit位,32个bit位如果都给-a,但-a本质上只用2个bit位,那余下的30个bit位就会被浪费掉。基于这样的情况,如果我们能够知道一个结构体的某些成员它的取值范围只是占了内存空间的一部分时,它好像用不了一个整型,那我们就可以指定它的位,这样就可以很好的节省空间。

A就是一个位段类型,那位段A的大小是多少呢?

探索结构体的奥秘_第12张图片

 上面我们用来举例的结构体大小为16个字节,这是毋庸置疑的。我们通过位段A每个成员变量它所占的bit位可以大概猜测出它的大小为6个字节,而位段A的大小通过计算是8个字节,这样一对比,就可以看出它比结构体节省了一半的空间。

2.2 位段的内存分配

  1. 位段的成员可以是 int 、unsigned int 、signed int 或者是 char (属于整形家族)类型。
  2.  位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
  3.  位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

 一个栗子:

//空间是如何开辟的?
#include 
struct S
{
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};

int main()
{
	struct S s = { 0 };
	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;

	return 0;
}

 探索结构体的奥秘_第13张图片

2.3 位段的跨平台问题

  1. int 位段被当成有符号数还是无符号数是不确定的。
  2. 位段中最大位的数目不能确定。(16位机器上整型的大小是2个字节 = 16bit位,32位机器上整型的大小是4个字节 = 32bit位),写成27,在16位机器会出问题。
  3.  位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
  4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。

总结:

跟结构相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在。

2.4 位段的应用

探索结构体的奥秘_第14张图片

3,枚举

枚举顾名思义就是一一列举的意思,把可能的取值一一列举。

比如我们现实生活中:

一周的星期一到星期天是有限的7天,可以一一列举出来;

性别有:男、女、保密,也可以一一列举;

一年有12个月,也可以一一列举。

这里就可以使用枚举了。

3.1 枚举类型的定义

enum Sex//性别
{
	//枚举的可能取值
	MALE,//男
	FEMALE,//女
	SECRET//保密
};

enum Color//颜色
{
	//枚举常量
	RED,
	GREEN,
	BLUE
};

以上定义的 enum Sex , enum Color 都是枚举类型。{ }中的内容是枚举类型的可能取值,也叫枚举常量,这些可能取值都是有值的,默认从0开始,依次递增1。

int main()
{
	printf("%d\n", MALE);
	printf("%d\n", FEMALE);
	printf("%d\n", SECRET);

	enum Sex sex = SECRET;//赋值

	return 0;
}

探索结构体的奥秘_第15张图片

当然在定义的时候也可以赋初值,例如:

enum Sex
{
	//枚举的可能取值
	MALE = 1,
	FEMALE = 2,
	SECRET = 4
};

3.2 枚举的优点

我们可以使用 #define 定义常量,为什么非要使用枚举呢?

枚举的优点:

  1. 增加代码的可读性和可维护性
  2. 和#define定义的标识符比较 枚举有类型检查,更加严谨。
  3. 便于调试
  4. 使用方便,一次可以定义多个常量

3.3 枚举的使用

enum Color//颜色
{
	RED = 1,
	GREEN = 2,
	BLUE = 4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异。
clr = 5; //编译器更加严谨的时候可能会出现类型不匹配的问题

4,联合(共用体)

4.1 联合类型的定义

联合也是一种特殊的自定义类型,这种类型定义的变量也包含一系列的成员,特征是这些成员共用同一块空间(所以联合也叫共用体)。

//联合类型的声明
union Un
{
	char c;
	int i;
};

int main()
{
	union Un un;//联合变量的定义
	printf("%d\n", sizeof(un));//计算联合变量的大小

	return 0;
}

4.2 联合的特点

联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。

union Un
{
	int i;
	char c;
};

// 下面输出的结果是一样的吗?
int main()
{
	union Un un;

	printf("%p\n", &(un));
	printf("%p\n", &(un.i));
	printf("%p\n", &(un.c));

	return 0;
}

运行结果: 

探索结构体的奥秘_第16张图片


面试题,判断当前计算机的大小端存储: 

#include 
int check_sys()
{
	union Un
	{
		int i;
		char c;
	}un;
	un.i = 1;
	return un.c;//返回1表示小端,返回0表示大端
}

int main()
{
	int ret = check_sys();
	if (ret == 1)
		printf("小端\n");
	else
		printf("大端\n");

	return 0;
}

4.3 联合大小的计算

  • 联合的大小至少是最大成员的大小。
  • 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
union Un1
{
	char c[5];//5
	int i;//4
};
union Un2
{
	short c[7];//14
	int i;//4
};

int main()
{
	//下面输出的结果是什么?
	printf("%d\n", sizeof(union Un1));
	printf("%d\n", sizeof(union Un2));

	return 0;
}

 运行结果:

探索结构体的奥秘_第17张图片

你可能感兴趣的:(C语言从入门到精通,c语言,结构体,枚举,联合体,位段)