C语言进阶——自定义类型:结构体 枚举 联合

 

作者:敲代码の流川枫

博客主页:流川枫的博客

专栏:C语言从入门到进阶

语录:Stay hungry stay foolish

工欲善其事必先利其器,给大家介绍一款超牛的斩获大厂offer利器——牛客网

点击免费注册和我一起刷题吧

文章目录

1. 结构体结构体类型的声明

1.1 结构的基础知识

1.2 结构的声明

1.3 匿名结构体类型

2. 结构的自引用

3. 结构体变量的定义和初始化

4. 结构体内存对齐

5. 结构体传参

6. 结构体实现位段

6.1 什么是位段

6.2 位段的内存分配

 6.3 位段的跨平台问题

6.4 位段的应用

7.枚举

7.1 枚举类型的定义

7.2 枚举的优点

7.3 枚举的使用

8. 联合(共用体)

8.1 联合类型的定义

8.2 联合的特点

8.3 联合大小的计算

1. 结构体结构体类型的声明

1.1 结构的基础知识

结构是一些值的集合,这些值称为成员变量

数组也是一些值的集合,不同的是,结构的每个成员可以是不同类型的变量,数组是一组相同类型元素的集合

1.2 结构的声明

struct tag
{
    member-list;
}variable-list;

tag是结构体标签, member-list是成员列表,variable-list是变量列表

例如描述一个学生:

struct Stu
{  
    char name[20];//名字
    int age;//年龄
    char sex[5];//性别
    char id[20];//学号
}; //分号不能丢
struct stu
{
    //属性
    char name[20];
    int age[10];
}s1,s2;

s1s2是用该结构体类型创建的变量,在主函数外创建的变量是全局变量,在主函数内部创建的是局部变量

1.3 匿名结构体类型

匿名结构体类型只能使用一次

//匿名结构体类型
struct
{
    //属性
    char name[20];
    int age[10];
}s1;
#define _CRT_SECURE_NO_WARNINGS
#include
struct
{
	char name[20];
	int age[20];
}x;
struct
{
	char name[20];
	int age[20];
}s1[20], * p;
int main()
{
	p = &x;
	return 0;
}

编译器会报一个警告:

23d492c1a6f348bb98fe490432401e71.png

 这说明这两个结构体虽然成员相同,但编译器会把上面的两个声明当成完全不同的两个类型,所以是非法的

2. 结构的自引用

自引用方式:

struct Node
{
    int data;
    struct Node* next;
};

上面一段代码中,结构体类型是struct Node,里边还有一个struct Node *next成员变量,是一个指向struct Node类型数据的指针,也就是说,他的存储结构可以如下所示: 

C语言进阶——自定义类型:结构体 枚举 联合_第1张图片

 

这个结构体包含的指针能找到同类型的另外一个数据,实现了链表的功能,就是结构的自引用

在结构中包含一个类型为该结构本身的成员是不可行的

3. 结构体变量的定义和初始化

 定义:

struct Point
{ 
	int x;
	int y; 
}p1; //声明类型的同时定义变量p1
	struct Pointp2; 
	//定义结构体变量p2

 初始化:

struct Stu        //类型声明
{
     char name[15];//名字
     int age;      //年龄
};
struct Stus = {"zhangsan", 20};//初始化

嵌套初始化:

struct Node
{ 
    int data;
    struct Pointp; 
    struct Node* next;
}n1= {10, {4,5}, NULL}; //结构体嵌套初始化

struct Node2= {20, {5, 6}, NULL};//结构体嵌套初始化

4. 结构体内存对齐

#define _CRT_SECURE_NO_WARNINGS
#include
struct s1
{
	char c1;
	char c2;
	int i;
};
struct s2
{
	char c1;
	int i;
	char c2;
};
int main()
{
	printf("%d\n", sizeof(struct s1));
	printf("%d\n", sizeof(struct s2));

	return 0;
}

5b4176e998974c9985f848fee8aa83d1.png

 

两结构体只是成员的位置不同,结果却有差异,这是什么原因导致的呢,下面讨论一下如何计算结构体的大小

首先得掌握结构体的对齐规则:

1. 第一个成员在与结构体变量偏移量为0的地址处

2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。VS中默认的值为8

3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍

4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍

计算结构体大小:

第一个字节相对于起始的地址偏移量为0,后面依次+1,由对齐规则可知:c1大小一个字节,在与结构体变量偏移量为0的地址处;i大小4个字节,小于默认对齐数8,整数倍为4,放在与结构体变量偏移量为4~7的位置;c2大小一个字节,小于默认对齐数8,整数倍为1,放在与结构体变量偏移量为8的位置;结构体总大小为最大对齐数(i的对齐数为4)的整数倍,即结构体总体大小为12个字节

C语言进阶——自定义类型:结构体 枚举 联合_第2张图片

 

 可以用它来检验我们的偏移量计算是否正确:

C语言进阶——自定义类型:结构体 枚举 联合_第3张图片

#define _CRT_SECURE_NO_WARNINGS
#include
#include

struct s1
{ 
	char c1;
	int i;
	char c2;
};
int main()
{
	printf("%d\n",offsetof(struct s1,c1));
	printf("%d\n",offsetof(struct s1, i));
	printf("%d\n",offsetof(struct s1, c2));

	return 0;
}

C语言进阶——自定义类型:结构体 枚举 联合_第4张图片

我们继续分析第二个结构体:c1在与结构体变量偏移量为0的地址处;c2大小一个字节,放在偏移量2处,i大小4个字节,放在偏移量为4的位置;i的对齐数为4是在大的且小于默认对齐数8,故s2总大小为8字节

C语言进阶——自定义类型:结构体 枚举 联合_第5张图片

 

为什么存在内存对齐?

大部分的参考资料都是如是说的:

1. 平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常

2. 性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

struct S
{
    char c;
    int i;
};
struct S s;

 在32位机器下,如果无内存对齐,访问i则需要访问两次,有内存对齐时访问一次就可访问到i

C语言进阶——自定义类型:结构体 枚举 联合_第6张图片

总体来说:结构体的内存对齐是拿空间来换取时间的做法

那在设计结构体的时候,我们既要满足对齐,又要节省空间

如何做到:让占用空间小的成员尽量集中在一起

默认对齐数是可以修改的,之前我们见过了#pragma这个预处理指令,这里我们再次使用,可以改变我们的默认对齐数。

#define _CRT_SECURE_NO_WARNINGS
#include
//#pragma pack(4)
struct s1
{
	int c1;
	double c2;
};

int main()
{
	printf("%d\n", sizeof(struct s1));
	return 0;
}

 

bfda0d89307240f8bb648aa9de130764.png

c1:0~3;c2:对齐数为8,8~15;最大对齐数:8,故总体大小:16 

 当我们改变默认对齐数:

#define _CRT_SECURE_NO_WARNINGS
#include
#pragma pack(4)
struct s1
{
	int c1;
	double c2;
};

int main()
{
	printf("%d\n", sizeof(struct s1));
	return 0;
}

128f8455002b48cbb1459252bdedd292.png

 c1:0~3;c2:对齐数为4,4~11;最大对齐数:4,故总体大小:12 

结论:结构在对齐方式不合适的时候,我么可以自己更改默认对齐数

5. 结构体传参

struct S 
{
	int data[1000];
	int num;
}; 
struct S s = { {1,2,3,4}, 1000 };

//结构体传参
void print1(struct S s)
{ 
	printf("%d\n", s.num);
}

//结构体地址传参
void print2(struct S*ps)
{ 
    printf("%d\n", ps->num);
} 

int main()
{ 
	print1(s); //传结构体 
	print2(&s); //传地址 
	return 0;
}

选择传址调用的原因:

函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销

如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降

结论:结构体传参的时候,要传结构体的地址

6. 结构体实现位段

6.1 什么是位段

位段的声明和结构是类似的,C语言允许在一个结构体中以位为单位来指定其成员所占内存长度,这种以位为单位的成员称为位段。利用位段能够用较少的位数存储数据

有两个不同:

1.位段的成员必须是int、unsigned int 或signed int

2.位段的成员名后边有一个冒号和一个数字

例如:

struct A
{ 
    //4byte=32bit
    int_a:2;
    int_b:5;
    int_c:10;
    //余15
    4byte=32bit
    int_d:30;
};

A的大小:

printf("%d\n", sizeof(struct A));

6.2 位段的内存分配

内存分配规则:

1. 位段的成员可以是intunsigned intsigned int或者是char(属于整形家族)类型

2. 位段的空间上是按照需要以4个字节(int)或者1个字节(char)的方式来开辟的

3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段
 

struct S
{ 
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
}; 
int main()
{
	struct S s = { 0 };
	printf("%d\n", sizeof(struct S ));
	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;
	return 0;
}

分析如图:

C语言进阶——自定义类型:结构体 枚举 联合_第7张图片

 因此在内存中开辟三个字节分别用来存放62 02 04

 6.3 位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的

2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题

3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义

4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的

总结:跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。

6.4 位段的应用

C语言进阶——自定义类型:结构体 枚举 联合_第8张图片

7.枚举

枚举顾名思义就是一一列举

把可能的取值一一列举

比如我们现实生活中:

一周的星期一到星期日是有限的7天,可以一一列举

性别有:男、女、保密,也可以一一列举

月份有12个月,也可以一一列举

7.1 枚举类型的定义

#define _CRT_SECURE_NO_WARNINGS
#include
enum Day//星期
{ 
	Mon = 1,
	Tues,
	Wed,
	Thur,
	Fri,
	Sat,
	Sun
};
int main()
{
	printf("%d\n", Mon);
	printf("%d\n", Tues);
	printf("%d\n", Wed);
	printf("%d\n", Thur);
	printf("%d\n", Fri);
	printf("%d\n", Sat);
	printf("%d\n", Sun);

}

C语言进阶——自定义类型:结构体 枚举 联合_第9张图片

 { } 中的内容是枚举类型的可能取值,也叫枚举常量

这些可能取值都是有值的,默认从0开始,一次递增1,当然在定义的时候也可以赋初值,上述代码给Mon复制为1,后面会自动增加

7.2 枚举的优点

我们可以使用#define定义常量,为什么非要使用枚举?

枚举的优点:

1. 增加代码的可读性和可维护性

2. 和#define定义的标识符比较枚举有类型检查,更加严谨

3. 防止了命名污染(封装)

4. 便于调试5. 使用方便,一次可以定义多个常量

7.3 枚举的使用

enum Color
	//颜色
{ 
	RED=1,
	GREEN=2,
	BLUE=4
};
enum Color clr = GREEN;
//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异。
clr = 5;

8. 联合(共用体)

8.1 联合类型的定义

联合也是一种特殊的自定义类型

这种类型定义的变量也包含一系列的成员,特征是这些成员共用同一块空间(所以联合也叫共用体

union Un
{
	char c;
	int i;
};
union Un un;
int main()
{
	printf("%d\n", sizeof(un));
	printf("%d\n", &(un));

	printf("%d\n", &(un.c));
	printf("%d\n", &(un.i));

}

C语言进阶——自定义类型:结构体 枚举 联合_第10张图片

上述代码的结果说明它们地址都是相同的,c和i在第一个字节上共用空间,有空间重叠

C语言进阶——自定义类型:结构体 枚举 联合_第11张图片

8.2 联合的特点

联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)

union Un
{
	char c;
	int i;
};
union Un un;
int main()
{
	printf("%d\n", &(un.c));
	printf("%d\n", &(un.i));

	un.i = 0x11223344;
	un.c = 0x55;
	printf("%x\n", un.i);
}

C语言进阶——自定义类型:结构体 枚举 联合_第12张图片

 44被修改成55,因此在改c的值的时候i的值也被改变

 

面试题:

判断当前计算机的大小端存储方式

C语言进阶——自定义类型:结构体 枚举 联合_第13张图片

 

 

方法一:

int check_sys()
{
	int a = 1;
	return *(char*)&a;
}
int main()
{
	int ret = check_sys();
	if (ret == 1)
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
	}
}

0da2cc47e54e4e029cbdbabc8ab24e61.png

 

方法二(共用体):

如果返回1,则是小端存储,返回0则是大端存储,分析如图:

C语言进阶——自定义类型:结构体 枚举 联合_第14张图片

 

int check_sys()
{
	union Un
	{
		char c;
		int i;
	}u;
	u.i = 1;
	return u.c;
}
int main()
{
	int ret = check_sys();
	if (ret == 1)
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
	}
}

2b2129eded4140759b46f9bd91462d8f.png

8.3 联合大小的计算

联合的大小至少是最大成员的大小

当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍

union Un1
{  
	char c[5];
	int i;
};  
union Un2
{ 
	short c[7];
	int i; };
int main()
{
	//下面输出的结果是什么?
	printf("%d\n", sizeof(union Un1));
	printf("%d\n", sizeof(union Un2));
	return 0;
}

以Un1为例分析,共用体也存在对齐,4不是默认对齐数8的整数倍,因此要向后对齐到8

C语言进阶——自定义类型:结构体 枚举 联合_第15张图片

2ae432d2e23c49a38dd8118f47f6a5bf.png

“ 记得给博主一个三连哈,你的支持就是我创作的最大动力!!!”

 

你可能感兴趣的:(C语言从入门到进阶,开发语言,c语言,学习,经验分享)