今日主题是自定义类型的知识点的整理,大家帮忙斧正下!
目录
一,结构体
1,结构体的声明
2,结构体自引用
3,结构体内存对齐(非常重要)
4,修改默认对齐数
5,结构体传参
二,位段
1,位段定义
2,位段的内存分配
3,位段的跨平台性
三,枚举
3.1,枚举类型的定义
3.2,枚举的优点
四,联合(共用体)
4.1,联合的定义
4.2,联合的特点
4.3,联合的大小
基础声明:
不完全声明:
不完全声明,就是省略掉结构体标签(名字),也成为匿名结构体
但是这有一点谨记,即使两个匿名结构体的成员列表都相同,但是他们任然是属于不同的类型。
例如:p = &x;
这个就是不合法的,因为变量p与&x的类型不兼容,他们是不同类型的结构体变量。
结构体自引用:在结构中包含一个类型为该结构本身的成员,有点递归的那么点意思。
//代码1
struct Node
{
int data;
struct Node next;
};
//可行否?
那按照意思就是这样写出的代码,那可行吗?答案是不行的,因为就相当于在一个结构体内部又套了一个自身的结构体,就这样一直套了下去,那你想想这个结构体最终得有多大,所以这种方法肯定是不可行的。
这里我们就类比一个知识,就是数据结构里面的链表,一个数据的存储空间里面包含了数据域与指针域,指针域中放的是下一个有关联的数据的地址,这样就可以把数据像链子一样串了起来,那这里可以用同样的方法,把结构体里面放一个指向自身的结构体指针就行了。
//代码2
struct Node
{
int data;
struct Node* next;
};
引申一下,typedef 用来类型重命名,那下面这种代码可行吗?
typedef struct
{
int data;
Node* next;
}Node;
//这样写代码,可行否?
首先,你可以用typedef对一个匿名结构体重命名,但是在这里它是结构体的自引用,就相当于你要去重命名为Node,但是你结构体内部就已经先用了,这就相当于先有鸡还是先有蛋的问题了,所以是不行的。也即是在自引用的条件下,你就算是重命名了,也不能先在结构体里面用。
//解决方案:
typedef struct Node
{
int data;
struct Node* next;
}Node;
结构体内存对齐,其实本质上我们要解决的是计算结构体大小。
struct S1
{
char c1;
int i;
char c2;
};
int main(){
printf("%d\n", sizeof(struct S1));
return 0;
}
首先,看这段代码,大家可能会认为这个结构体大小不就是6嘛,两个char型加一个int型,但事实上结果是8,这里就是因为结构体内存对齐导致的,那如何去进行对齐呢?
对齐规则:
- 首先得掌握结构体的对齐规则:
- 1. 第一个成员在与结构体变量偏移量为0的地址处。
- 2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。对齐数 = 编译器默认的一个对齐数 与 该成员大小的中的较小值。VS中默认的值为8
- 3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
- 4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整 体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
详解:
提到了默认对齐数,点一个点在vs编译器下,默认对齐数是8,在linux环境下是没有默认对齐数的概念的,这时候其自身的大小就是默认对齐数。
那么说是这么说,那真的在内存中就是这么对齐存储的吗?
这里给大家介绍一个宏,可以用来计算结构体成员地址相对于起始地址的偏移量。我们来验证一下!
例如还是上面的S1,程序如下:
可以看到,偏移量与我们上面分析的是一样的,所以结构体中的对齐规则是没有问题的。
结构体嵌套问题:
struct S1
{
char c1;
int i;
char c2;
};
struct S4
{
char c1;
struct S1 s1;
double d;
};
int main() {
printf("%d\n", sizeof(struct S4));
return 0;
}
解析:
总结一下,单纯只是计算结构体的大小时,我们只需要先找到整个结构体的最大对齐数,然后整个结构体的大小肯定是个最大对齐数的倍数,然后你看是几倍,能够把几个成员放下,那么这个时候,这个倍数的数就满足既能放下成员,而且最大对齐数的倍数。
那为什么存在内存对齐?
1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特 定类型的数据,否则抛出硬件异常。
2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访 问。
总体而言,结构体的内存对齐是拿空间来换取时间的做法。那么既然我们结构体内部有内存对齐的操作,所以我们在设计结构体的时候也就应该注意,让占用空间小的数据尽量集中在一起,因为这个时候浪费的那些空间刚好可能就能放下这些数据,就能够达到节省一点空间的目的。
VS环境下默认对齐数是8,这个默认对齐数是可以改的。
#include
#pragma pack(4)
struct S1
{
char c1;
double c2;
};
#pragma pack()
int main() {
printf("%d\n", sizeof(struct S1));
return 0;
}
上面的这段代码的结构是12,原本的结果应该是16,但是当我们把默认对齐数改成4后,结果就变成了12。
注意:虽然说默认对齐数可以改,但是也不是随便让你改着玩的,一般就是8,你就算改,改的值也应该是2的倍数才比较好。
所以,不要随意修改默认对齐数,编译器让我们能改,但不是随便改。
两种传参方式:
第一种:实参用结构体,形参也用一个结构体变量接收,这个时候形参就是实参的一份临时拷贝。那如果结构体很大,就比较浪费空间。
第二种:实参用结构体的地址,形参用结构体指针来接收。
两种方法,最好是采用第二种,因为函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
结构体讲完就得讲讲结构体实现 位段 的能力。
位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是 int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。
例如:
struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:30;
};
A就是一个位段类型。
比较一下结构体与位段的大小有什么区别?
可以看到,位段类型的变量A的大小明显要小很多,这是因为后面跟的数字就限制了大小只可能最大为这么多。位段类型的存在一定是在特定的业务条件下的,比如_a只分配了两个字节,那二进制就只可能是00,01,10,11,代表0,1,2,3四个十进制数,那如果这个业务里面_a就只需要这四个值,我们就只需要给其分配两个字节就好了,这样就能节省空间。
1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
详细解析:
看下面这个例子:
这里是我们的自己分析假设过程,那具体到底是不是这样呢?我们来看看编译器的内存图:
求取结构体S的大小:
从结果可以看出,结构体S确实是占三个字节,并且在内存中的存储方式也和我们分析的一样。
1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(比如对于int类型的数据,16位机器是两个字节也就是最大16位,32位机器最大32位,所以你在设定数据所占位时就不能超过机器的最大限制)
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
枚举:顾名思义就是一一列举,把可能的取值一一列举。
enum Sex//性别
{
MALE,
FEMALE,
SECRET
};
这里的Sex就是枚举类型,因为性别的值可以一一列举出来,要么男,要么女,要么保密。
而枚举类型里面的可能取值就叫做枚举常量,它是有值的,从第一个开始,由0往后递增。当然这只是默认情况,你也可以自己赋初值,这个时候没有赋初值的就在前一个的基础上加1就是其默认初值。
例如:
这里大家要注意,既然里面的值是枚举常量,那么常量的值就是不能改的,我们上面在枚举类型里面赋值那是初始化值,但是你如果在外面想对枚举常量初始化好的值进行修改是不行的。
枚举的优点:
1. 增加代码的可读性和可维护性
2. 和#define定义的标识符比较枚举有类型检查,更加严谨。
3. 防止了命名污染(封装)
4. 便于调试 (对于define而言,它在预编译就给你把符号进行了相关的替换,所以你最终调试的时候就是替换后的代码,和源码是不一样的,这个时候就不是很便于调试。但是枚举类型的数据虽然有值,但不会进行替换,便于调试)
5. 使用方便,一次可以定义多个常量
enum Color c = 1;
//这里其实就是想把c赋值为RED,c语言对类型检查不是很严格,但是在c++下这句代码是错误的,因为你将int类型的数据赋值给枚举类型的数据,类型不兼容,enum是有类型检查的
注意:在定义变量名字的时候不要和枚举常量的名字冲突,因为枚举类型的数据是不支持限制所属范围的。
联合也是一种特殊的自定义类型,这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以联合也叫共用体)。同时时间只能用一个。
可以看到,联合的大小是4而不是两个成员大小相加的5,并且联合的地址与其两个成员的地址也是一模一样的,所以是共用了空间的,这也是为什么还会叫做共用体了。
注意:既然是共用了,所以你改动其中一个的值另外的一个也会变,所以成员在使用的时候就是只能用一个,你用i就不能用c,这也就是联合的应用场景。
联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。
根据联合的特点,我们是可以用来判断机器是小端存储还是大段存储的。
原方法:
int main() {
int x = 1;
if (1 == *(char*)&x) {//把x强壮为char*后拿到第一个字节的内容,看是不是00000001,也就是1
printf("小端");
}
else {
printf("大端");
}
}
联合:
int check_sys() {
union Un
{
char c;
int i;
}u;
u.i = 1;
return u.c;
}
int main() {
int ret = check_sys();
if (1 == ret ) {
printf("小端");
}
else {
printf("大端");
}
}
运用联合的思想就是一个整形的成员和一个字符型的成员,你把整型的成员赋值为1,那么这个时候字符型的成员因为是共用空间的,所以也会被赋值,那如果是小端,第一个字节就是00000001,这块空间又是共用的,所以字符型成员的值应该是1。
- 联合的大小至少是最大成员的大小。
- 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
注意:联合也是有对齐的,规则与结构体对齐一样。
union Un
{
short arr[7];//对于数组,我们看对齐数是参照的其数值的类型而不是数组的元素个数。2,8 所以对齐数是2
int i;//对齐数是4
}u;
int main() {
printf("%u\n", sizeof(u));
}
这里的结果是16,因为arr数组的大小是14,至少是最大成员的大小,所以肯定14往上走,而又要求是最大对齐数的倍数,所以只能是16,这里前四个字节就是共用的。
今天的博文就到这,如果大家觉得写的还不错的哈,还请帮忙点点赞哦,十分感谢你们,我们下次再键豁嘻嘻!