【C语言】自定义类型之结构体篇

目录

一、结构体类型的声明

1、结构的声明

2、不完全声明

二、结构体的自引用

三、结构体变量的定义和初始化

四、结构体内存对齐

1、结构体内存对齐规则

2、为什么要对齐

3、修改默认对齐数

五、结构体传参

六、位段

1、位段是什么

2、位段的内存分配

3、 位段的跨平台问题


C语言内置类型:char、short、int、long 、long  long(c99)、float 、double

与内置类型相对应的是自定义类型

一般用来表示复杂对象,如:

书:书名、作者、出版社、定价、书号

人:名字、性别、年龄、身高、身份证

结构体——struct

枚举——enum

联合体——union

一、结构体类型的声明

结构是一些值的集合,这些值成为成员变量,结构的每个成员可以是不同类型的变量。

1、结构的声明

struct tag
{
 member-list;
}variable-list;

比如这样来描述一本书

//书
struct Book
{
	char book_name[20];
	char author[20];
	int price;
	char id[20];
}sb3, sb4;//分号不能忘

int main()
{
	struct Book sb1;//局部变量
	struct Book sb2;//局部变量

	return 0;
}

sb1,sb2是struct Book类型的结构体变量,是局部变量;sb3,sb4也是struct Book 类型的结构体变量,是全局变量。

用类型创建变量 ,只要创建变量就在内存里开辟了空间。

2、不完全声明

在声明结构的时候,可以不完全的声明。

struct//把标签名省略掉
{
	char book_name[20];
	char author[20];
	int price;
	char id[20];
}sb1, sb2;//省略标签名,就只能在这写变量名

把标签名省略掉,就只能在定义结构体类型的时候写变量名!

//匿名结构体类型
struct
{
 int a;
 char b;
 float c;
}x;
struct
{
 int a;
 char b;
 float c;
}*p;

在上面代码的基础上,这个代码合法吗?

p = &x;

警告:

编译器认为等号两边类型不相同,虽然成员一模一样,但在编译器看来是两种不同的结构体类型。

所以是非法的!

二、结构体的自引用

在结构中包含一个类型为该结构本身的成员

数据结构——数据在内存中存储的结构

线型数据结构:顺序表、链表

树形数据结构:二叉树

存储:1   2   3   4   5

【C语言】自定义类型之结构体篇_第1张图片

typedef struct Node
{
	int data;
	struct Node* next;
}Node;//重命名

int main()
{
	Node n;
	return 0;
}

三、结构体变量的定义和初始化

#include
struct Stu
{
	char name[20];
	int age;
	char id[12];
};
struct Book
{
	char book_name[20];
	char author[20];
	int price;
	char id[20];
	struct Stu s;
}sb3={ "《happy》","xyj",88,"xy10001",{"lisu",30,"115614"}, sb4;

int main()
{
	struct Book sb1 = { "《happy》","xyj",88,"xy10001" };//局部变量
	//打印
	printf("%s %s %d %s %d %s %s\n", sb3.book_name, sb3.author, sb3.price, sb3.id,sb3.s.age,sb3.s.id,sb3.s.name);
	return 0;
}

还有不一定按照默认顺序去初始化,举个例子:

#include
struct S
{
	char c;
	int a;
	float f;
};
int main()
{
	struct S s = { 'w', 10 , 3.14f };
	printf("%c %d %f\n", s.c, s.a, s.f);

	struct S s2 = { .f = 3.14f,.c = 'w',.a = 10 };//不一定按照默认顺序去初始化
	printf("%c %d %f\n", s2.c, s2.a, s2.f);
	
	return 0;
}

四、结构体内存对齐

【C语言】自定义类型之结构体篇_第2张图片

 输出的结果是12和8,让我们来一起探讨一下原因!

Offsetof:宏,用来计算结构体成员相对于起始位置的偏移量

【C语言】自定义类型之结构体篇_第3张图片

 【C语言】自定义类型之结构体篇_第4张图片

1、结构体内存对齐规则

(1)结构体的第一个成员直接对齐到结构体变量起始位置为0的偏移处。

(2)从第二个成员开始,变量要对齐到某个数字(对齐数)的整数倍的地址处

对齐数=编译器默认的一个对齐数与结构体成员自身大小的较小值

VS默认的值是8,Linux环境默认不设对齐数(对齐数是结构体成员的自身大小)

(3)结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍

每个结构体成员都有自己的对齐数,最大的就是最大对齐数

(4)如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍!

struct S3
{
 double d;
 char c;
 int i;
};
printf("%d\n", sizeof(struct S3));

接下来我们来练习一下,求出struct S3

如图

【C语言】自定义类型之结构体篇_第5张图片

如图蓝色的部分都被浪费了。

因为从第二个成员开始,变量要对齐到对齐数的整数倍的地址处,所以i不能在9处,应该对齐到4大整数倍12处,所以struct S3的大小就是16个字节

2、为什么要对齐

(1)平台原因(移植原因)

不是所有的硬件平台都能访问任意地址上的任意数据的,某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常

(2)性能原因

数据结构(尤其是栈)应该尽可能在自然边界上对齐

原因在于,为了访问未对齐内存,处理器需要做两次内存访问;而对齐的内存访问仅需要一次访问

总体来说:结构体的内存对其是拿空间来换取时间的做法。在设计结构体时,我们既要满足对齐,又要节省空间

如何做到:让占用空间小的成员尽量集中在一起

例如:


struct S1
{
 char c1;
 int i;
 char c2;
};
struct S2
{
 char c1;
 char c2;
 int i;
}

 S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别

3、修改默认对齐数

之前我们见过了 #pragma 这个预处理指令,这里我们再次使用,可以改变我们的默认对齐数。

#include 
#pragma pack(8)//设置默认对齐数为8
struct S1
{
 char c1;
 int i;
 char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
 char c1;
 int i;
 char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
    //输出的结果是什么?
    printf("%d\n", sizeof(struct S1));
    printf("%d\n", sizeof(struct S2));
    return 0;
}

结构在对齐方式不合适的时候,我们可以自己更改默认对齐数。

五、结构体传参


struct S
{
	int data[1000];
	int num;
};
void print1(struct S s)
{
	printf("%d %d %d %d\n", s.data[0], s.data[1], s.data[2], s.num);
}
void print2(struct S* ps)
{
	//printf("%d %d %d %d\n", (*ps).data[0], (*ps).data[1], (*ps).data[2], (*ps).num);
	printf("%d %d %d %d\n", ps->data[0], ps->data[1], ps->data[2], ps->num);
}
int main()
{
	struct S ss = { {1,2,3,4,5},100 };
	print1(ss);//传结构体
	print2(&ss);//传地址
	return 0;
}

上面的 print1 和 print2 函数哪个好呢?

答案是:首选print2函数。

原因: 函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。 

!!结构体传参的时候,要传结构体的地址

六、位段

1、位段是什么

位段的声明和结构是类似的,有两个不同:

(1)位段的成员必须是 int、unsigned int 或signed int 。

(2)位段的成员名后边有一个冒号和一个数字。

struct S
{
	int a;
	int b;
	int c;
	int d;
};
struct A
{
	//4byte-32bit
	int _a : 2;//a成员只需要两个比特位//30
	int _b : 5;//25
	int _c : 10;//15
	int _d : 30;//不够,向内存申请4个字节
	//4byte-32bit
};

A就是一个位段类型。位段其中的位其实是二进制位!

首先开辟了四个字节的空间,也就是32个比特位,a成员需要2个比特位,b需要5个,c需要10个,此时剩下15个比特位,d需要30个,明显不够,会再向内存申请4个字节,所以一共向内存申请了8个字节

struct A 的大小就是8个字节。

2、位段的内存分配

(1) 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型

(2)位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。

(3)位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位。

3、 位段的跨平台问题

(1)int 位段被当成有符号数还是无符号数是不确定的。

(2)位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机 器会出问题。

(3)位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。

(4)当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是 舍弃剩余的位还是利用,这是不确定的。

总结: 跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在

你可能感兴趣的:(c语言,开发语言)