目录
一、结构体类型的声明
1、结构的声明
2、不完全声明
二、结构体的自引用
三、结构体变量的定义和初始化
四、结构体内存对齐
1、结构体内存对齐规则
2、为什么要对齐
3、修改默认对齐数
五、结构体传参
六、位段
1、位段是什么
2、位段的内存分配
3、 位段的跨平台问题
C语言内置类型:char、short、int、long 、long long(c99)、float 、double
与内置类型相对应的是自定义类型
一般用来表示复杂对象,如:
书:书名、作者、出版社、定价、书号
人:名字、性别、年龄、身高、身份证
结构体——struct
枚举——enum
联合体——union
结构是一些值的集合,这些值成为成员变量,结构的每个成员可以是不同类型的变量。
struct tag
{
member-list;
}variable-list;
比如这样来描述一本书
//书
struct Book
{
char book_name[20];
char author[20];
int price;
char id[20];
}sb3, sb4;//分号不能忘
int main()
{
struct Book sb1;//局部变量
struct Book sb2;//局部变量
return 0;
}
sb1,sb2是struct Book类型的结构体变量,是局部变量;sb3,sb4也是struct Book 类型的结构体变量,是全局变量。
用类型创建变量 ,只要创建变量就在内存里开辟了空间。
在声明结构的时候,可以不完全的声明。
struct//把标签名省略掉
{
char book_name[20];
char author[20];
int price;
char id[20];
}sb1, sb2;//省略标签名,就只能在这写变量名
把标签名省略掉,就只能在定义结构体类型的时候写变量名!
//匿名结构体类型
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}*p;
在上面代码的基础上,这个代码合法吗?
p = &x;
警告:
编译器认为等号两边类型不相同,虽然成员一模一样,但在编译器看来是两种不同的结构体类型。
所以是非法的!
在结构中包含一个类型为该结构本身的成员
数据结构——数据在内存中存储的结构
线型数据结构:顺序表、链表
树形数据结构:二叉树
存储:1 2 3 4 5
typedef struct Node
{
int data;
struct Node* next;
}Node;//重命名
int main()
{
Node n;
return 0;
}
#include
struct Stu
{
char name[20];
int age;
char id[12];
};
struct Book
{
char book_name[20];
char author[20];
int price;
char id[20];
struct Stu s;
}sb3={ "《happy》","xyj",88,"xy10001",{"lisu",30,"115614"}, sb4;
int main()
{
struct Book sb1 = { "《happy》","xyj",88,"xy10001" };//局部变量
//打印
printf("%s %s %d %s %d %s %s\n", sb3.book_name, sb3.author, sb3.price, sb3.id,sb3.s.age,sb3.s.id,sb3.s.name);
return 0;
}
还有不一定按照默认顺序去初始化,举个例子:
#include
struct S
{
char c;
int a;
float f;
};
int main()
{
struct S s = { 'w', 10 , 3.14f };
printf("%c %d %f\n", s.c, s.a, s.f);
struct S s2 = { .f = 3.14f,.c = 'w',.a = 10 };//不一定按照默认顺序去初始化
printf("%c %d %f\n", s2.c, s2.a, s2.f);
return 0;
}
输出的结果是12和8,让我们来一起探讨一下原因!
Offsetof:宏,用来计算结构体成员相对于起始位置的偏移量
(1)结构体的第一个成员直接对齐到结构体变量起始位置为0的偏移处。
(2)从第二个成员开始,变量要对齐到某个数字(对齐数)的整数倍的地址处
对齐数=编译器默认的一个对齐数与结构体成员自身大小的较小值
VS默认的值是8,Linux环境默认不设对齐数(对齐数是结构体成员的自身大小)
(3)结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍
每个结构体成员都有自己的对齐数,最大的就是最大对齐数
(4)如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍!
struct S3
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S3));
接下来我们来练习一下,求出struct S3
如图
如图蓝色的部分都被浪费了。
因为从第二个成员开始,变量要对齐到对齐数的整数倍的地址处,所以i不能在9处,应该对齐到4大整数倍12处,所以struct S3的大小就是16个字节
(1)平台原因(移植原因)
不是所有的硬件平台都能访问任意地址上的任意数据的,某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常
(2)性能原因
数据结构(尤其是栈)应该尽可能在自然边界上对齐
原因在于,为了访问未对齐内存,处理器需要做两次内存访问;而对齐的内存访问仅需要一次访问
总体来说:结构体的内存对其是拿空间来换取时间的做法。在设计结构体时,我们既要满足对齐,又要节省空间
如何做到:让占用空间小的成员尽量集中在一起
例如:
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
}
S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别
之前我们见过了 #pragma 这个预处理指令,这里我们再次使用,可以改变我们的默认对齐数。
#include
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
//输出的结果是什么?
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
return 0;
}
结构在对齐方式不合适的时候,我们可以自己更改默认对齐数。
struct S
{
int data[1000];
int num;
};
void print1(struct S s)
{
printf("%d %d %d %d\n", s.data[0], s.data[1], s.data[2], s.num);
}
void print2(struct S* ps)
{
//printf("%d %d %d %d\n", (*ps).data[0], (*ps).data[1], (*ps).data[2], (*ps).num);
printf("%d %d %d %d\n", ps->data[0], ps->data[1], ps->data[2], ps->num);
}
int main()
{
struct S ss = { {1,2,3,4,5},100 };
print1(ss);//传结构体
print2(&ss);//传地址
return 0;
}
上面的 print1 和 print2 函数哪个好呢?
答案是:首选print2函数。
原因: 函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
!!结构体传参的时候,要传结构体的地址
位段的声明和结构是类似的,有两个不同:
(1)位段的成员必须是 int、unsigned int 或signed int 。
(2)位段的成员名后边有一个冒号和一个数字。
struct S
{
int a;
int b;
int c;
int d;
};
struct A
{
//4byte-32bit
int _a : 2;//a成员只需要两个比特位//30
int _b : 5;//25
int _c : 10;//15
int _d : 30;//不够,向内存申请4个字节
//4byte-32bit
};
A就是一个位段类型。位段其中的位其实是二进制位!
首先开辟了四个字节的空间,也就是32个比特位,a成员需要2个比特位,b需要5个,c需要10个,此时剩下15个比特位,d需要30个,明显不够,会再向内存申请4个字节,所以一共向内存申请了8个字节
struct A 的大小就是8个字节。
(1) 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
(2)位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
(3)位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位。
(1)int 位段被当成有符号数还是无符号数是不确定的。
(2)位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机 器会出问题。
(3)位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
(4)当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是 舍弃剩余的位还是利用,这是不确定的。
总结: 跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在