目录
1.结构体
1.1结构的基础知识
1.2结构的声明
1.3特殊的声明
1.4结构的自引用
1.5结构体变量的定义和初始化
1.6结构体内存对齐
1.7 修改默认对齐数
1.8检验结构体成员偏移量函数——offsetof( )
1.9为什么存在内存对齐
1.10结构体内存对齐优化
1.11结构体传参
2.位段
2.1 什么是位段
2.2位段的内存分配
2.3位段的跨平台问题
2.4位段的应用
1.结构体
1.1结构的基础知识
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
1.2结构的声明
struct tag
{
member-list;
}variable-list;
举例:如和描述一名学生
struct Student
{
char name[20];
int age;
char sex[5];
char id[20];
};//这里的分号不能丢弃
如何在结构体创建后直接创建结构体变量
struct Student
{
char name[20];
int age;
char sex[5];
char id[20];
}s1,s2,s3;//可以创建完结构体,直接在后面写变量名,创建结构体变量
如何在创建结构体全局变量和结构体局部变量
struct student
{
char name[20];
int age;
char sex[5];
char id[20];
};
struct student S1;//全局变量
int main()
{
struct student S2;//局部变量
}
结构体指针和结构体数组的创建
struct student
{
char name[10];
int age;
char sex[10];
char school[10];
char id[10];
}S1[10],*p;
int main()
{
struct student S2[10];
struct student* p2;
return 0;
}
1.3特殊的声明
在声明结构的时候,可以不完全的声明。比如:在创建匿名结构体时,我们不会写结构体类型的类型名,因为在创建局部和全局结构体变量时需要结构体类型名,所以我们只能在结构体创建完后直接创建匿名结构体变量,这也是创建匿名结构体变量的唯一方法
匿名结构体数组和匿名结构体指针的创建
匿名结构体类型指针的问题
警告:这里虽然两个匿名结构体成员是一模一样的,但是在编译器看来还是两个不同的类型的结构体 。所以是 非法 的。
1.4结构的自引用
在结构中包含一个类型为该结构本身的成员是否可以呢?struct Node { int data; struct Node next; }; //可行否?
答案是肯定有问题,因为结构体套结构体,首先int data是4个字节,那下面那个结构体是多大呢,这又取决于这个结构体多大,这里成了一个套娃问题了,无法知道结构体到底多大,所以这里不是结构体嵌套,而是有问题的结构体创建
struct Node { int data; struct Node* next; };
这样一个存有自己类型指针的结构体是可以创建的,是因为指针就4/8个字节,结构体指针怎么创建内存大小,并且知道这个指针指向的是本结构体,就足够了,一般用于数据结构中链表.
结构体类型重命名
我们使用typedef可以重命名类型的名字,这样我们在结构体前面写上typedef,在结构体后写入重命名的名称,就可以即使用原本的类型名创建变量,又可以使用重命名后的类型名创建变量typedef struct { int data; Node* next; }Node; //这样写代码,可行否? //解决方案: typedef struct Node { int data; struct Node* next; }Node; int main() { Node p1; //and struct Node p2; return 0; }
1.5结构体变量的定义和初始化
初始化有下面这两种
1.在创建完结构体后,直接创建变量然后初始化
2.在其他地方使用结构体类型创建变量后,进行初始化
struct Student
{
char name[20];
int age;
char number[20];
}s1 = { "张三",20,"2000002" };//初始化:定义变量的同时赋初值。
int main()
{
struct Student s2 = { "李四",30,"10000001" };//初始化:定义变量的同时赋初值。
}
结构体嵌套
struct student
{
char name[10];
char sex[10];
char add[10];
int age;
};
struct Class
{
struct student s1;
struct student s2;
struct student s3;
};
这个是比较常用的结构体嵌套,先定义一个班级的结构体去嵌套学生的结构体,能够更好地表示。
1.6结构体内存对齐
我们已经掌握了结构体的基本使用了。现在我们深入讨论一个问题:计算结构体的大小。这也是一个特别热门的考点: 结构体内存对齐
我们来探讨一下结构体的大小到底是多少
struct s1 { int a; char b; long c; }; int main() { printf("%d\n", sizeof(s1)); return 0; }
对于这个结构体来说是两个char类型成员变量和一个int类型成员变量组成的,我们一般认为这个结构体肯定是4+1+8个字节
但真是这么简单吗?当我们打印出结构体占用的内存字节数时,你会发现并非如此,这个结构体竟然占用了12个字节,这是怎么计算的呢?
结构体内存对齐规律:
1. 第一个成员在与结构体变量偏移量为0的地址处。
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。VS中默认的值为8Linux没有默认对齐数(此时成员变量自身大小就是默认对齐数)
3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
也就是说结构体的内存占用规则是有要求的,我们根据上述要求,再来看一下刚刚的结构体
计算结构体大小过程:
根据1. 第一个成员在与结构体变量偏移量为0的地址处得知我们要在结构体首地址处就开始放入第一个成员,第一个成员为int类型,占四个字节
第二个成员是char型,根据2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处得知,第二个成员要计算机对齐数然后再对齐,vs中的结构体默认对齐数为8,而int型的大小是1,取两者中较小的值作为本成员的对齐数,结果为1,所以char型的i应该从偏移量为4的位置开始向下存入1个字节
第三个成员变量是long型,和默认对齐数相比,4应该为较小值,所以第三个成员变量的对齐数应该是4,这样应该从偏移量为5的位置开始向下存入4个字节
我们算完成员变量的在内存中布局后,还要根据3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍再去修整结构体最后的内存大小,因为总大小为每个成员变量中对齐数的最大值,我们知道a的对齐数是4,b的对齐数是1,c的对齐数是4,得出结构体的对齐数是4,但现在我们虽然偏移到8,但实际占了9个字节,因为9不是4的倍数,所以下一个4的倍数为12,就得出了结构体的总大小为12个字节
对于结构体镶嵌后的结构体的大小:
struct s1 { int a; char b; long c; }; struct s2 { int a; char b; struct s1 s; }; int main() { printf("s1:%d\n", sizeof(s1)); printf("s2:%d\n", sizeof(s2)); return 0; }
让我们再去分析一下:
我们首先来看结构体存放在结构体的内存布局问题,4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍
首先你要知道嵌套的结构体中的最大对齐数,他的最大对齐数应该是8个字节,因为该结构体包括了一个int一个char在这个结构体中最大对齐数是由s1提供的为8,结构体8字节再和结构体默认对齐数对比,最后为8,所以s3这个结构体应该在偏移量为8的位置存下自己
最后来看结构体整体大小,结构体的整体大小是所有最大对齐数的整数倍,也就是所有成员变量,包括结构体s3中成员变量中最大的对齐数的整数倍,这里还是由s1提供的8字节最大,所以最后为20
考点如何计算?首先得掌握结构体的对齐规则:1. 第一个成员在与结构体变量偏移量为0的地址处。2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。 对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。VS中默认的值为83. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
1.7 修改默认对齐数
#pragma 这个预处理指令,这里我们再次使用,可以改变我们的默认对齐数
#include
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
//输出的结果是什么?
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
return 0;
}
我们就看看这个默认对其数为1的代码
我们可以看到:
1.char的对齐数为1等于默认对齐数,所以从0开始占一个位
2.int的对齐数为4大于默认对齐数 ,即从1-4
3.第二个char同第一个一样
4.默认对齐数为1所以任何书皆可,我们就可以知道对齐数为6
1.8检验结构体成员偏移量函数——offsetof( )
size_t offsetof( structName, memberName );
功能:输入结构体和结构体的成员,返回成功在该结构体中的偏移量
头文件:
1.9为什么存在内存对齐
1. 平台原因(移植原因,结构体允许跨平台移植):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2. 性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
举例说明一下 2.性能原因
当我们想去读取int类型的i时你会发现,如果不考虑对齐数,想拿到i你需要读取两次才能成功拿到,而有了对齐数,可以一次就拿到int类型的i虽然浪费了空间,但是可以提升计算机的速度和效率总体来说:结构体的内存对齐是拿空间来换取时间的做法。
1.10结构体内存对齐优化
这个两个结构体,都是由两个char类型,一个int型组成,根据上面的对齐规则,右边的结构体比左边的结构体占内存空间小很多
结论:
那在设计结构体的时候,我们既要满足对齐,又要节省空间,应该:让占用空间小的成员尽量集中在一起。
1.11结构体传参
struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
2.位段
2.1 什么是位段
位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。
struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:30;
};
2.2位段的内存分配
1. 位段的成员可以是int unsigned int signed int 或者是char (属于整形家族)类型。
2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
这里一上来就是创建的int型,所以一下创建了32个字节,然后挨个放入a,b,c,当放下d为30bit时就放不进去这个int类型了,所以再去新建一个int型,放入d,这个存储方式可能仅限于vs编译器所以打印出来应该是8个字节,也就是两个int型的大小
位段的问题
由于位段不跨平台,注重可移植性的程序应该避免使用位段,所以它的内存布局问题,一般取决于编译器例如,我们遇到d时,会存在放不下的问题,但是到底是新创建个int型去存储d,还是利用刚刚剩余的空间先存储一部分d再去创建int型创建d,这个我们不得而知还有个问题就是,到底是从右向左存储还是从左向右存储这些问题都取决于编译器我们来验证一下vs下位段的内存布局是否和我们设想的一样呢,结果发现完全吻合
2.3位段的跨平台问题
1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题)
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义(大小端问题)。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。
2.4位段的应用
ip数据包利用位段,减少了不必要的空间浪费