结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
struct tag
{
member-list;
}variable-list;
举例:如和描述一名学生
struct Student
{
char name[20];
int age;
char sex[5];
char id[20];
};//这里的分号不能丢弃
如何在结构体创建后直接创建结构体变量
struct Student
{
char name[20];
int age;
char sex[5];
char id[20];
}s1,s2,s3;//可以创建完结构体,直接在后面写变量名,创建结构体变量
如何在创建结构体全局变量和结构体局部变量
struct student
{
char name[20];
int age;
char sex[5];
char id[20];
};
struct student S1;//全局变量
int main()
{
struct student S2;//局部变量
}
在声明结构的时候,可以不完全的声明。
匿名结构体的创建和使用
在创建匿名结构体时,我们不会写结构体类型的类型名,因为在创建局部和全局结构体变量时需要结构体类型名,所以我们只能在结构体创建完后直接创建匿名结构体变量,这也是创建匿名结构体变量的唯一方法
匿名结构体类型指针的问题
这里虽然两个匿名结构体成员是一模一样的,但是在编译器看来还是两个不同的类型的结构体,所以是非法的。
这个结构体是否有问题呢?
答案是肯定有问题,因为结构体套结构体,首先int data是4个字节,那下面那个结构体是多大呢,这又取决于这个结构体多大,这里成了一个套娃问题了,无法知道结构体到底多大,所以这里不是结构体嵌套,而是有问题的结构体创建
这样一个存有自己类型指针的结构体是可以创建的,是因为指针就4/8个字节,结构体指针怎么创建内存大小,并且知道这个指针指向的是本结构体,就足够了,一般用于数据结构中链表
结构体类型重命名
我们使用typedef可以重命名类型的名字,这样我们在结构体前面写上typedef,在结构体后写入重命名的名称,就可以即使用原本的类型名创建变量,又可以使用重命名后的类型名创建变量
你甚至能给匿名结构体附上一个名字
但是你要注意下面创建会有问题,我们在结构体的最后面才给,匿名结构体赋上的名字,但在结构以中就使用赋上的名字,这样就成先有鸡还是先有蛋的问题了
初始化有下面这两种
1.在创建完结构体后,直接创建变量然后初始化
2.在其他地方使用结构体类型创建变量后,进行初始化
struct Student
{
char name[20];
int age;
char number[20];
}s1 = { "张三",20,"2000002" };//初始化:定义变量的同时赋初值。
int main()
{
struct Student s2 = { "李四",30,"10000001" };//初始化:定义变量的同时赋初值。
}
我们来探讨一下结构体的大小到底是多少
对于这个结构体来说是两个char类型成员变量和一个int类型成员变量组成的,我们一般认为这个结构体肯定是1+1+4个字节
但真是这么简单吗?
当我们打印出结构体占用的内存字节数时,你会发现并非如此,这个结构体竟然占用了12个字节,这是怎么计算的呢?
结构体内存对齐规律:
1. 第一个成员在与结构体变量偏移量为0的地址处。
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
VS中默认的值为8
Linux没有默认对齐数(此时成员变量自身大小就是默认对齐数)
3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
也就是说结构体的内存占用规则是有要求的,我们根据上述要求,再来看一下刚刚的结构体
计算结构体大小过程:
根据1. 第一个成员在与结构体变量偏移量为0的地址处得知我们要在结构体首地址处就开始放入第一个成员,第一个成员为char类型,占一个字节
第二个成员是int型,根据2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处得知,第二个成员要计算机对齐数然后再对齐,vs中的结构体默认对齐数为8,而int型的大小是4,取两者中较小的值作为本成员的对齐数,结果为4,所以int型的i应该从偏移量为4的位置开始向下存入4个字节
第三个成员变量是char型,和默认对齐数相比,1应该为较小值,所以第三个成员变量的对齐数应该是1,这样直接向后存放1个字节就可以
我们算完成员变量的在内存中布局后,还要根据3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍再去修整结构体最后的内存大小,因为总大小为每个成员变量中对齐数的最大值,我们知道c1的对齐数是1,i的对齐数是4,c2的对齐数是1,得出结构体的对齐数是4,但现在我们虽然偏移到了8,但实际占了9个字节,因为9不是4的倍数,所以下一个4的倍数为12,就得出了结构体的总大小为12个字节
我们再来看一下下面这个结构体,根据对齐规则,求出该结构体的大小是8字节
这个结构体,这个结构体也是由两个char类型,一个int型组成,根据上面的对齐规则,你会发现它所需要的内存大小竟然和成员变量一直但顺序不一致的结构体小不少
此时的结构体嵌套结构体布局就会发生一些新变化
我们首先来看结构体存放在结构体的内存布局问题,4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍
首先你要知道嵌套的结构体中的最大对齐数,他的最大对齐数应该是8个字节,因为该结构体包括了一个double一个char一个int在这个结构体中最大对齐数是由float提供的为8,结构体8字节再和结构体默认对齐数对比,最后为8,所以s3这个结构体应该在偏移量为8的位置存下自己
最后来看结构体整体大小,结构体的整体大小是所有最大对齐数的整数倍,也就是所有成员变量,包括结构体s3中成员变量中最大的对齐数的整数倍,这里还是由float提供的8字节最大,所以最后为32
size_t offsetof( structName, memberName );
功能:输入结构体和结构体的成员,返回成功在该结构体中的偏移量
头文件:
#pragma这个预处理指令,可以修改默认对齐数
当我们将默认对齐数修改成1的时候,因为对齐数1,结构体内存就可以直接按照成员类型排放
结构在对齐方式不合适的时候,我们就可以自己更改默认对齐数。
1. 平台原因(移植原因,结构体允许跨平台移植):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2. 性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访
问。
举例说明一下 2.性能原因
当我们想去读取int类型的i时你会发现,如果不考虑对齐数,想拿到i你需要读取两次才能成功拿到,而有了对齐数,可以一次就拿到int类型的i
虽然浪费了空间,但是可以提升计算机的速度和效率
总体来说:结构体的内存对齐是拿空间来换取时间的做法。
这个两个结构体,都是由两个char类型,一个int型组成,根据上面的对齐规则,右边的结构体比左边的结构体占内存空间小很多
结论:
那在设计结构体的时候,我们既要满足对齐,又要节省空间,应该:让占用空间小的成员尽量集中在一起。
struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。
struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:30;
};
1. 位段的成员可以是int unsigned int signed int 或者是char (属于整形家族)类型
2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
这里一上来就是创建的int型,所以一下创建了32个字节,然后挨个放入a,b,c,当放下d为30bit时就放不进去这个int类型了,所以再去新建一个int型,放入d,这个存储方式可能仅限于vs编译器
位段的问题
由于位段不跨平台,注重可移植性的程序应该避免使用位段,所以它的内存布局问题,一般取决于编译器
例如,我们遇到d时,会存在放不下的问题,但是到底是新创建个int型去存储d,还是利用刚刚剩余的空间先存储一部分d再去创建int型创建d,这个我们不得而知
还有个问题就是,到底是从右向左存储还是从左向右存储
这些问题都取决于编译器
我们来验证一下vs下位段的内存布局是否和我们设想的一样呢,结果发现完全吻合
1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题)
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。