目录
结构体类型的声明
结构体变量的定义和初始化
结构体内存对齐
偏移量
结构体对齐规则:
为什么存在内存对齐?
结构体传参
位段
位段的内存分配
位段的跨平台问题
正常声明:
struct tag
{
member-list;
}variable-list;
struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
}; //分号不能丢
匿名结构体类型:
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20], *p;
注意:这两个结构体都是匿名的类型,默认类型不同。p=&x是非法的,编译器会把上面的两个声明当成完全不同的两个类型。
自引用声明:
struct Node
{
int data;
struct Node next;
};
这样子是非法的,因为这样将无限嵌套下去,sizeof(struct Node)无穷大了。若要实现可以在结构体成员改成struct Node* next。
局部变量三种方式:
struct Stu //类型声明
{
char name[15];//名字
int age; //年龄
};
struct Stu s ; // 1.直接定义变量
struct Stu s = {"zhangsan", 20}; // 2.定义并全部初始化
struct Stu s = {.age=20}; // 3.定义并部分初始化
全局变量二种:
struct Stu
{
char name[15];//名字
int age; //年龄
}s; // 1.声明时直接定义变量
struct Stu s ; // 2.main之前定义变量
注意typedef的使用:
typedef struct Stu //类型声明
{
char name[15];//名字
int age; //年龄
}S;
以上是其正常用法,定义别名。
但是对于结构体自引用来说:
typedef struct
{
int data;
Node* next;
}Node;
//这样写代码,错误
//解决方案:
typedef struct Node
{
int data;
struct Node* next;
}Node;
但是对于结构体同时定义全局变量来说:
typedef struct length{
int a;
}l,*pl; //这里不能同时重命名和定义全局变量了,l是别名,pl是strcut length*的别名
l len1={0};
pl plen=len1;
int main()
{
//……
}
计算结构体的大小时会发现,其大小不是简单的各个类型叠加, 这里就涉及到一个很重点的知识: 结构体内存对齐。
在看结构体对齐的规定之前可以先了解偏移量:
偏移地址偏移地址就是计算机里的内存分段后,在段内某一地址相对于段首地址(段地址)的偏移量。偏移量就是程序的 逻辑地址 与段首的差值。以数组为例,其实下标就代表各元素的偏移量。
offsetof
如果想查看结构体各个成员的偏移量可以使用offsetof。offset,C语言的一个宏,在标准库stddef.h中。定义:
size_t offsetof(type, member); // type class类型,是结构体的名字,member是结构体成员的名字。该宏返回结构体class中成员member的偏移量。且返回值是size_t类型的。
struct S1
{
char c1;
int i;
char c2;
};
printf("%d\n", sizeof(struct S1));
struct S2
{
char c1;
char c2;
int i;
};
printf("%d\n", sizeof(struct S2));
以S1为例子分析:
S1--->12,同理: S2--->8,可见成员顺序的改变将改变结构体内存大小。
//结构体嵌套
struct S3
{
double d;
char c;
int i;
};
struct S4
{
char c1;
struct S3 s3;
double d;
};
int main()
{
printf("%d\n", sizeof(struct S4));
printf("%d\n", sizeof(struct S3));
return 0;
}
1. 平台原因(移植原因): 不是所有的硬件平台都能访问为什么存在内存对齐?任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特 定类型的数据,否则抛出硬件异常。
2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访 问。
总体来说: 结构体的内存对齐是拿空间来换取时间的做法。 那在设计结构体的时候,我们既要满足对齐,又要节省空间,应该让占用空间小的成员尽量集中在一起。
修改默认对齐数:
#pragma 这个预处理指令,可以改变我们的默认对齐数。
#include
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。 如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的 下降。一般我们选择传入地址,且要修改值时只能传地址。
位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是 int、unsigned int char或signed int 。一般全部为char,或全为int。
2.位段的成员名后边有一个冒号和一个数字。冒号后面的数字代表该成员需要用的bit位的位数。
struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:30;
};
位段的大小并不是每个成员的大小之和,这里就要涉及到位段如何分配空间。
1. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
2. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
涉及很多不确定因素:比如a的2bit从字节的低地址开始使用还是从高地址?对d看来说,余下15不够,15bits还要使用吗?
除了上面的因素不确定,还有:
1. int 位段被当成有符号数还是无符号数是不确定的。 2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机 器会出问题。
总结: 跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。