目录
前言
结构体struct
结构体的声明
结构的自引用
结构体变量的定义和初始化
空结构体大小
结构体内存对齐
修改默认对齐数
宏offsetof
结构体传参
柔性数组
struct与class的区别
位段
什么是位段
位段的内存分配
位段的跨平台问题
枚举enum
枚举类型的定义
枚举的优点
enum 与 #define 的区别
联合union
联合类型的定义
联合的特点
union和大小端
联合大小的计算
本章主要讲解重点:
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量
struct tag
{
member-list;
}variable-list;
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20], *p;
对于匿名结构在声明的时候省略掉了结构体标签(tag),也就是只能在声明的时候进行操作(声明外再次使用无法进行调用(没有名称))
//在上面代码的基础上,下面的代码为err
p = &x;
//编译器会把上面的两个声明当成完全不同的两个类型
在链表中我们需要用到的就是结构的自引用
//创建链表节点
struct Node
{
int data;
struct Node* next;
};
typedef struct
{
int data;
Node* next;
}Node;
//只有在重命名后才能使用重命名名
//正确写法:
typedef struct Node
{
int data;
struct Node* next;
}Node;
struct Point
{
int x;
int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
//初始化:定义变量的同时赋初值。
struct Point p3 = {x, y};
struct Stu //类型声明
{
char name[15];//名字
int age; //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
struct Node
{
int data;
struct Point p;
struct Node* next;
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化
struct student
{
}stu;
int main (void)
{
printf ("sizeof (stu) = %d\n", sizeof (stu));
return 0;
}
输出结果:
在C中, sizeof (stu) = 0
在C++中, sizeof (stu) = 1
对于空结构体不同编译器理解不同,所以大小不一(可能0或者1(作为占位符))
struct中的各成员变量的存储地址有一套对齐的机制(让CPU能够更舒服地访问变量)
结构体的内存对齐是拿空间来换取时间的做法
- 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特 定类型的数据,否则抛出硬件异常
- 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问
- 第一个成员在与结构体变量偏移量为0的地址处
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。 对齐数为编译器默认的一个对齐数与该成员大小的较小值。(VS中默认的值为8)
- 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍,如果不满足,在最后一个成员后面填充
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍
struct S1
{
char c1;
int i;
char c2;
};
printf("%d\n", sizeof(struct S1));
//输出结果:12
- 第一个成员c1在与结构体变量偏移量为0的地址处
- 对于c2它的对齐数为4(int大小为4,小于平台默认值8),该变量要对齐到偏移量为4的倍数处,即从偏移量为4的位置开始存放
- 对于c3(char类型的对齐数为1,正数都为1的倍数),从偏移量为9的位置开始放
- 该结构体的总大小须为最大对齐数(每个成员变量都有一个对齐数)(这里也就是4)的整数倍,故为12(已经占用了9个字节)
struct S2
{
char c1;
char c2;
int i;
};
printf("%d\n", sizeof(struct S2));
//输出结果:8
- 第一个成员c1在与结构体变量偏移量为0的地址处
- c2放在偏移量为1的地址处
- i放在偏移量为4的地址处(对齐到偏移量为对齐数4的倍数处)
struct S3
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S3));
//输出结果:16
- 第一个成员d在与结构体变量偏移量为0的地址处
- c放在偏移量为8的地址处
- i放在偏移量为12的地址处(对齐到偏移量为对齐数4的倍数处)
struct S4
{
char c1;
struct S3 s3;
double d;
};
printf("%d\n", sizeof(struct S4));
//输出结果:48
- 第一个成员c1在与结构体变量偏移量为0的地址处
- s3放在偏移量为8的地址处(s3最大对齐数为8)
- d放在偏移量为24的地址处(对齐到偏移量为对齐数8的倍数处)
- 总大小为成员变量最大对齐数的倍数(也就是16的倍数)即大小为32
尽量让占用空间小的成员尽量集中在一起(既满足对齐,又节省空间)(如示例1与示例2)
使用#pragma 这个预处理指令来改变我们的默认对齐数
#include
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
//输出的结果是什么?
printf("%d\t", sizeof(struct S1));
printf("%d\t", sizeof(struct S2));
return 0;
}
//输出结果:12 6
结构在对齐方式不合适的时候,我么可以自己更改默认对齐数
计算结构体中某变量相对于首地址的偏移,并给出说明
#include
#include
struct s
{
char c;
int i;
double d;
};
int main()
{
// offsetof其实是一个宏,用来表示成员相对于结构体的偏移量
//而且offsetof的参数传的是一个类型,更加说了offsetof是一个宏
printf("%d\n", offsetof(struct s, c));// 0
printf("%d\n", offsetof(struct s, i));// 4
printf("%d\n", offsetof(struct s, d));// 8
return 0;
}
struct S
{
int data[1000];
int num;
};
struct S s = {
{1,2,3,4}, 1000};
//结构体传参
//创建临时结构体来接收(消耗空间)
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
//指针接收
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
其实效果都一样,两者都可以选择,但是推荐结构体传址
- 函数传参的时候,参数是需要压栈的,压栈会占用空间
- 如果传递一个结构体对象的时候,结构体过大的话,那么参数压栈的的系统开销比较大,会导致性能下降
C99 中,结构中的最后一个元素允许是未知大小的数组,这就叫做柔性数组成员,但结构中的柔性数组成员前面必须至少一个其他成员
- sizeof 返回的这种结构大小不包括柔性数组的内存
- 用malloc()函数进行内存动态分配,分配的内存应该大于结构的大小,以适应柔性数组的预期大小
- 用malloc函数分配了内存,肯定就需要用free函数来释放内存
#include
#include
#include
typedef struct data
{
int len; //一般用来表示字符数组的字符个数
char name[];//空间大小为0
}S;
int main(void)
{
S s;
printf("sizeof(s)=%d\n",sizeof(s));//输出为4,即是int类型大小
int len = 10; //申请空间
struct data *p =(struct data*)malloc(sizeof(s)+sizeof(char)*len);
//判断是否申请成功&请空处理
p->len = len;
strcpy(p->name,"xxxxxx"); //字符串赋值需要用strcpy
printf("%s\n",p->name);
//释放指针p
free(p);
return 0;
}
//输出结果:xxxxxx
在C++里struct关键字与class关键字一般可以通用
struct的成员默认情况下属性是public的,而class成员却是private的
位段的声明和结构是类似的
- 位段的成员必须是 int、unsigned int 或signed int
- 位段的成员名后边有一个冒号和一个数字
struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:30;
};
- 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
- 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段
struct S
{
char a:3;
char b:4;
char c:5;
char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
注:在vs平台下,其他平台不确定(可以自己进行测试)
- 首先对于char类型会开辟一个字节空间(8bite)
- 在这一个空间里先从高地址开始使用(从右边开始)
- 当存入的数据大于相应的空间(冒号后的数字表示属于该变量的空间大小,单位为bite)可以表示的数据大小时,会发生截断(从右边开始)
- 对于一个字节里还剩的空间,如果后面的位段空间能够放入时,将存入这一个字节里还剩的空间里
- 不够时将另开辟一个对应类型的空间来存放
- int 位段被当成有符号数还是无符号数是不确定的
- 位段中最大位的数目不能确定(例如:16位机器最大16,32位机器最大32,写成27,在16位机器会出问题
- 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义
- 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在
枚举型是一个集合(可以一一列举的类似元素),其元素(枚举成员)是一些命名的整型常量(元素之间用逗号隔开)
enum Day//星期
{
Mon,
Tues,
Wed,
Thur,
Fri,
Sat,
Sun
};
enum Sex//性别
{
MALE,
FEMALE,
SECRET
};
enum Color//颜色
{
RED,
GREEN,
BLUE
};
- 以上定义的 enum Day , enum Sex , enum Color 都是枚举类型
- {}中的内容是枚举类型的可能取值,也叫枚举常量
- 第一个枚举成员的默认值为整型的0,后续枚举成员的值在前一个成员上加1(可以人为设定枚举成员的值,从而自定义某个范围内的整数)
enum Color//颜色
{
RED=1,
GREEN=2,
BLUE=4
};
我们可以使用 #define 定义常量,为什么非要使用枚举?
预处理指令#define:
#define MON 1
#define TUE 2
#define WED 3
#define THU 4
#define FRI 5
#define SAT 6
#define SUN 7
枚举类型能完成同样的工作(更加简洁便捷):
enum DAY
{
MON=1, TUE, WED, THU, FRI, SAT, SUN
};
- 增加代码的可读性和可维护性
- 和#define定义的标识符比较枚举有类型检查,更加严谨
- 防止了命名污染(封装)
- 便于调试
- 使用方便,一次可以定义多个常量
#define是在预处理阶段直接进行替换,并且不进行类型检查,
枚举则是在程序运行之后才起作用
#define定义的类型存储在代码段
枚举常量存储在数据段的静态存储区里
#define可以赋值多种类型数据
枚举变量的大小只能为整型数据(例如:0、1、2…)(enum当我们不主动对它进行赋值时,第一个枚举成员的默认值为整型的0,后续枚举成员的值在前一个成员上加1,#define则不会)
#define宏一次只能定义一个
枚举可以一次定义大量相关的常量
一般在编译器里,可以调试枚举常量,但是不能调试宏常量
枚举量具有类型,宏没有类型;枚举常量属于常量,宏定义不是常量
联合也称为共用体,很明显意思是多个变量共用一个空间,所以不能同一时间使用多个变量
//联合类型的声明
union Un
{
char c;
int i;
};
//联合变量的定义
union Un un;
因为联合的成员是共用同一块内存空间的,所以联合变量至少是最大成员的大小(联合至少得有能力保存最大的那个成员)
//在上述代码的基础上 计算联合变量的大小
printf("%d\n", sizeof(un));
//输出结果:4
任何成员变量都是从低地址开始使用
union Un
{
int i;
char c;
};
union Un un;
// 下面输出的结果是一样的吗?
printf("%p\n", &(un.i));
printf("%p\n", &(un.c));
//相同 都是从联合变量的低地址开始使用
//下面输出的结果是什么?
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", un.i);
//0x11223355
判断当前计算机的大小端存储
#include
union var{
char c[4];
int i;
};
int main(){
union var data;
data.c[0] = 0x04;//因为是char类型,值对应ascii
data.c[1] = 0x03;//16进制便于直接与内存中的值对比
data.c[2] = 0x02;
data.c[3] = 0x01;
//数组先使用低地址再使用高地址,内存内容依次为:04,03,02,11(共四字节)
//而把四个字节作为一个整体,对于小端来说:低地址放在低权位
//读取出来则是:0x01020304
//反之则是大端存储模式
printf("%x\n",data.i);//共用空间
}
- 联合的大小至少是最大成员的大小
- 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍
union Un1
{
char c[5];
int i;
};
union Un2
{
short c[7];
int i;
};
//下面输出的结果是什么?
printf("%d\n", sizeof(union Un1));
//输出结果:8
printf("%d\n", sizeof(union Un2));
//输出结果:16