目录
结构体
1. 结构体的声明
1.1 结构的基础知识
1.2 结构的声明
1.3 特殊的声明
1.4 结构的自引用
1.5 结构体变量的定义和初始化
1.6 结构体内存对齐
1.7 修改默认对齐数
1.8 结构体传参
2. 位段
2.1 什么是位段
2.2 位段的内存分配
2.3 位段的跨平台问题
3. 枚举
3.1 枚举类型的定义
3.2 枚举的优点
4. 联合(共用体)
4.1 联合类型的定义
4.2 联合的特点
4.3 联合大小的计算
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
struct tag
{
member-list;//成员列表
}variable-list; //变量列表
如:描述一个学生类型
//学生类型
struct Stu
{
char name[20];
short age;
char sex[5];
}s1, s2; //s1,s2为全局变量,但并不建议这样定义
int main()
{
//s为局部变量
struct Stu s = {"张三", 20, "男"}; //
return 0;
}
在声明结构的时候,可以不完全的声明(可以用这种方式创建变量,但只能用一次,后续无法再用该方式创建变量)
//匿名结构体类型
//创建了一个结构体类型s1
struct
{
char name[20];
short age;
char sex[5];
}s1;
//创建了一个结构体指针ps
struct
{
char name[20];
short age;
char sex[5];
}* ps;
//上面的两个结构在声明的时候省略掉了结构体标签
//虽然上述两种结构体成员一模一样,但编译器会认为这是两种不同的结构体类型
int main()
{
//局部变量
//struct s = { "张三", 20, "男" }; //无法这样定义,因为没有结构体标签
ps = &s1;//编译器会报警告
return 0;
}
在结构中包含一个类型为该结构本身的成员是否可以呢?
//代码1
struct Node
{
int data;
struct Node next;
};
//可行否? 不可行!这样无限嵌套,无法计算创建变量后所占空间大小
正确的自引用方式:
//代码2
//定义链表的结点
struct Node
{
int data;//数值域
struct Node* next; //指针域
};
//代码3
//错误的定义方式:
typedef struct Node
{
int data;
Node* next; //错误原因:运行到此处时,还并没有把typedef struct Node 重命名为Node
}Node;
//正确的定义方式
typedef struct Node
{
int data;
struct Node* next;
}Node;
int main()
{
struct Node n1;
Node n2; //等价于上行代码
return 0;
}
匿名结构体类型无法自引用
//声明一个结构体类型Point
struct Point
{
int x;
int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
//定义一个结构体变量p3, 并初始化
struct Point p3 = { 3, 5 };
//结构体嵌套
struct Node
{
struct Point p;
struct Node* next;
};
int main()
{
struct Node n = { {5, 9},NULL };
printf("x = %d y = %d\n", n.p.x, n.p.y); //x = 5 y = 9
return 0;
}
解决的问题:结构体大小的计算
struct S
{
char c; //占1字节
int i; //占4字节
};
int main()
{
struct S s = { 0 };
printf("%d\n", sizeof(s)); //8
return 0;
}
结构体内部:char c 占1个字节, int i 占3个字节
为什么sizeof(s)的结果等于8?
struct S
{
char c; //占1字节
int i; //占4字节
};
int main()
{
printf("%d\n", offsetof(struct S, c)); //0
printf("%d\n", offsetof(struct S, i)); //4
//offsetof为计算偏移量的函数,参数为结构体名和参数名
//需要头文件
return 0;
}
由上述代码得出的偏移量,可知该结构体在内存中:
故该结构体共占了8个字节的空间
结构体的对齐规则:
① 第一个成员在与结构体变量偏移量为0的地址处。
② 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。 对齐数 = 编译器默认的对齐数 (VS中默认的值为8) 与 该成员自身大小的 较小值。
③ 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
④ 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
例如:
struct S
{
char c1;
int i;
char c2;
};
int main()
{
printf("%d\n", sizeof(struct S)); //12
return 0;
}
c1为第一个成员,存储在偏移量为0的地址处,对齐数为1。
i 的自身大小为4,VS默认对齐数为8 --> 较小值、对齐数为4,即 i 需要存储到偏移数为 4的整数倍的地址处
同理,c2应该存储到偏移数为 1的整数倍的地址处,对齐数为1。
此时按道理来说,结构体总大小应该为9,但由于结构体总大小为最大对齐数的整数倍,所以总大小应该为4的倍数,即12
练习:
//练习1
struct S1
{
char c1;
int i;
char c2;
};
//练习2
struct S2
{
char c1;
char c2;
int i;
};
//练习3
struct S3
{
double d;
char c;
int i;
};
//练习4 - 结构体嵌套问题
//嵌套的结构体对齐到自己的最大对齐数的整数倍处 此时对齐到8的整数倍处即可
struct S4
{
char c1; //从0开始 1-7浪费了
struct S3 s3; //从8开始 占用了8 - 23
double d; //从24开始 占用了24 - 31
//即从0到31,共占了32个字节
//结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
//即为8的整数倍 --> 32
};
int main()
{
printf("%d\n", sizeof(struct S1)); // 12
printf("%d\n", sizeof(struct S2)); // 8
printf("%d\n", sizeof(struct S3)); // 16
printf("%d\n", sizeof(struct S4)); // 32
return 0;
}
为什么存在内存对齐?
1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
总体来说:结构体的内存对齐是拿空间来换取时间的做法。
那么,在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到呢?
让占用空间小的成员尽量集中在一起。
如上述练习题的 1 和 2,结构体类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别。让占用空间小的集中在一起,可以尽可能少的浪费空间。
我们可以使用 #pragma 改变我们的默认对齐数
//默认对齐数为8的时候
struct S1
{
char c1;//0
//1 - 7 被浪费
double d;//8 - 15
char c2;//16
//17 - 23 被浪费
};
#pragma pack(4)//设置默认对齐数为4,且对齐数一般设置为2^n这样的数字
struct S2
{
char c1;//0
//1 - 3被浪费
double d;//4 - 11
char c2;//12
//13 - 15被浪费
//结构体总大小为16个字节
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
printf("%d\n", sizeof(struct S1)); //24
printf("%d\n", sizeof(struct S2)); //16
return 0;
}
//结构体传参
void print1(struct S ss)
{
printf("%s %d\n", ss.arr, ss.i);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%s %d\n", ps -> arr, ps -> i);
}
int main()
{
struct S s = { "hello bit", 100 };
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
上述代码中的 print1 和 print2 函数哪个好些?
首选 print2,原因如下:
函数传参的时候,参数是需要压栈的,会有时间和空间上的系统开销。如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
结论: 结构体传参的时候,要传结构体的地址。
位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是 int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。
如:
struct A
{
//变量的命名只能是由字母数字下划线组成,且数字不能在最前面
//冒号后的数字表示该变量占几个二进制位即几个bit
int _a : 2;
//由于是int类型,开辟了4个字节即32个bit位的空间,同时分配给_a两个bit位的空间
int _b : 5;
//剩下的30个bit中拿出5个分配给_b。还剩25个
int _c : 10;
//同理,还剩下15个
int _d : 30;
//此时需要30bit,不够分配了,所以再开辟一个int型的空间用于分配
//至于是先把15个用完,再用新开辟的空间;还是直接用新开辟的空间存储,取决于编译器
}
A就是一个位段类型。那么位段A的大小是多少呢?
printf("%d\n", sizeof(struct A)); //8
1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
一个例子:下面代码在内存中是如何开辟空间的?
struct S
{
char a : 3;
//还剩5bit
char b : 4;
//还剩1bit
char c : 5;
//情况1.如果不用剩下的1bit,直接新开辟一个字节,还剩3个bit(vs采用的方案)
//情况2.先用剩下的1bit,再开辟空间,分配后还剩4个bit
char d : 4;
//情况1.重新开辟一个字节分配给d
//情况2.用剩下的空间刚好分配完成
};
1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结:跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。
枚举顾名思义就是一一列举。把可能的取值一一列举。 比如我们现实生活中:
一周的星期一到星期日是有限的7天,可以一一列举。
性别有:男、女、保密,也可以一一列举。
月份有12个月,也可以一一列举
//{}内部的是枚举类型所有可能的取值,也叫枚举常量
enum Day//星期
{
//以下均为枚举常量
Mon,
Tues,
Wed,
Thur,
Fri,
Sat,
Sun
};
enum Sex//性别
{
MALE,
FEMALE,
SECRET
};
enum Color//颜色(三原色)
{
RED, //此时可以赋初值 RED = 9,则GREEN自动变成10(需要赋别的初值也是可以的),BLUE = 11
GREEN,
BLUE
};
int main()
{
enum Color c = RED; //c的取值只能是RED,GREEN,BLUE 其中之一
printf("%d\n", RED); //0
printf("%d\n", GREEN); //1
printf("%d\n", BLUE); //2
//RED = 20; err,枚举常量不能被修改
return 0;
}
以上定义的 enum Day , enum Sex , enum Color 都是枚举类型。 {}中的内容是枚举类型的可能取值,也叫枚举常量。 这些可能取值都是有值的,默认从0开始,一次递增1,当然在定义的时候也可以赋初值。
我们可以使用 #define 定义常量,为什么非要使用枚举?
枚举的优点:
① 增加代码的可读性和可维护性
② 和#define定义的标识符比较枚举有类型检查,更加严谨。
③ 防止了命名污染(封装)
④ 便于调试
⑤ 使用方便,一次可以定义多个常量
联合也是一种特殊的自定义类型,这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以联合也叫共用体)。
//共用体:成员共用一块空间
union Un
{
char c;
int i;
};
int main()
{
//联合体的定义和初始化
union Un u = { 0 };
printf("%d\n", sizeof(u)); //4
printf("%p\n", &u); //00EFFEC8
printf("%p\n", &u.c); //00EFFEC8
printf("%p\n", &u.i); //00EFFEC8
return 0;
}
联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。
① 联合的大小至少是最大成员的大小。
② 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
union Un1
{
char c[5]; //虽然数组大小是5,但应该看每一个数组元素的对齐数
int i;
//最大对齐数为4
};
union Un2
{
short c[7];
int i;
//最大对齐数为4
};
int main()
{
//下面输出的结果是什么?
printf("%d\n", sizeof(union Un1)); //8
printf("%d\n", sizeof(union Un2)); //16
return 0;
}
面试题:写一个代码判断当前机器是大端还是小端
// a = 0x11223344;
//低 高
//小端: 44 33 22 11
//大端: 11 22 33 44
//方法一:
int check_sys1()
{
int a = 1; //01 00 00 00
int b = *(char*)&a;
return b;
}
//方法二:
int check_sys2()
{
union Un
{
int i;
char c;
}u;
u.i = 1;
return u.c;
//u.c为i的第一个字节
//返回0,表示大端
//返回0,表示小端
}
int main()
{
int ret = check_sys2();
if (ret == 1)
{
printf("小端\n");
}
else
{
printf("大端\n");
}
return 0;
}