目录
结构体
1、结构体类型的声明
2、结构的自引用
3、结构体变量的定义和初始化
4、结构体内存对齐
结构体内存对齐的规则:
为什么存在内存对齐?
修改默认对齐数
5、结构体传参
6、结构体实现位段(位段的填充&可移植性)
位段的内存分配
位段的跨平台问题
枚举
1、枚举类型的定义
2、枚举的优点
3、枚举的使用
联合
1、联合类型的定义
2、联合的特点
3、联合大小的计算
结构是一些值的集合,这些值称为成员变量,结构的每个成员可以是不同类型的变量。
例如描述一个学生,我们可以将他的各种信息放到结构体类型中。
struct Stu
{
char name[20];//名字
int age; //年龄
char sex[2]; //性别
char id[20]; //学号
}; //一定要有分号!!!
声明结构体的时候,可以进行不完全声明:
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}*p;
这时如果加上这段代码合法吗?
int main()
{
p=&x;
}
结果如下:
虽然成员一样,但编译器会把上面两个声明当成完全不同的两个类型。
如果创建一个结构体只需要用一次可以用匿名结构体(如上述结构体变量x),但一般很少用匿名结构体。
先介绍一下数据结构:描述的是数据在内存中的组织结构线性数据结构。
链表中每一个存放数据的结构都叫做一个节点,从一个节点找到下一个节点,有人就想到了把节点定义成一个结构体。
struct N
{
int data;
struct Node next;
}
这样种方式对吗吗?
当然这种方式不行,第一个数据中next包含着第二个数据的data和next,第一个数据的next会嵌套包含后续所有数据。 无法计算结构体类型的大小。
其实每次存下一个数据的地址就可以解决,结构体想包含同类型结构体需要使用结构体指针形式,指向同类型数据.
struct Node
{
int data;
struct Node* next;
};
我们接着往下看,
我们也可以用typedef重命名匿名结构体类型 ,下面代码中好像因为我们重命名了匿名结构体类型为Node,所以在结构体内部又包含结构体指针类型。
typedef struct
{
int data;
Node* next;
}Node;
int main()
{
Node n;
return 0;
}
但这种方式忽略了先后顺序问题,我们要对这个匿名结构体类型重命名产生Node,产生条件是结构体必须是合格完整的类型,而重命名之前在匿名结构体类型中就出现Node*了,此时我们还未产生Node,未产生Node就提前使用Node这是绝对不允许的。
我们可以不用匿名结构体,这样先定义struct Node类型再使用Node*这样就可以了。 代码如下:
struct Node
{
int data;
Node* next;
};
int main()
{
Node n;
return 0;
}
结构体的定义有以下两种形式
struct SN
{
char c;
int i;
}sn1,sn2;
int main()
{
struct SN s1,s2;
}
初始化使用大括号加对应数据的形式,也可以在大括号内使用类似 .i .c这种点加上结构体成员的方式初始化。初始化的位置可以在结构体处也可以在主函数处。
struct SN
{
char c;
int i;
}sn1 = { 'q', 100 }, sn2 = {.i=200, .c='w'};
int main()
{
struct SN s1 = { 'q', 100 } , s2 = {.i=200, .c='w'};
}
我们还可以在结构体内包含数组和结构体 ,为结构体内部赋值需要用大括号。
在输出的时候结构体变量采用变量名加 .结构体成员的方式,结构体里包含结构体也一样。如果是结构体指针,则需->加上结构体成员。
struct SN
{
char c;
int i;
}sn1,sn2;
struct S
{
double d;
struct SN sn;
int arr[10];
};
int main()
{
struct S s = { 3.14, {'a', 99}, {1,2,3} };
printf("%lf %c %d\n", s.d, s.sn.c, s.sn.i);
int i = 0;
for (i = 0; i < 10; i++)
printf("%d ", s.arr[i]);
return 0;
}
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
int i;
char c1;
char c2;
};
int main()
{
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
return 0;
}
输出结果: 这与我们想象的char类型占一个字节,int类型占四个字节,所以两个char类型和一个int类型的结构体S1的大小是六个字节显然不符,那这是为什么呢?
这时就引出了结构体对齐。
我们用宏offsetof( )可以计算结构体成员相较于结构体起始位置的偏移量,需要包含头文件
printf("%d\n", offsetof(struct S1, c1));
printf("%d\n", offsetof(struct S1, i));
printf("%d\n", offsetof(struct S1, c2));
由此我们画图来看一下,按照offsetof()计算出的偏移量,好像结构体S1只占了九个个字节,但事实上在前面我们已经得知结构体S1的大小为十二个字节,这又是为什么呢?
通过上面的现象分析, 我们发现结构体成员不是按照顺序在内存中连续存放的,而是有一定的对齐规则。
结构体内存对齐的规则:
- 结构体的第一个成员永远放在相较于结构体变量起始位置偏移量为0的位置。
- 从第二个成员开始,往后的每个成员都要对齐到某个对齐数的整数倍处。
- 对齐数:结构体成员自身的大小和默认对齐数的较小值
- VS上默认对齐数是8,gcc 没有默认对齐数,对齐数就是结构体成员的自身大小。
- 结构体的总大小,必须是最大对齐数的整数倍。
- 最大对齐数是所有成员的对齐数中最大的值。
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
这时我们就明白了:
- char c1为第一个成员假设就放在偏移量0处, 第二个成员int i 的大小为4个字节,与VS的默认对齐数8相比,则 i 的对齐数为较小的4。所以 i 要偏移对齐数4的整数倍处,即为4处,储存4个字节,占用偏移量4到7。
- c2的对齐数为1,所以偏移1到8处即可。
- 最大对齐数是4,结构体的总大小是最大对齐数的整数倍,也就是4的整数倍,而目前结构体的大小为9,所以向后再占用3个空间凑成12,符合4的整数倍,这样结构体S1的大小最终为12个字节。
现在解释S2:
例一:
struct S3
{
double d;
char c;
int i;
};
double类型占用八个字节,d占用0偏移处到7偏移处。char c对齐数为1,占用8偏移处。int i对齐数为4,偏移到4的整数倍12偏移处,占用12到15偏移处。整个结构体大小位16个字节正好是最大对齐数double的对齐数 8 的整数倍,结构体S3的大小为16个字节。
例二:
struct S4
{
char c1;
struct S3 s3;
double d;
};
1. 平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。2. 性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。总体来说:结构体的内存对齐是拿空间来换取时间的做法。那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:让占用空间小的成员尽量集中在一起
#pragma pack(1)
struct S
{
char c1;//1 1 1
int a; // 4 1 1
char c2;//1 1 1
};
#pragma pack()
int main()
{
printf("%d\n", sizeof(struct S));
return 0;
}
输出结果: ,通过#pragma pack(1)修改默认对齐数,使每个成员的对齐数都为1,这时他们都不存在对齐,依次排列在内存中。大小为六个字节。
结构体使用完对齐数1之后,通过#pragma pack()取消设置的默认对齐数,还原为默认。
结构在对齐方式不合适的时候,我么可以自己更改默认对齐数。
struct S
{
int data[100];
int num;
};
void print1(struct S tmp)
{
printf("%d\n",tmp.num);
}
void print2(struct S* ps)
{
printf("%d\n",ps->num);
}
int main()
{
struct S s = { {1,2,3}, 100 };
print1(s);
print2(&s);
return 0;
}
传参首选print2函数 :
- 函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
- 如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
1.位段的成员必须是 int、unsigned int 或signed int 。2.位段的成员名后边有一个冒号和一个数字,这个数字是说明存放的二进制位的大小。
struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:30;
};
1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型2. 位段的空间上是按照需要以 4 个字节( int )或者 1 个字节( char )的方式来开辟的。3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
我们来看看这个例题:
int main()
{
unsigned char puc[4];
struct tagPIM
{
unsigned char ucPim1;
unsigned char ucData0 : 1;
unsigned char ucData1 : 2;
unsigned char ucData2 : 3;
}*pstPimData;
pstPimData = (struct tagPIM*)puc;
memset(puc,0,4);
pstPimData->ucPim1 = 2;
pstPimData->ucData0 = 3;
pstPimData->ucData1 = 4;
pstPimData->ucData2 = 5;
printf("%02x %02x %02x %02x\n",puc[0], puc[1], puc[2], puc[3]);
return 0;
}
首先定义名为 puc
的包含4个无符号字符的数组
定义了一个名为
tagPIM
的结构体,其中包括:
- 一个无符号字符
ucPim1
。- 三个位字段
ucData0
、ucData1
和ucData2
,它们的大小分别是1位、2位和3位。
然后创建了一个名为 pstPimData
的 struct tagPIM
类型的指针。
将 puc
的地址赋给了 pstPimData
。这意味着 pstPimData
现在指向 puc
的内存位置。
使用 memset
函数将 puc
的所有字节设置为0。
设置了由
pstPimData
指向的结构体的成员的值:
ucPim1
被设置为2。ucData0
被设置为3。但由于它是一个1位字段,它只能容纳0或1的值。因此,将其设置为3相当于将其设置为1(二进制:11,但只考虑最低有效位)。ucData1
被设置为4。它是一个2位字段。4的二进制表示是100,但只考虑两个最低有效位,所以它被设置为0。ucData2
被设置为5。它是一个3位字段。5的二进制表示是101,这适合3位,所以它被设置为5。
现在,让我们看看 tagPIM
的内存布局是怎样的:
ucPim1 | ucData2 | ucData1 | ucData0
8位 | 3位 | 2位 | 1位 00000010 | 101 | 00 | 1
位段的跨平台问题
1. int 位段被当成有符号数还是无符号数是不确定的。2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结:跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题在。
枚举顾名思义就是一一列举。把可能的取值一一列举。比如我们现实生活中:
- 一周的星期一到星期日是有限的7天,可以一一列举。
- 性别有:男、女、保密,也可以一一列举。
- 月份有12个月,也可以一一列举
enum Color
{
RED,//0
GREEN,//1
BLUE//2
};
int main()
{
enum Color c = GREEN;
printf("%d\n", RED);
printf("%d\n", GREEN);
printf("%d\n", BLUE);
return 0;
}
也可以在定义时赋初值:
enum Color
{
RED = 9,
GREEN,
BLUE
};
enum Color
{
RED,
GREEN = 9,
BLUE
};
enum Color//颜色
{
RED=1,
GREEN=2,
BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异
//联合类型的声明
union Un
{
char c;
int i;
};
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));
union Un
{
char c;
int i;
};
int main()
{
printf("%d\n", sizeof(union Un));
return 0;
}
为什么是4呢?我们打印联合类型Un和内部成员的地址一探究竟。
union Un
{
char c;
int i;
};
int main()
{
printf("%d\n", sizeof(union Un));
union Un un = { 0 };
printf("%p\n", &un);
printf("%p\n", &(un.i));
printf("%p\n", &(un.c));
return 0;
}
union Un
{
char c;
int i;
};
int main()
{
printf("%d\n", sizeof(union Un));
union Un un = { 0 };
un.i = 0x11223344;
un.c = 0x55;
printf("%p\n", &un);
printf("%p\n", &(un.i));
printf("%p\n", &(un.c));
return 0;
}
这证明了联合类型的成员共用同一块空间。
但是当我们以十六进制形式打印出来,可以看到un.i最低位被修改为un.c的值了了
#include
union Un
{
char c;
int i;
};
int main()
{
union Un un = { 0 };
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", (un.i));
printf("%x\n", (un.c));
return 0;
}
联合体实现判断当前计算机的大小端存储:
int check_sys()
{
union
{
int i;
char c;
}un = {.i = 1};
return un.c;
}
int main()
{
int ret = check_sys();
if (ret == 1)
printf("小端\n");
else
printf("大端\n");
return 0;
}
check_sys
函数定义了一个匿名联合体(union)un
,这个联合体包含了一个整数 i
和一个字符 c
。un
中初始化了一个整数 i
的值为 1
。check_sys
函数返回了联合体 un
中字符 c
的值。main
函数中,调用 check_sys
函数并将返回值存储在变量 ret
中。ret
是否等于 1
。ret
等于 1
,则打印 "小端",表示系统是小端字节序。ret
不等于 1
,则打印 "大端",表示系统是大端字节序。union Un1
{
char c[5];
//5个字节 每个元素占1个字节 默认对齐数8 对齐数为1
int i;
//4个字节 默认对齐数8 对齐数为4
};
int main()
{
printf("%d\n", sizeof(union Un1));
//5不是最大对齐数的整数倍,所以5+3 = 8
return 0;
}