有些数据在存储时并不需要占用一个完整的字节,只需要占用一个或几个二进制位即可。例如开关只有通电和断电两种状态,用0和1表示足以,也就是用一个二进位。正是基于这种考虑,C语言又提供了一种数据结构,叫做“位域”或“位段”。
位域是操控位的一种方法(操控位的另一种方法是使用按位运算符,按位运算符将在之后的笔记中做介绍)。
位域通过一个结构声明来建立:该结构声明为每个字段提供标签,并确定该字段的宽度。例如,下面的声明建立了个4个1位的字段
struct
{
unsigned int abc:1;
unsigned int def:1;
unsigned int hij:1;
unsigned int lmn:1;
}KKK;
根据该声明, KKK包含4个1位的字段。现在,可以通过普通的结构成员运算符(.)单独给这些字段赋值:
KKK.abc= 0:
KKK.def= 1;
由于每个字段恰好为1位,所以只能为其赋值1或0。变量prnt被储存在int大小的内存单元中,但是在本例中只使用了其中的4位。
:后面的数字用来限定成员变量占用的位数。位域的宽度不能超过它所依附的数据类型的长度。通俗地讲,成员变量都是有类型的,这个类型限制了成员变量的最大长度,:后面的数字不能超过这个长度。
如上述结构中abc、def、hij、lmn后面的数字不能超过unsigned int的位数,即在32bit环境中就是不能超过32。
位域的取值范围非常有限,数据稍微大些就会发生溢出,请看下面的例子:
#include
struct pack
{
unsigned int a:2; // 取值范围为:0~3
unsigned int b:4; // 取值范围为:0~15
unsigned int c:6; // 取值范围为:0~63
};
int main(void)
{
struct pack pk1;
struct pack pk2;
// 给pk1各成员赋值并打印输出
pk1.a = 1;
pk1.b = 10;
pk1.c = 50;
printf("%d, %d, %d\n", pk1.a, pk1.b, pk1.c);
// 给pk2各成员赋值并打印输出
pk2.a = 5;
pk2.b = 20;
pk2.c = 66;
printf("%d, %d, %d\n", pk2.a, pk2.b, pk2.c);
return 0;
}
程序输出结果为:
pk1.a = 1, pk1.a = 10, pk1.c = 5
pk2.a = 1, pk2.b = 4, pk2.c = 2
位域的存储同样遵循结构体内存对齐的规则
#include
struct pack
{
unsigned int a:2;
unsigned int b:4;
unsigned int c:6;
};
int main(void)
{
printf("sizeof(struct pack) = %d", sizeof(struct pack));
return 0;
}
程序输出结果为:
sizeof(struct pack) = 4
这是因为,a、b、c成员所占的位长之和在一个存储单元(此处为unsigned类型所占的字节数)内,即4个字节内,所以struct pack类型的变量所占的字节长度为4个字节(实际a、b、c一共占用12bit,还有20bit空间为保留的空白)。
可能有人有疑问,此处a、b、c加起来一共才12bit,两个字节都不到,那么只需要,2个字节不就好了吗。这就是因为内存对齐搞的鬼,此处要将内存对齐到 4 个字节(unsigned int类型所占的字节数),以便提高存取效率。
假如把该结构声明改为:
struct pack
{
unsigned a:12;
unsigned b:24;
unsigned c:6;
};
则:
sizeof(struct pack) = 8
因为此时a成员单独占一个内存单元(4字节),b、c成员紧挨着占下一个内存单元(4字节),所以结果为8字节,这也是因为内存对齐。a、b、c占用内存的示意图如:
其中,空白部分为保留的空白填充内存。这里的空白内存是系统自动留出的,同时,我们也可以自己留出填充内存。如无名位域就可以用来作填充:
struct packt
{
unsigned int a:12;
unsigned int :20; //该位域成员不能使用,用于填充
unsigned int c:6;
};
无名位域一般用来作填充或者调整成员位置。因为没有名称,无名位域不能使用。
上面的例子中,如果没有位宽为 20 的无名成员,a、c 将会挨着存储,sizeof(struct pack) 的结果为 4;有了这 20 位作为填充,a、c将分开存储,sizeof(struct pack) 的结果为 8。