深入剖析位结构

zjhfqq 发表于 2007-3-28 14:32:00

author: zjhfqq
keyword: 位结构 节省存贮空间 “:”操作符 位域

一、首先说概念:

位结构是一种特殊的结构, 在需按位访问一个字节或字的多个位时, 位结构比按位运算符更加方便。
位结构定义的一般形式为:
struct  位结构名{
数据类型 [变量名]: 整型常数; //成员称为“位域”或者“位段”
数据类型 [变量名]: 整型常数;
} 位结构变量;
其中: 数据类型必须是整型(int/char/short)。 整型常数的范围是数据类型的长度, 如定义为short,则范围是1~16。
变量名是选择项, 可以不命名, 这样规定是为了排列需要。
例如: 下面定义了一个位结构。
struct webpage{
unsigned char incon: 8; /*incon占用低字节的0~7共8位*/
unsigned char txcolor: 4;/*txcolor占用高字节的0~3位共4位*/
unsigned char bgcolor: 3;/*bgcolor占用高字节的4~6位共3位*/
unsigned char blink: 1; /*blink占用高字节的第7位*/
}ch;
printf("%d/n",sizeof(struct webpage));输出:2。
位结构成员的访问与结构成员的访问相同。
例如: 访问上例位结构中的bgcolor成员可写成:
ch.bgcolor

注意:
1. 一个位域必须存储在定义它的一个数据类型内部,不能跨跨该数据类型。如char定义的位域所剩空间不够存放另一位域时,应从下一单元起存放该位域。也可以有意使某位域从下一单元开始。
2.由于位域不允许越过定义它的数据类型,因此位域的长度不能大于定义它的数据类型的长度。
3. 位结构总长度(位数), 是各个位成员定义的位数之和再向最大结构成员对齐。
4. 位结构成员可以与其它结构成员一起使用。
例如:
struct info{
char name[8];
int age;
struct addr address;
float pay;
unsigned char state: 1;
unsigned char pay: 1;
}workers;
上例的结构定义了关于一个工人的信息。其中有两个位结构成员, 每个位结构成员只有一位, 用unsigned char数据类型,因此只占一个字节但保存了两个信息, 该字节中第一位表示工人的状态, 第二位表示工资是否已发放。由此可见使用位结构可以节省存贮空间。

二、再说说位结构的位域存储顺序问题

我们知道字节存储顺序有高字节优先的big-endian大端存储法(高字节数据放在低字节地址处)和低字节优先的little-endian小端存储法,无论使用大端法还是小端法,都不存在技术原因,只是涉及到处理器厂商的立场和习惯。INTEL的X86平台使用小端法,IBM、Motorola、Sun Microsystem的大多数微处理器则使用大端法,还有部分微处理器可以由用户自己设置是使用大端法还是小端法,如ARM、MIPS、PowerPC等。
位域在存储时的顺序和它的编译器有关,一般是先申请的放在低位。程序举例如下:
#include "stdio.h"
void main()
{
 union
 {
 struct student
 {
  unsigned char s1:1;
   unsigned char s2:3;
 }x;
 unsigned char c;
 }v;
 v.c=0;
 v.x.s1=0;
 v.x.s2=4;
printf("%d/n",v.c);
printf("%d/n",sizeof(struct student)); 
}
输出:
8
1

即结构体成员申请是按照顺序从低地址开始。所以上边结构体v在内存中数据的排列顺序为

    s1 s2
    |0| 0|0|1| 0|0|0|0| (1个字节,因为是unsigned char类型)
低地址       高地址


s1放着0
s2放着4(二进制100),在内存里由低到高为“|0|0|1|”。
所以v.c为二进制00001000,即十进制8。
同时,因为s1占一个位,s2占三个位,而两者都是unsigned char型,且最大的数据类型也就是unsigned char型,一个字节足够放下s1和s2了。所以我们看到struct student的大小为1个字节。
如果从先申请的放在高字节,则上边的输出为
           s2  s1
0000 |001 |0
即输出应该是:
64
1
网上有人说TURBO C是采用这种方式,我没试过。

三、位结构的位对齐问题
位结构的其实不存在位对齐问题,即位不需要对齐。其他方面,位结构和一般结构体类似,遵循结构体的对齐原则,

#include "stdio.h"

void main()
{
 union
 {
 struct student
 {
  unsigned char s1:1;
   unsigned char s2:2;
  unsigned char s3:2;
 }x;
 unsigned char c;
 }v;
 v.c=0;
 v.x.s1=0;
 v.x.s3=2;
printf("%d/n",v.c);
printf("%d/n",sizeof(struct student)); 
}
输出结果是:
16
1

因为它只按整体对齐,所以为
s1s2s3
0  0001000
即二进制00010000等于十进制16,而不是
s1s2    s3
0  00 0 01 00

再举一个位结构体的例子

#include "stdio.h"
void main()
{
 union
 {
 struct student
 {
  unsigned char s1:1;
   unsigned char s2:2;
  unsigned short s3:2;
 }x;
 unsigned short c;
 unsigned int d;
 }v;
 v.d=0;
 v.x.s1=0;
 v.x.s3=2;
printf("%d/n",v.d);
printf("%d/n",sizeof(struct student)); 
}
输出为:
131072
4

131072=(10 00000000 00000000)b
因为遵循结构体对齐原则,s3跳过了2个字节。
s1s2                               s3
0  00 00000| 00000000| 01

有关“结构体对齐”可以看转载
"52rd.com/Blog/Detail_RD.Blog_zjhfqq_7083.html"

以上程序全部在C1.7 + XPSP2 + VC6++测试通过。

本文原创,转载请注明出处。
"52rd.com/Blog/Detail_RD.Blog_zjhfqq_7084.html"

你可能感兴趣的:(struct,IBM,存储,float,Motorola,编译器)