C语言位域常见问题分析

原文:http://blog.csdn.net/IdoIwill/archive/2008/09/21/2956890.aspx

C语言里的位域是一个比较复杂的问题,涉及的方面也比较多,关于位域的基础内容可以参考以下文章:理解C语言位域 

分析代码如下:

  1. #include "stdio.h"
  2. #include "memory.h"

  3. struct BitSeg1{
  4.     int a:4;
  5.     int b:3;
  6. };

  7. struct BitSeg2{
  8.     char a:4;
  9.     char b:3;
  10. };

  11. int main()
  12. {
  13.     struct BitSeg1 ba1;
  14.     ba1.a=1;
  15.     ba1.b=2;
  16.     printf("第一次赋值后: a的值为:%d/tb的值为:%d/n",ba1.a,ba1.b);
  17.     ba1.a=100;
  18.     ba1.b=30;
  19.     printf("第二次赋值后: a的值为:%d/tb的值为:%d/n",ba1.a,ba1.b);
  20.     char str[]="0123";
  21.     memcpy(&ba1,str,sizeof(BitSeg1));
  22.     printf("第二次赋值后: a的值为:%d/tb的值为:%d/n",ba1.a,ba1.b);
  23.     printf("BitSeg1的字节数为: %d/n",sizeof(BitSeg1));
  24.     printf("BitSeg2的字节数为: %d/n",sizeof(BitSeg2));
  25.     return 0;
  26. }

输出结果为:

第一次赋值后: a的值为:1     b的值为:2
  第二次赋值后: a的值为:4     b的值为:-2
  第二次赋值后: a的值为:0     b的值为:3
  BitSeg1的字节数为: 4
  BitSeg2的字节数为: 1

 

代码中的BigSeg1定义了两个int类型的字段,而且它们分别只占用4位和3位的空间。当BitSeg1中的a,b分别赋值为1和2时,输出的结果也如我们所料。当第二次赋值为100和30时,输出的结果却是4和-2,为什么呢?

1.赋值问题

出现上述问题,是由于赋值与位域效果共同形成的,a和b虽然都是int类型,但是在BigSeg1结构里,它们只有4位和3位为实际有效位。也就是BigSeg1中的前4位是a的,接着的3位是b的(这里没有字节的跨越问题)。执行ba1.a=100语句,其中100的二进制代码是:01100100,程序只把这100的二进制数的前面4位(已用红色字体表示)赋值给a,那么ba1中的a只是0100(b),结果当然是4咯。然后是执行b1.b=30语句,其中30的二进制代码为:00011110, 同样的程序只把前3位(注意b定义有效位数是3位)赋值给b,那么ba1中的b就是110(b),结果是-2,为什么?是这样的,我们定义b为int类 型,也就是有符号的整型,如果想定义为无符号整型我们必须这样写unsigned int,而有符号整型的第一位是符号位,用于表示正负的(1表示负数,0表示正数),那么对于b,程序就会把b的第一位(即1)做为符号位,即b应该是负 数,而后面的是它的数值(即10(b)),注意计算机里负数是按补码的形式表示的,这种赋值下b的确是110(它是补码,按“即反加一”的法则,即十进制 的-2),结果就是-2了。而刚才的a给赋值为0100(b)时,第一位是0,解释为正数。再举一例,若使ba1.b=7,那么ba1.b的值是多少 呢?7的二进制是0111,前面3位直接给到b,因为是负数,读出来时按补码形式读,那么就是-1了。

总之一句话:用位为理解位域。

接下来是用memcpy对ba1进行内存copy,就更应该用位来考虑位域了。下面我们分析一下:

首先,sizeof(BitSeg1)的值是4个字节,先记住,后面会对此问题进行详细解释。

执行memcpy(&ba1,str,sizeof(BitSeg1)),把str的内容中的前面4个字节的内存里的内容复制到ba1中,我们先来看一下str的内存位信息(用16进制表示):

0x0012ff74:30  31  32 33

其中0x0012ff74时str数组的地址起始位置,30,31,32,33等16进制值分别表示字符'0','1','2','3',它们当然是ACII值啦。

copy之后的ba1的内存位信息如下:

0x0012ff7c:30     31     32    33

因为ba1也是占4个字节的空间的,所以不会出现内存溢出。memcpy只是把相应内存复制到了ba1上,位信息与str上的信息一样的。

现在,我们把30(H)的二进制写出来,是:00110000,ba1的a占前面4 位,b占接下来的3位,直观地看,a应该是0011(b)即十进制的3,b是000(b)即十进制的0,但看输出的结果却是a=0,b=3,这又是为什么 呢?其实很简单,处理器定义字节的前面4位是指该字节从右往左4位,而不是从左往右的4位,所以a应该是0000(b),b应该是011(b)。

2.字节对齐

回到上面留下的字节数的问题,即sizeof(BitSeg1)的结果为4个字节。按理来说,BitSeg1的有效位数是7位,但为了程序的快速运 行,一个重要的手段是减少内存的读写次数,所以一样的处理器都是以字节的倍数将内存中的数据读到寄存器中,所以程序把数据以字节的形式对齐了就可以有效的 减少内存的读写时间,你可想想要处理器只读内存中的7位是如何做的,一次一个位?那倒不如一次读8位。

在做字节对齐的时候也是有规则的,在32位的系统里,编译器会按类型进行字节的对齐,以它们的位宽为基准,在VC下:

char
  偏移量必须为sizeof(char)即1的倍数

int
  偏移量必须为sizeof(int)即4的倍数

float
  偏移量必须为sizeof(float)即4的倍数

long
  偏移量必须为sizeof(long)即4的倍数

double
  偏移量必须为sizeof(double)即8的倍数

short
  偏移量必须为sizeof(short)即2的倍数

BitSeg1里的两个变量都是int类型,所以是4个字节对齐的。

 

而使用位域的主要目的是压缩存储,减少内存的占有量,其大致规则为:  
  1)  如果相邻位域字段的类型相同,且其位宽之和小于类型的sizeof大小,则后面的字段将紧邻前一个字段存储,直到不能容纳为止; 
  2)  如果相邻位域字段的类型相同,但其位宽之和大于类型的sizeof大小,则后面的字段将从新的存储单元开始,其偏移量为其类型大小的整数倍; 
  3)  如果相邻的位域字段的类型不同,则各编译器的具体实现有差异,VC6采取不压缩方式,Dev-C++采取压缩方式; 
  4)  如果位域字段之间穿插着非位域字段,则不进行压缩; 
  5)  整个结构体的总大小为最宽基本类型成员大小的整数倍。

  

再看一个例子:

  1. struct test1
  2. {
  3.    char a:1;
  4.    char :2;
  5.    long b:3;
  6.    char c:2;
  7. };

  8. int len = sizeof(test1);

对于上述例子,len的值应该是12。解释如下:

首先以最长的类型位宽做为偏移量,最长的是long型,占4位,所以不同类型之间应该是4个字节的偏移,即test1应该是4字节的整数倍。

char a:1; //用一个字节去存储

char :2;  //空域。因为与前面的a的类型相同,而两个位域的位宽相加仍然少于8位,所以依然用1个字节表示

long b:3; //long类型的位宽是4个字节,与前面的char类型不同,所以b与a之间偏移4个字节,它们之间自动补充3个字节

char c:2; //因为c与b又不同型,以test1中的最长的long类型的位宽进行偏移,所以虽然char只用1个字节就够了

     //但依然要占4个字节。


总共是12字节。

你可能感兴趣的:(编程)