C语言里的位域是一个比较复杂的问题,涉及的方面也比较多,关于位域的基础内容可以参考以下文章:理解C语言位域
分析代码如下:
输出结果为:
第一次赋值后: a的值为:1 b的值为:2
第二次赋值后: a的值为:4 b的值为:-2
第二次赋值后: a的值为:0 b的值为:3
BitSeg1的字节数为: 4
BitSeg2的字节数为: 1
代码中的BigSeg1定义了两个int类型的字段,而且它们分别只占用4位和3位的空间。当BitSeg1中的a,b分别赋值为1和2时,输出的结果也如我们所料。当第二次赋值为100和30时,输出的结果却是4和-2,为什么呢?
1.赋值问题
出现上述问题,是由于赋值与位域效果共同形成的,a和b虽然都是int类型,但是在BigSeg1结构里,它们只有4位和3位为实际有效位。也就是BigSeg1中的前4位是a的,接着的3位是b的(这里没有字节的跨越问题)。执行ba1.a=100语句,其中100的二进制代码是:01100100,程序只把这100的二进制数的前面4位(已用红色字体表示)赋值给a,那么ba1中的a只是0100(b),结果当然是4咯。然后是执行b1.b=30语句,其中30的二进制代码为:00011110, 同样的程序只把前3位(注意b定义有效位数是3位)赋值给b,那么ba1中的b就是110(b),结果是-2,为什么?是这样的,我们定义b为int类 型,也就是有符号的整型,如果想定义为无符号整型我们必须这样写unsigned int,而有符号整型的第一位是符号位,用于表示正负的(1表示负数,0表示正数),那么对于b,程序就会把b的第一位(即1)做为符号位,即b应该是负 数,而后面的是它的数值(即10(b)),注意计算机里负数是按补码的形式表示的,这种赋值下b的确是110(它是补码,按“即反加一”的法则,即十进制 的-2),结果就是-2了。而刚才的a给赋值为0100(b)时,第一位是0,解释为正数。再举一例,若使ba1.b=7,那么ba1.b的值是多少 呢?7的二进制是0111,前面3位直接给到b,因为是负数,读出来时按补码形式读,那么就是-1了。
总之一句话:用位为理解位域。
接下来是用memcpy对ba1进行内存copy,就更应该用位来考虑位域了。下面我们分析一下:
首先,sizeof(BitSeg1)的值是4个字节,先记住,后面会对此问题进行详细解释。
执行memcpy(&ba1,str,sizeof(BitSeg1)),把str的内容中的前面4个字节的内存里的内容复制到ba1中,我们先来看一下str的内存位信息(用16进制表示):
0x0012ff74:30 31 32 33
其中0x0012ff74时str数组的地址起始位置,30,31,32,33等16进制值分别表示字符'0','1','2','3',它们当然是ACII值啦。
copy之后的ba1的内存位信息如下:
0x0012ff7c:30 31 32 33
因为ba1也是占4个字节的空间的,所以不会出现内存溢出。memcpy只是把相应内存复制到了ba1上,位信息与str上的信息一样的。
现在,我们把30(H)的二进制写出来,是:00110000,ba1的a占前面4 位,b占接下来的3位,直观地看,a应该是0011(b)即十进制的3,b是000(b)即十进制的0,但看输出的结果却是a=0,b=3,这又是为什么 呢?其实很简单,处理器定义字节的前面4位是指该字节从右往左4位,而不是从左往右的4位,所以a应该是0000(b),b应该是011(b)。
2.字节对齐
回到上面留下的字节数的问题,即sizeof(BitSeg1)的结果为4个字节。按理来说,BitSeg1的有效位数是7位,但为了程序的快速运 行,一个重要的手段是减少内存的读写次数,所以一样的处理器都是以字节的倍数将内存中的数据读到寄存器中,所以程序把数据以字节的形式对齐了就可以有效的 减少内存的读写时间,你可想想要处理器只读内存中的7位是如何做的,一次一个位?那倒不如一次读8位。
在做字节对齐的时候也是有规则的,在32位的系统里,编译器会按类型进行字节的对齐,以它们的位宽为基准,在VC下:
char
偏移量必须为sizeof(char)即1的倍数
int
偏移量必须为sizeof(int)即4的倍数
float
偏移量必须为sizeof(float)即4的倍数
long
偏移量必须为sizeof(long)即4的倍数
double
偏移量必须为sizeof(double)即8的倍数
short
偏移量必须为sizeof(short)即2的倍数
BitSeg1里的两个变量都是int类型,所以是4个字节对齐的。
而使用位域的主要目的是压缩存储,减少内存的占有量,其大致规则为:
1) 如果相邻位域字段的类型相同,且其位宽之和小于类型的sizeof大小,则后面的字段将紧邻前一个字段存储,直到不能容纳为止;
2) 如果相邻位域字段的类型相同,但其位宽之和大于类型的sizeof大小,则后面的字段将从新的存储单元开始,其偏移量为其类型大小的整数倍;
3) 如果相邻的位域字段的类型不同,则各编译器的具体实现有差异,VC6采取不压缩方式,Dev-C++采取压缩方式;
4) 如果位域字段之间穿插着非位域字段,则不进行压缩;
5) 整个结构体的总大小为最宽基本类型成员大小的整数倍。
再看一个例子:
对于上述例子,len的值应该是12。解释如下:
首先以最长的类型位宽做为偏移量,最长的是long型,占4位,所以不同类型之间应该是4个字节的偏移,即test1应该是4字节的整数倍。
char a:1; //用一个字节去存储
char :2; //空域。因为与前面的a的类型相同,而两个位域的位宽相加仍然少于8位,所以依然用1个字节表示
long b:3; //long类型的位宽是4个字节,与前面的char类型不同,所以b与a之间偏移4个字节,它们之间自动补充3个字节
char c:2; //因为c与b又不同型,以test1中的最长的long类型的位宽进行偏移,所以虽然char只用1个字节就够了
//但依然要占4个字节。