3.3 按位运算符
在进入本章的大型示例之前,还要先学习一组运算符,它们看起来类似于前面介绍的逻辑运算符,但实际上与逻辑运算符完全不同。这些运算符称为按位运算符,因为它们操作的是整数值中的位。按位运算符有6个,如表3-5所示。
表3-5 按位运算符
运 算 符 |
说 明 |
& |
按位与运算符 |
| |
按位或运算符 |
^ |
按位异或(EOR)运算符 |
~ |
按位非运算符,也称为1的补位运算符 |
<< |
按位左移运算符 |
>> |
按位右移运算符 |
这些运算符都只能用于整数类型。~运算符是一元运算符,只处理一个操作数,其他都是二元运算符。
按位与运算符&合并操作数的对应位,如果两个位都是1,结果位就是1,否则,结果位就是0。假定声明了如下变量:
int x = 13;
int y = 6;
int z = x&y; /* AND the bits of x and y */
在执行第三条语句后,z的值是4(二进制为100),因为x和y的对应位的合并过程如下:
x 0 0 0 0 1 1 0 1
y 0 0 0 0 0 1 1 0
x&y 0 0 0 0 0 1 0 0
显然,变量的位数要比这里显示的多,但其他位都是0。变量x和y的对应位都是1的情况只有从右数的第三位,所以只有这一位的按位与结果为1。
警告:
千万不要混淆按位运算符和逻辑运算符。表达式x & y生成的结果完全不同于x && y。
如果对应位中有一个或两个位是1,按位或运算符|就生成1,否则就生成0。下面看一个例子。如果在一个语句中合并相同的值:
int z = x|y; /* OR the bits of x and y */
结果如下:
x 0 0 0 0 1 1 0 1
y 0 0 0 0 0 1 1 0
x|y 0 0 0 0 1 1 1 1
z存储的值是15(二进制的1111)。
如果两个位是不同的,按位异或运算符^就生成1,否则就生成0。再使用相同的初始值,语句:
int z = x^y; /*Exclusive OR the bits of x and y */
会使z包含值11(二进制的1011),因为位的合并如下:
x 0 0 0 0 1 1 0 1
y 0 0 0 0 0 1 1 0
x^y 0 0 0 0 1 0 1 1
一元运算符~会翻转其操作数的位,将1变成0,0变成1。如果把这个运算符应用于值为13的变量x,并编写如下语句:
int z = ~x; /* Store 1's complement of x */
z的值就是14,位的设置如下:
x 0 0 0 0 1 1 0 1
~x 1 1 1 1 0 0 1 0
在负整数的2的补码中,值1111 0010是14。如果不熟悉2的补码形式,可以参阅附录A。
移位运算符会把左操作数的位移动右操作数指定的位数。使用下面的语句可以指定左移位操作:
int value = 12;
int shiftcount = 3; /* Number of positions to be shifted */
int result = value << shiftcount; /* Shift left shiftcount positions */
变量result的值是96,其二进制为0000 1100。现在把其中的位向左移动3位,在右边补入0,所以value << shiftcount的二进制值是0110 0000。
右移位运算符会向右移位,但它比左移位复杂一些。对于不带符号的数值,向右移位时,会在左边的空位中填充0。下面用一个例子来说明。假定声明一个变量:
unsigned int value = 65372U;
在两字节的变量中,这个值的二进制形式为:
1111 1111 0101 1100
假定现在执行如下语句:
unsigned int result = value >> 2; /* Shift right two bits */
value中的位向右移动两位,在左边补入0,得到的值存储在result中。在二进制中,其值为0,在十进制中,其值为16 343。
0011 1111 1101 0111
对于带符号的负值,其最左一位是1,则移位的结果取决于系统。在大多数情况下,符号位会扩散,所以向右移位时补入的是1,但在一些系统上,补入的是0。下面看看这对结果有什么影响。
假定用下面的语句定义一个变量:
int new_value = -164;
其位模式与前面使用的无符号值相同,这是该值的2的补码:
1111 1111 0101 1100
执行如下语句:
int new_result = new_value >> 2; /* Shift right two bits */
这行语句将new_value的值向右移动两位,结果存储在new_result中。在通常情况下,如果扩散符号位,在向右移位时将1插入左边的空位,new_result的值就是:
1111 1111 1101 0111
其十进制值是–41,这是我们希望的结果,因为–164/4的结果应是–41。但在一些计算机上,如果不扩散符号位,new_result的值就是:
0011 1111 1101 0111
在本例中向右移动两位,会把值–164变成+16 343,这是一个意想不到的结果。
3.3.1 按位运算符的op=用法
所有的二元按位运算符都可以在op=形式的赋值语句中使用,但~运算符例外,它是一元运算符。如第2章所述,如下形式的语句:
lhs op= rhs;
等价于:
lhs = lhs op (rhs);
这说明,如果编写如下语句:
value <<= 4;
其作用是将整数变量value的内容向右移动4位。该语句与下面的代码等效:
value = value << 4;
其他二元运算符也可以这样使用。例如,可以编写如下语句:
value &= 0xFF;
其中value是一个整数变量,这个语句等价于:
value = value & 0xFF;
其作用是使最右边的8位保持不变,其他的位都设置为0。
3.3.2 使用按位运算符
从学术的角度来看,按位运算符很有趣,但它们用于什么场合?它们不用于日常的编程工作,但在一些领域非常有效。按位与&、按位或|运算符的一个主要用途是测试并设置整数变量中的各个位。此时可以使用各个位存储涉及二选一的数据。例如,可以使用一个整数变量存储一个人的几个特性。在一个位中存储这个人是男性还是女性,使用3个位指定这个人是否会说法语、德语或意大利语。再使用另一个位记录这个人的薪水是否多于$50 000。在这4个位中,都记录了一组数据。下面看看这是如何实现的。
只有两个位都是1,结果才是1,此时可以使用&运算符选择整数变量的一个部分,甚至可以选择其中的一个位。首先定义一个值,它一般称为掩码,用于选择需要的位。在掩码中,希望保持不变的位置上包含1,希望舍弃的位置上包含0。接着对这个掩码与要从中选择位的值执行按位与操作。下面看一个例子。下面的语句定义了掩码:
unsigned int male = 0x1; /* Mask selecting first (rightmost) bit */
unsigned int french = 0x2; /* Mask selecting second bit */
unsigned int german = 0x4; /* Mask selecting third bit */
unsigned int italian = 0x8; /* Mask selecting fourth bit */
unsigned int payBracket = 0x10; /* Mask selecting fifth bit */
在每条语句中,1位表示该条件是true。这些二进制掩码都选择一个位,所以可以定义一个unsigned int变量personal_data来存储一个人的5项信息。如果第一位是1,这个人就是男性,如果是0,这个人就是女性。如果第二位是1,这个人就说法语,如果是0,这个人就不说法语,数据值右边的5位都是这样。
因此,可以给一个说德语的人测试变量personal_data,如下面的语句所示:
if(personal_data & german)
/* Do something because they speak German */
如果personal_data对应掩码german的位是1,表达式personalData & german的值就不是0(true),否则就是0。
当然,也可以通过逻辑运算符合并多个使用掩码的表达式,选择各个位。下面的语句测试某个人是否是女性,是说法语还是说意大利语:
if(!(personal_data & male) && ((personal_data & french) ||
(personal_data & italian)))
/* We have a French or Italian speaking female */
可以看出,测试单个位或位的组合是很简单的。另一个需要理解的操作是如何设置各个位。此时可以使用按位或(OR)运算符。按位或运算符与测试位的掩码一起使用,就可以设置变量中的各个位。如果要设置变量personal_data,记录某个说法语的人,就可以使用下面的语句:
personal_data |= french; /* Set second bit to 1 */
上面的语句与如下语句等效:
personal_data = personal_data|french; /* Set second bit to 1 */
personal_data中从右数的第二位设置为1,其他位都不变。利用|运算符的工作方式,可以在一条语句中设置多个位:
personal_data |= french|german|male;
这条语句设置的位记录了一个说法语和德语的男子。如果变量personal_data以前曾记录这个人也说意大利语,则这一位仍会设置为1,所以OR运算符是相加的。如果某个位已经设置为1,它仍会设置为1。
如何重置一个位?假定要将男性位设置为女性,这需要将一个位重置为0,此时应使用!运算符和按位与(AND)运算符:
personal_data &= !male; /* Reset male to female */
这是可行的,因为!male将表示男性的位设置为0,其他位仍设置为1。因此,对应于男性的位设置为0,0与任何值的与操作都是0,其他位保持不变。如果另一个位是1,则1&1仍是1。如果另一个位是0,则0&1仍是0。
使用位的例子记录了个人数据的特定项。如果要使用Windows应用程序编程接口(API)编写PC程序,就会经常使用各个位来记录各种Windows参数的状态,在这种情况下,按位运算符非常有用。
试试看:使用按位运算符
下面在一个略微不同的例子中使用一些按位运算符,但规则与前面相同。这个例子说明了如何使用掩码从变量中选择多个位。我们要编写的程序将在变量中设置一个值,再使用按位运算符翻转十六进制数字的顺序。下面是代码:
/* Program 3.10 Exercising bitwise operators */
#include <stdio.h>
int main(void)
{
unsigned int original = 0xABC;
unsigned int result = 0;
unsigned int mask = 0xF; /* Rightmost four bits */
printf("/n original = %X", original);
/* Insert first digit in result */
result |= original&mask; /* Put right 4 bits from original in result */
/* Get second digit */
original >>= 4; /* Shift original right four positions */
result <<= 4; /* Make room for next digit */
result |= original&mask; /* Put right 4 bits from original in result */
/* Get third digit */
original >>= 4; /* Shift original right four positions */
result <<= 4; /* Make room for next digit */
result |= original&mask; /* Put right 4 bits from original in result */
printf("/t result = %X/n", result);
return 0;
}
输出如下:
original = ABC result = CBA
代码的说明
这个程序使用了前面探讨的掩码概念。original中最右边的十六进制数是通过表达式original & mask将original和mask的值执行按位与操作而获得的。这会把其他十六进制数设置为0。因为mask的值的二进制形式为:
0000 0000 0000 1111
可以看出,只有右边的4位没有改变。在original中,这4位都是1,在执行按位与操作的结果中,这4位仍是1,其他位都是0。这是因为0与任何值执行按位与操作,结果都是0。选择了右边的4位后,用下面的语句存储结果:
result |= original&mask; /* Put right 4 bits from original in result */
result的内容与右边表达式生成的十六进制数进行或操作。为了获得original中的第二位,需要把它移动到第一个数字所在的位置。为此将original向右移动4位:
original >>= 4; /* Shift original right four positions */
第一个数字被移出,且被舍弃。为了给original的下一个数字腾出空间,下面的语句将result的内容向左移动4位:
result <<= 4; /* Make room for next digit */
现在要在result中插入original中的第二个数字,而当前这个数字在第一个数字的位置上,使用下面的语句:
result |= original&mask; /* Put right 4 bits from original in result */
要得到第三个数字,重复上述过程。显然,可以对任意多个数字重复这个过程。