这是我的这一系列文章的第一篇,主要讲述我学习过程中积累的一些编程技巧,由于我也是一个初学者,高手莫笑。这一篇主要讲解位运算的基础知识鱼与其简单应用,我主要以C/C++语言讲述,其他语言可以类推。如果你已经对位运算基础和应用十分熟悉,那么本文并不适合你。
我相信还是有一部分人对位运算还不是很了解,我希望你在看了本博文之后能对位运算有深刻的了解,并运能够用自如,能够体会到编程的乐趣。
“写程序,位运算是必要的吗?”
这个问题问的好,其实位运算并不是必要的,有什多方法可以可以代替位运算,但是位运算其特有的对程序的优化特点是无法替代的!当然如果你在写Windows应用程序,其中调用的一些Windows APi 你就必须用到位运算,如最简单的MessageBox。当然其中牵扯到的位运算过于简单,就是简单的或运算。想想当初写的第一个windows程序用到MessageBox竟然出现了一个windows窗口,而不是那黑糊糊的Console,让我兴奋了还一段时间!可是当时的我也不知道这里面牵扯的很多知识,甚至什么是API都不知道!
我们在学习C/C++的时候书本上对位运算的相关知识讲得很少,就是简单的“或与非”。如果你的记性好那么你还会记得在位运算中还有一个运算叫做 “异或”运算和移位运算。不知道你现在对位运算的基础是否还清楚,我在这里假设我们都忘了位运算的基础,所以下面我们对位运算进行复习一下。
C/C++语言提供的位运算符有:
运算符 | 含义 | 功能 |
& | 按位与 | 如果两个相应的二进制位都为1,则该位的结果值为1;否则为0。 |
| | 按位或 | 两个相应的二进制位中只要有一个为1,该位的结果值为1。 |
∧ | 按位异或 | 若参加运算的两个二进制位同号则结果为0(假)异号则结果为1(真) |
~ | 取反 | ~是一个单目(元)运算符,用来对一个二进制数按位取反,即将0变1,将1变0。 |
<< | 左移 | 左移运算符是用来将一个数的各二进制位全部左移N位,右补0。 |
>> | 右移 | 表示将a的各二进制位右移N位,移到右端的低位被舍弃,对无符号数,高位补0。 |
位运算的结果演示:
位运算 | 或 “|” or | 与 “&”and | 非 “~” not | 异或 “^” xor |
操作数1 | 01010101 | 11010101 | 10101010 | 10000001 |
操作数2 | 00101010 | 10101010 | (无) | 01111111 |
也能算结果 | 01111111 | 10000000 | 01010101 | 11111110 |
好了看了上面的两个表格,相信你已经对位运算有所了解了,那么接下来,我们就来讲讲位运算的应用。
1、 用于整数的奇偶性判断
想想,我们要判断一个数的奇偶性,在没用位运算之前我们可以用下列的代码来实现:
template
bool Parity(Type value)
{
if(value % 2 == 0)
return false;
else
return true;
}
//加以优化
template
inline bool Parity(Type value)
{
return (value % 2 != 0);
}
要知道,上面的代码我们使用的是对2取余,如果操作数value是小数的话,还勉强行得通,但是value是一个上百万的大数,那么这就白白浪费了CPU的大量时间,程序的效率和性能就很差。我们知道任何数在计算机储存中都是以二进制储存的,细心的你就会发现在二进制的最小一位有个特点,为0就是偶数,为1就是奇数,按照这个原理我们根本没必要让我们的CPU大哥白白做那么多的工作,只要一步判断就可以了。接下来就让我们看看位运算的精妙之处!
那么我们的目的就是判断最小位是0还是1,可是我们怎么判断呢?我们要用位运算阿里判断,就是与或非。在上面的复习之中我们只说了位运算的计算方法,并没有说其用处。那么在这里我们用到的就是“与”!与运算特有的一个功能就是判断指定位上的值(0或1)。我们来看下面的表格(与运算)。
操作数1 | 10101010 | 01010101 | 11111111 | 11111110 |
操作数2 | 00000001 | 00000001 | 00000001 | 00000001 |
运算结果 | 00000000 | 00000001 | 00000001 | 00000000 |
我们要注意一下这里的 操作数2 ,它只有最低位是1,其余位都是0,这就是关键所在,操作数1是随机值。我们看看结果只会有两种结果:0或1。这个结果就取决于操作数1的最低位,它为1时就为1,为0时就为0.
“那么我要判断的是第二位呢?”
好!那我们就把操作数2改为 00000010 那么结果就只会有 00000000 或 00000010 其结果取决于第二位。
有了这个基础那么我们来看看怎么用位运算判断奇偶性吧:
template
bool Parity(Type value)
{
if(value & 0x0001 == 0)
return false;
else
return true;
}
//加以优化
template
inline bool Parity(Type value)
{
return (value & 1 != 0);
}
//在简化
#define PARITY(value) (value&1)
使用a%2来判断奇偶性和a & 1是一样的作用,但是a & 1要快好多。
2、 判断n是否是2的整数冪
所谓2的整数冪就是指 1(2的0次冪),2,4,8,16,32,64,128,256,512,1024,2048.............等数字,若何判断一个数是否是这样的数呢?我们看看不用位运算的计算方法:
#include "math.h"
template
bool IsPowerOfTwo(Type value)
{
for(int i = 0,l = 8*sizeof(value); i < l ;i++)
{
if(pow(2,i) == value)
{
return true;
}
}
return false;
}
在这个算法中,我们使用了一个循环。其原理非常简单就是一一的对比,但是其中还调用了数学函数库,效率大大降低。接下来我们讲讲怎样用位运算来判断。我们首先要研究一下这些数的特性,请看下表(与运算):
2的幂 | 8 | 16 | 32 | 64 |
n | 00001000 | 00010000 | 00100000 | 01000000 |
n-1 | 00000111 | 00001111 | 00011111 | 00111111 |
与结果 | 00000000 | 00000000 | 00000000 | 00000000 |
我们发现 n &(n-1) = 0 我们可以 用逻辑非 !(n&(n-1)) = 1 。那是不是这样就可以了呢,你会发现 !(0&(0-1)) = 1 但是 0并不是 2的正整数冪。我们可以用 逻辑与 (!(n&(n-1) && n) = 1;请看下面的代码:
template
inline bool IsPowerOfTwo(Type n)
{
if(((!(n&(n-1))) && n) == 1)
return true;
else
return false;
}
//简化
#define ISPOWEROFTWO(n) ((!(n&(n-1)) ) && n)
3、 统计n在二进制中1的个数
朴素的统计办法是:先判断n的奇偶性,为奇数时计数器增加1,然后将n右移一位,重复上面步骤,直到移位完毕。
template
inline bool Parity(Type value)
{
return (value % 2 != 0);
}
template
inline int CountOne(Type value)
{
if(value != 0)
{
return Parity(value) + CountOne(value >> 1);
}
return 0;
}
朴素的统计办法是比较简单的,那么我们来看看比较高级的办法。
举例说明,
考虑2位整数 n=11(十进制为3),里边有2个1,先提取里边的偶数位10,奇数位01,把偶数位右移1位,然后与奇数位相加,因为每对奇偶位相加的和不会超过“两位”,所以结果中每两位保存着数n中1的个数,那么把 n 计算之后得到的值为:(10>>1)+01 = 01 + 01 = 10, 把10换成十进制就是 2,2就代表 n(3)=11 中有两个1!
相应的如果n是四位整数 n=0111(十进制7),先以“一位”为单位做奇偶位提取:偶数位 0010,奇数位0101。然后偶数位移位(右移1位)再相加:(0010>>1)+0101=0110;再用0110以“两位”为单位做奇偶提取:偶数为0100,奇数位0010。偶数位移位(这时就需要移2位)再相加:(0100>>2)+0010=0011,因为此时每对奇偶位的和不会超过“四位”,所以结果中保存着n中1的个数:(0100>>2)+0010=0011 把0011换成十进制就是3,3就是n(7)=0111中有3个1。
依次类推可以得出更多位n的算法。整个思想类似分治法。
在这里就顺便说一下常用的二进制数:
二进制数 | 二进制值 | 用处 |
0xAAAAAAAA | 10101010101010101010101010101010 | 偶数位为1,以1位为单位提取奇位 |
0x55555555 | 01010101010101010101010101010101 | 奇数位为1,以1位为单位提取偶位 |
0xCCCCCCCC | 11001100110011001100110011001100 | 以“2位”为单位提取奇位 |
0x33333333 | 00110011001100110011001100110011 | 以“2位”为单位提取偶位 |
0xF0F0F0F0 | 11110000111100001111000011110000 | 以“8位”为单位提取奇位 |
0x0F0F0F0F | 00001111000011110000111100001111 | 以“8位”为单位提取偶位 |
0xFFFF0000 | 11111111111111110000000000000000 | 以“16位”为单位提取奇位 |
0x0000FFFF | 00000000000000001111111111111111 | 以“16位”为单位提取偶位 |
例如:32位无符 号数的1的个数可以这样数:
int CountOne(unsigned int n)
{
//0xAAAAAAAA,0x55555555分别是以“1位”为单位提取奇偶位
n = ((n & 0xAAAAAAAA) >> 1) + (n & 0x55555555);
//0xCCCCCCCC,0x33333333分别是以“2位”为单位提取奇偶位
n = ((n & 0xCCCCCCCC) >> 2) + (n & 0x33333333);
//0xF0F0F0F0,0x0F0F0F0F分别是以“4位”为单位提取奇偶位
n = ((n & 0xF0F0F0F0) >> 4) + (n & 0x0F0F0F0F);
//0xFF00FF00,0x00FF00FF分别是以“8位”为单位提取奇偶位
n = ((n & 0xFF00FF00) >> 8) + (n & 0x00FF00FF);
//0xFFFF0000,0x0000FFFF分别是以“16位”为单位提取奇偶位
n = ((n & 0xFFFF0000) >> 16) + (n & 0x0000FFFF);
return n;
}
看起来似乎采用位运算的代码比朴素方法代码要复杂的多,但是在性能上有着朴素方法无法比拟的优越性,只要四步简单的运算就能达到目的,而朴素方法不是用循环就是递归,这大大降低了CPU的运算性能。
4、对于正整数的模运算(注意,负数不能这么算)
先说下比较简单的:
乘除法是很消耗时间的,只要对数左移一位就是乘以2,右移一位就是除以2,据说用位运算效率提高了60%。
乘2^k 众所周知: n<
除2^k众所周知: n>>k。
那么 mod 2^k 呢?(对2的倍数取模)
n&((1<
用通俗的言语来描述就是,对2的倍数取模,只要将数与2的倍数-1做按位与运算即可。
好!方便理解就举个例子吧。
思考:如果结果是要求模2^k时,我们真的需要每次都取模吗?
在此很容易让人想到快速幂取模法。
快速幂取模算法
经常做题目的时候会遇到要计算 a^b mod c 的情况,这时候,一个不小心就TLE(算法计算超时,ACM题目测试结果常见问题)了。那么如何解决这个问题呢?位运算来帮你吧。
首先介绍一下秦九韶算法:(数值分析讲得很清楚)
把一个n次多项式f(x) = a[n]x^n+a[n-1]x^(n-1)+......+a[1]x+a[0]改写成如下形式:
f(x) = a[n]x^n+a[n-1]x^(n-1))+......+a[1]x+a[0]
= (a[n]x^(n-1)+a[n-1]x^(n-2)+......+a[1])x+a[0]
= ((a[n]x^(n-2)+a[n-1]x^(n-3)+......+a[2])x+a[1])x+a[0]
=. .....
= (......((a[n]x+a[n-1])x+a[n-2])x+......+a[1])x+a[0].
求多项式的值时,首先计算最内层括号内一次多项式的值,即
v[1]=a[n]x+a[n-1]
然后由内向外逐层计算一次多项式的值,即
v[2]=v[1]x+a[n-2]
v[3]=v[2]x+a[n-3]
......
v[n]=v[n-1]x+a[0]
这样,求n次多项式f(x)的值就转化为求n个一次多项式的值。
好!有了前面的基础知识,我们开始解决问题吧
由(a × b) mod c=( (a mod c) × b) mod c.
我们可以将 b先表示成就:
b = a[t] × 2^t + a[t-1]× 2^(t-1) + …… + a[0] × 2^0. (a[i]=[0,1]).
这样我们由 a^b mod c = (a^(a[t] × 2^t + a[t-1] × 2^(t-1) + …a[0] × 2^0) mod c.
然而我们求 a^( 2^(i+1) ) mod c=( (a^(2^i)) mod c)^2 mod c .求得。
具体实现如下:
使用秦九韶算法思想进行快速幂模算法,简洁漂亮
// 快速计算 (a ^ p) % m 的值__int64 FastM(__int64 a, __int64 p, __int64 m) { if (p == 0) return 1; __int64 r = a % m; __int64 k = 1; while (p > 1) { if ((p & 1)!=0) { k = (k * r) % m; } r = (r * r) % m; p >>= 1; } return (r * k) % m; }
http://acm.pku.edu.cn/JudgeOnline/problem?id=3070
5、计算掩码
什么是掩码?掩码是一串二进制代码对目标字段进行位与运算,屏蔽当前的输入位。用于从一个或多个字节中选出的位的集合。
举个例子:
我们有一个IP地址:192.168.1.111 对应二进制:11000000.10101000.00000001.01101111。
我们让这个IP位与:255.255.255.0 对应二进制:11111111.11111111.11111111.00000000。
可以得到子网地址:192.168.1.0 对应二进制:11000000.10101000.00000001.00000000。
在例子中我们通过观察二进制码就知道,这个过程就是拿到IP的前三个字节的数据信息,这里用到的255.255.255.0就是掩码,也就是我们常说的子网掩码。通过子网掩码可以轻松的得到子网地址。那么通过掩码我们就可以轻松的得到多个字节中指定的位的集合。
我们现在有一个需求:获得数x的低n位的集合。
假设 x = 233 n= 6,我们就知道计算方法:233的二进制是 11101001,所以结果集为 11101001&00111111 = 00101001 十进制为 41。在这个计算中233可以轻易改变,但是 00111111 已经指定 n = 6,要可以让n也随意改变怎么办呢?
我们用位运算的思维就可以得到 n = 6 时 00111111 可以表示为 (1 << 6) - 1
那么掩码的计算公式就为:(1 << n) - 1
现在根据需求可以写出模版函数如下:
template
inline Type LowByte(Type x, int n) { return x & ((1 << n) - 1); } //简化 #define LOWBYTE(x,n) x & ((x << n) - 1) 如果是高位集合呢?我们只需要把掩码左移就可以了:n = 6 时 00111111<<2 公式为:((1 << 6) - 1)<<2
template
inline Type HeightByte(Type x, int n) { return x & (((1 << n) - 1) << (sizeof(x)-n)); } //简化 #define HEIGHTBYTE(x,n) x & (((1 << n) - 1) << (sizeof(x)-n))
6、子集
假设我们有一个集合 mask ={‘c’,‘b’,‘a’},要求列出集合的所有子集。我们可以使用位运算思想,把集合的元素的有无看成二进制的0和1那么我们展开举例:
{‘c’,‘b’,‘a’}
0 0 1 1 {‘a’}
0 1 0 2 {‘b’}
0 1 1 3 {‘b’,‘a’}
... ... ...
1 1 1 7 {‘c’,‘b’,‘a’}
二进制 十进制 对应子集
枚举出一个集合的子集。设原集合为mask,则下面的代码就可以列出它的所有子集:
for (i = mask ; i ; i = (i - 1) & mask) ;
很漂很漂亮吧。