提示:我的父亲从我出生起便认识我,可他对我的了解却那么少,真实奇怪啊。 --C·S·路易斯《惊喜之旅》
位运算是计算机的核心基础,数据的便是和计算几乎都少不了,在JVM以及很多高性能代码中大量使用,甚至很多算法本身就是基于位进行的。在算法方面,很多位相关的算法都很有技巧,不学不知道。另外很多算法看起来与位运算无关,但是通过位运算操作优化一下,性能会提高不少,感兴趣的同学,接着往下看吧。
在学习位操作之前,我们先明确数据在计算机中怎么表示的。我们明确了,原码、反码和补码的概念和便是方法之后我们再来看位运算的相关问题。
机器数:一个数载计算机中的二进制表示形式,叫做这个数的机器数。机器数是导游符号的,在计算机用一个数的最高位存放符号,正数为0,负数为1。比如,十进制中数+3,在计算机中长度为8位,转换成二进制就是0000 0011.如果是-3,就是1000 0011。这里的0000 0011和1000 0011就是机器数。
真值:因为机器数第一位是符号位,所以机器数的形式值就不等于真正的数值。比如上面说的有符号数的1000 0011,其最高位1代表负,其真值是 - 3而不是形式值(131【1000 0011】)。所以,为了号区别,将带有符号位的机器数对应的真值数称为机器数的真值。例:1000 0011的真值 = - 000 0011 = -3,0000 0011的真值 = + 000 011 = + 3.
计算机对机器数的表示进一步细化:原码、反码、补码。
原码:就是说符号位加上真值的绝对值,即用第一位表示符号,其余位表示值,比如如果是8位二进制:
[+1]原 = 0000 0001
[-1]原 = 1000 0001
第一位是符号位,因为第一位是符号位,所以8位二进制的取值范围就是:
[1111 1111,0111 1111],也就是【-127,127】
反码:就是说正数的反码是其本身,而负数的反码是其原码的基础上,符号位不变,其余各个位取反。例如:
[+1] = [0000 0001]原 = [0000 0001]反
[-1] = [1000 0001]原 = [1111 1110]反
可见如果一个反码便是的是负数,人脑无法直观的看出它的数值,通常要将其转化成原码再计算。
在应用中,因为补码能保持加和减运算的统一,一次应用更广泛,便是方法就是:
[+1] = [0000 0001]原 = [0000 0001]反 = [0000 0001]补
[-1] = [1000 0001]原 = [1111 1110]反 = [1111 1111]补
对于负数,补码表示方式也是人脑无法直观的看出其数值的,通常也需要转换成原码再计算器数值。
既然原码就能表示数据,为什么实际软件中更过使用的是补码呢?我们接着往下看。
现在我们知道了计算机可以有三种编码方式表示一个数,对于正数因为有三种编码方式的结果都相同:
[+1] = [0000 0001]原 = [0000 0001]反 = [0000 0001]补
但是对于负数:
[-1] = [1000 0001]原 = [1111 1110]反 = [1111 1111]补
可见原码、反码和补码完全不同。既然原码才能被人脑直接识别并用于计算表示方式,可我为什么还有反码和补码呢?
首先,因为人脑可以知道第一位是符号位,在计算的时候会根据符号位选择对真值区域的加减。但是计算机要辨别“符号位”就必须获取全部的位的数据才可以,显然会让计算机的基础电路设计变得十分复杂!于是人们相处了将符号位也参与运算的方法。我们知道,根据计算法则减去一个正数等于加上一个负数,即 1 - 1 = 1 + (-1) = 0,所以机器可以只有加法而没有减法,这样计算机运算的设计就更简单了,于是人们开始探索让符号参与运算,并且只保留加法的方法。
看一个栗子,计算十进制的表达式:1 - 1 = 0,首先看原码的表示:
1 - 1 = 1 + (-1) = [0000 0001]原 + [1000 0001]原 = [1000 0010]原 = -2
如果用原码便是让符号位也参与计算,显然对于减法来说,结果是不正确的,这也是为何计算机内部不能使用原码表示一个数。
为了解决原码做减法的问题就出现了反码,此时计算十进制的表达式位:1 - 1 = 0
1 - 1 = 1 + (-1)
= [0000 0001]原 + [1000 0001]原
= [0000 0001]反 + [1111 1110]反
= [1111 1111]反
= [1000 0000]原
= - 0
可以看到用反码计算结果的真值部分是正确的,但是“0”的表示有点奇怪,+0和-0是一样的,而且0带符号是没有任何意义的,而且还要浪费[0000 0000]原和[1000 0000]原两个编码来表示0。于是补码的出现,解决了0的符号以及两个编码的问题:
1 - 1 = 1 + (-1)
= [0000 0001]原 + [1000 0001]原
= [0000 0001]补 + [1111 1111]补
= [0000 0000]补
= [0000 0000]原
这样0用[0000 0000]表示,而以前出现的-0则不存在了,而且可以用[1000 0000]表示-128:
-1 - 127 = -1 + (-127)
= [1000 0001]原 + [1111 1111]原
= [1111 1111]补 + [1000 0001]补
= [1000 0000]补
-1-127的结果应是-128,我们正好可以用[1000 0000]来表示-128,这样使用补码的范围就可以扩大为[-128,127],这里刚好比原码的[-127,127]好。拓展一下,对于编程中常用到的32位int类型,可以表示的范围是[-231,231 - 1],这是我们经常见到的定义方式。
这个章节主要学习一下二进制,这里要好好学上面的知识,牢记掌握。⭐⭐⭐⭐
计算机采用的是二进制,二进制包括两个数码:0,1。在计算机的底层,一切运算都是基于位运算实现的,所以研究清楚位运算可以帮助我们对于基础原理有进一步加深。
在算法方面,不少题目都是基于位运算拓展而来的,而且还有一定的技巧,如果不是提前学一学,面试的时候是很难想到的。
位运算主要有:与,或、异或、取反,左移和右移。其中左移和右移统称为移位运算,移位运算又称为算术移位和逻辑移位。
与运算的符号是&,运算规则是:对于二进制位,当两个数对应的位都为1时,结果才为1,否则结果为0。
0 & 0 = 0
0 & 1 = 0
1 & 0 = 0
1 & 1 = 1
或运算的符号是|,运算规则是:对于每个二进制位,当两个数对应的位都为0时,结果才是0,否则结果为1。
0 | 0 = 0
0 | 1 = 1
1 | 0 = 1
1 | 1 = 1
异或运算的符号时^(在代码中表示),运算规则时:对于每个二进制位,当两个数对应的位相同时,结果为0,否则结果为1。
0 ^ 0 = 0
0 ^ 1 = 1
1 ^ 0 = 1
1 ^ 1 = 0
取反运算的符号时~,运算规则是:对于一个数的每个二进制位进行取反操作,0 变成1,1变成 0。
~ 0 = 1
~ 1 = 0
我们做一下测试,来检测一下你的掌握程度:
46的二进制表示[0010 1110], 51的二进制表示是[0011 0011]。考虑以下的位运算结果。
46 & 51 的结果是 34
[0010 1110]
[0011 0011]
[0010 0010] 34
46 | 51 的结果是 63
[0010 1110]
[0011 0011]
[0011 1111] 63
46 ^ 51 的结果是 29
[0010 1110]
[0011 0011]
[0001 1101] 29
~ 46 的结果是
[0010 1110]原
[0010 1110]反
[0010 1110]补 (运算)
[1101 0001]
[1101 0000]反
[1010 1111]原 -47
~ 51 的结果是
[0011 0011]原
[0011 0011]反
[0011 0011]补 (运算)
[1100 1100]
[1100 1011]反
[1011 0100]原 有问题
移位运算按照移位的方向可以划分为左移和右移,按照是否带有符号分类可以分为算数移位和逻辑移位。
原始:[0000 0110] 6
右移一次:[0000 0011] 3 相当于除以2
左移一次:[0000 1100] 12 相当于乘以2
6*3 = 6*(2 + 1) = 6 * 2 + 6 * 1
66 * 33 = 66 * (32 + 1) = 66*32 + 66 * 1
左移运算的符号是<<,左移运算时,将全部二进制位向左移动若干位,高位丢弃,低位补0.对于左移运算,算术移位和逻辑移位时相同的。
右移运算的符号时>>,右移运算时,将全部的二进制位向右移动若干位,低位丢弃,高位的补位由算数移位和逻辑移位决定:
一下栗子显示位移运算的结果,检验你是否过关,参与运算的数组都采用有符号8位二进制表示:
29的二进制表示[0001 1101]。29左移2位的结果是 116,对应的二进制表示[0111 0100];29左移3位的结果是-24表示[1110 1000]
[1110 1000] 补
[1110 0111] 反
[1001 1000] 原 -24
50的二进制表示是[0011 0010]。右移1位的结果是25[0001 1001];右移2位的结果是12[0000 1100]。所以对于正数和0,算术右移和逻辑右移的结果是相同的。
-50的二进制表示是[1011 0010] 补码[1100 1011],右移2位的结果是-13[1111 0011]; -50逻辑右移2位的结果是51,对应的二进制表示[0011 0011].【没完全理解】
右移运算中的算术移位和逻辑移位是不同的,计算机内部的右移运算采用的是哪一种呢?
从上面的栗子观察,移位运算可以实现乘除的操作。由于计算机的底层的一切运算都是基于位运算实现的,因此,使用移位运算实现乘除的效率显著高于直接乘除法的。
左移运算对应乘法运算。将一个数左移k位,就等价于将这个数乘以2^k。例如:29左移2位的结果是116,等价于29*4。当乘数不是2的整数次幂,可以将乘数拆成若干项2的整数次幂之和,例如:a * 6 等价于(a << 2)+(a << 1),乘法运算都可以用左移运算实现,但是需要注意溢出的情况,例如8位二进制表示下29左移3位,就会出现溢出。
算数右移运算对应除法运算,将一个数右移k位,相当于将这个数除以2^k。例如。50右移2位的结果是12,等价于50/4,结果是向下取整。
从程序实现的角度,考虑程序中的整数除法,是否可以说将一个数(算数)右移k位,和将这个数除以2^k等价?对于0和正数,上述的说法是成立的,整数除法是向0取整,右移运算是向下取整,也是向0取整。但是对于负数,上述的说法就不成立了,整数除法是向0取整,右移运算时向下取整,两者就不相同了。比如:(-50) >> 2 的结果时-13,而(-50)/ 4 的结果时 -12,两者是不等的。因此要考虑一个数(算术)右移k位,和将这个数除以2^k是不等价的。算法出题也想到了这一点,因此大部分算法题目都是将测试数据限制在正数和0的情况,因此可以放心的左移和右移。
位运算的性质有很多,此处记录一些常见的性质,假设一下出现的变量都是有符号的整数
根据上面的性质呢,还可以有很多小工具:
处理位操作时,还有很多技巧,切莫死记硬背,理解其原理解决相关问题才有用。举个例子:
1s和0s分别代表与x等长的一串1和一串0:
x ^ 0s = x x ^ 1s = ~x x ^ x = 0
x & 0s = 0 x & 1s = x x & x = x
x | 0s = x x | 1s = 1s x | x = x
而获取、设置、更新某个数数据,也有固定的套路的。
获取:
该方法将1左移i位,得到形如[0001 0000]的值。接着对这个数与num执行“位于”操作,从而将i位之外的所有位清零,最后检查该结果是否位零,不为零说明i位为1,否者说明i位为0
public boolean getBit(int num, int i){
return ((num & (1<<i)) != 0);
}
设置(将某一位设置为1)
该方法将1左移i位,得到形如[0000 1000]的值,接着对这个值和num执行“位或”操作,这样只会改变i的数据。这样除i位以为均不发生变化,且i位被设置位1。
public int setBit(int num,int i){
return num | (1 << i);
}
清零(将某一位设置为0)
该方法与setBit相反,首先将1左移i位获得形如[0000 1000]的值,对这个值取反而得到形如[1111 0111]的值,直接对该值和num执行“位于”操作,故不会影响到num的其他位,只会清零i位。
public int clearBit(int num,int i){
int mask = ~(1 << i);
return nums & mask;
}
更新
该方法是将setBit和clearBit合为一个方法,首先是将形如[1111 0111]的值将num的第i位清零。接着将待写入的值v左移i位,得到一个i位为v的但是其余位都为0的数,最后对之前的结果执行“位或”操作,将v位1的这个与num的i位更新位1,否则为0;
public int updateBit(int num,int i ,int v){
int mask = ~(1 << i);
return (num & mask) | (v << i);
}
提示:认识位运算;位运算由来;计算机原理;计算机基础;位运算小技巧