Java二进制与运算符知识
经常看到一些Java源码和一些开源算法中常用到|、&、||、&&、>>、<<、>>>这样的符号,一开始的时候对于这些符号也是一知半解的,我们经常用到的也就只是||和&&,那么那么多的符号都具体是什么作用呢?
上述符号中,有一部分是位运算符,要了解位运算符就需要先了解二进制的相关东西,所以我们这次记录、测试一下二进制在计算机的存储方式,以及这些符号的具体作用。
二进制
我们生活中用到的是十进制的计算方法,也就是0123456789,但是计算机中识别的内容都是二进制的,只有0和1。这个知识点是一个程序常识,我们也知道以下知识点:
- int类型4个字节42位,值范围是-2147483648~2147483647
- byte类型1个字节8位,值范围是-128~127
- byte类型的1计算机中表示:00000001
- int 类型的1计算机中表示:00000000 00000000 00000000 00000001
深思一下,可能有以下疑问:
- 为什么byte和int值的范围最小和最大值的绝对值不一样?
- 负数在计算机中怎么表示?
想弄明白以上问题,我们要先理解一下二进制的以下概念:
原码
正数的原码:按照值类型大小换算成二进制数
负数的原码:按照值类型大小绝对值,换算成二进制数,最高位(第一位)补1(写成1)
举例:
一个int类型的4和-4的原码分别表示如下:
00000000 00000000 00000000 00000100
10000000 00000000 00000000 00000100
所以,一个每一个类型的二进制,其最高位是代表这个数的正负,0为正,1为负数。所以对于int类型,原码的表示范围就是:
11111111 11111111 11111111 11111111 ~ 011111111 11111111 11111111 11111111
-2147483647 ~2147483647
反码
反码产生的原因在于,如果在计算机中用源码的话,那么会有一个+0和-0,,同时在进行正负数相加或者正正/负负相减的时候,需要先判断这两个数的绝对值,用绝对值进行加减处理,然后取绝对值大的数的符号位,这样的效率比较低,所以就设计了反码:
正数的反码:正数的反码和原码相同
负数的反码:负数的反码是除去最高位的符号为(1),其他位取反(0变1,1变0)
一个int类型的4和-4的反码分别表示如下:
00000000 00000000 00000000 00000100
11111111 11111111 11111111 11111011
反码是相互的,一个原码A的反码B反过来B的反码就是A。但是还会存在一个+0和-0。
反码求原码的过程倒推一下即可。
补码
基于上述情况,为了解决+0和-0的情况,推出了补码的概念:
正数的补码:正数的补码与原码相同
负数的补码:负数的补码是该负数除最高位符号位(1)外其他位取反,最后一位加1,即反码+1
一个int类型的4和-4的补码分别表示如下:
00000000 00000000 00000000 00000100
11111111 11111111 11111111 11111100
补码求原码的和原码求补码一样,除最高位符号位外,其他各位取反,然后加1。补码规定0没有正负之分
根据以上概念
所以int类型的-1在计算机中表示如下:
1、得到二进制原码
10000000 00000000 00000000 00000001
2、取反码
11111111 11111111 11111111 11111110
3、取补码
11111111 11111111 11111111 11111111
我们来解答上面提到的第一个问题:
- 为什么byte和int值的范围最小和最大值的绝对值不一样?
我们以byte类型来说吧:
byte类型是8位,2的8次方是128,那么128和-128能否用补码表示呢:
128 二进制:原码:11111111,正数补码和原码一样,但是最高位规定是符号为,所以正数补码最大:011111111,即127.
-128 二进制:原码:绝对值:100000000,求反:011111111,加1:100000000,是不是可以用补码表示呀!
所以二进制的补码范围:
100000000 ~ 00000000 ~ 011111111 即 -128~0~127
所以在计算的时候,byte类型的-128-1,最后结果是127。同理,int值的范围是-2147483648 ~2147483647
运算符
了解了二进制的一些知识,我们再来看运算符
或与运算符
- || 或运算符(短路或)
- && 与运算符(短路与)
- | 或运算符(按位或)
- & 与运算符(按位与)
- ^ 异或运算符
||和&& 我们常用,前后都是boolean类型表达式 比如
(1>3)||(4>3) = true (1>3)&&(4>3) = false
|和& 前后可以是bollean类型,也可以是int、byte类型 比如:
3|1=3 (1>3)|(4>3) = true
3&1=1 (1>3)&(4>3) = false
|和&如果前后是数字类型值,计算方式是将两边的值转化为对应的二进制,然后按位或和与
3|1 等价于:
00000011
00000001
以上按位或 (有1必得1,都为0则是0),结果为:
00000011 = 3 所以3&1=1
如果是两边是boolean类型,那么和||以及&&计算逻辑一样,但是:
int i=0;
if(3>2 | (++i)>0) {
i=i+1;
}
System.out.println(i);
//结果为2
int i=0;
if(3>2 || (++i)>0) {
i=i+1;
}
System.out.println(i);
//结果为1
这就是上面说的短路的概念,即||和&& 如果前面的结果(3>2)可以做出判断了,就不会执行后面的(++i)结果了,但是|和&,不管前面结果如何,都会执行后面的判断,然后综合两者结果给出一个判断。
- ^异或运算符
System.out.println(1^0);
System.out.println(1^1);
System.out.println(0^0);
System.out.println(0^1);
//结果
1
0
0
1
同位相同为0,不同为1
顺便说下上面++i和i++ 的区别是 i++是先用再赋值,++i先赋值再判断,比如:
int i=0;
System.out.println((i++)>0);
System.out.println(i);
i=0;
System.out.println((++i)>0);
System.out.println(i);
//结果
false
1
true
1
数字运算的特殊写法
现在我们知道,程序中常用的计算符号:+、-、*、/、%、|、&、^(加、减、乘、除、取余、或、与、异或)
除了简单的 i=1+1这种,还会有:
int i=0;//赋值
i+=1;//i=i+1
i-=1;//i=i-1
i*=1;//i=i*1
i/=1;//i=i/1
i|=1;//i=i|1
i&=1;//i=i&1
i%=1;//i=i%1
i^=1;//i=i^1
其他运算符
首先别忘了计算机中存在的是补码哦
byte的-6在计算机中二进制是:11111010不是10001010
-
<< 左移运算符
a<
6<<2 00000110 向左移动2位,后位补0:00011000 结果是:24 =6*2的2次方(一般来说是a乘以2的b次方)
-6<<2 结果是-24(11111010左移两位,高位不变:11101000 原码为:10011000)
但是 a乘以2的b次方不是通用的,如:
Integer.MIN_VALUE<<2 结果是0(和Integer.MAX_VALUE+1或者Integer.MIN_VALUE-1一样)
-
>> 右移运算符
a>>b 把a的二进制位向右移动b位,左边补0,最高位符号位不变
6>>2 00000110 向右移动2位,前位补0:00000001 结果是:1 =6/2的2次方取正数位(一般来说是a除以2的b次方)
-6>>2 结果是-1
-
~(取反运算符)
~a a的二进制,取反,0变1,1变0
~6 00000110 取反:11111001(这是补码),原码:10000110+1=10000111 结果是:-7
~-6的结果是:5
~Integer.MAX_VALUE=Integer.MIN_VALUE
~Integer.MIN_VALUE=Integer.MAX_VALUE
-
>>>(无符号右移运算符)
a>>>b 把a的二进制位向右移动b位,左边补0,最高位符号位补0(这点和>>不一样哦)
6>>>2 结果是2
-6>>>2 结果是1073741822 (int类型的)
-6补码: 11111111111111111111111111111010
无符号右移2位:00111111111111111111111111111110
转化源码: 00111111111111111111111111111110 (正数的补码和原码一样哦)
int值为:1073741822
以上,比较绕,建议反复揣摩并写手写实验。