整数的二进制表示

基本概念

首先要明白原理,需要明白一个数学概念--映射:
对于一串二进制数字x,通过映射关系F,可以求得唯一结果F(x),在这里,F(x)就是我们要使用二进制数据表示的数据。
因此对于数据y,要求得其基于F的二进制表示,有x=F-1(y)。而对于同一串二进制数字x,使用不同的映射关系可以得到不同的最终数据。
上面的表述即是二进制数字表示法的原理,按照定义,数据为二进制数字加上上下文的表述结果,在这里,上下文即表示映射关系F。

字符串数据的表示方法

字符串映射,二进制数据是如何被映射到我们日常使用的字符串的:
字符串映射的原理很简单,对于每一个字符,都有唯一对应的一串二进制数字,这样的映射关系的集合,我们称之为字符集(例如ASCII、UTF-8)。因此将二进制数字转换为字符串只是在字符集中查找,映射的过程,反之也一样。

整数的表示方法

目前较普遍使用的整数映射方式主要有两种:

  1. 无符号整数映射,该映射方式只能表示正数
    对于一串二进制数据,很自然的对应着一个二进制数字,因此对于无符号整数映射来说,映射规则即是二进制数字的表示规则,关于二进制数字的内容请另行查找资料。
    按照二进制数字的计算规则,对于一串n位二进制数字[wn-1 wn-2 … w1w0]2,其表示整数的求值公式为:

[待补充]

  1. 带符号整数映射,该映射方式可以表示正数和负数
    要表示一个带符号的二进制数字,最直接的方式便是通过一个符号标志位,表示正数的正负,而具体的整数值沿用上述无符号整数的计算规则。因此,对于一串n位二进制数字[wn-1 wn-2 … w1w0]2,其带符号整数的求值公式为:

[待补充]

但是目前普遍使用的带符号整数的映射方式并不使用这种在我们理解上很直观的方式,而是采用了一种让整数计算更高效,且能直接的简化计算规则的映射方式,我们称之为补码表示法。

对于一个8位二进制数字[0000 0001],我们仍然可以认为其最左的二进制位位符号位,其中0表示正数,1表示负数。而对于正数,仍然适用公式[图片上传失败...(image-e08ff1-1527469658119)] ,因此上述的二进制数字值为1。但当表示负数时,却不适用上面规则,即-1不能表示为[1000 0001],而是以[0000 0001]的补码表示-1。

补码的计算规则很简单,我们先来看一个例子:

对于一个short类型的数字1,其对应的二进制数字为:

[0000 0000 0000 0001]

补码为:

[1111 1111 1111 1111]

计算结果似乎有点奇怪,我们先看补码的具体计算过程:

当计算[0000 0000 0000 0001]的补码时,我们先对其求反,计算结果为:

[1111 1111 1111 1110]

再对上面的求反结果加一得到最终结果:

[1111 1111 1111 1111]

补码的计算方式相当简单,但是为什么要使用补码来表示负数,我们需要明白几个概念:

CPU从内存读写数据,而内存在存储数据的时候,以8位为一字节作为最小数据单元[1],因此计算机在表示数据时也需要以字节为最小单位,因为数据最终都需要被加载到内存中才能被CPU使用。

计算机可以使用的内存是有限的,因此我们总是希望能够以满足需要的最少字节数表示我们的数据,因此在进行数学计算时,因为数字是以固定长度的二进制数字进行表示的,当计算结果的长度大于原始数字的长度时,计算结果会被截取,这时我们称之为数值溢出。

考虑两个无符号8位二进制数字进行加法运算:

[0000 0001] + [1111 1111]

根据数学计算法则,结果应为:

[0000 0001] + [1111 1111] = [1 0000 0000]

但是由于使用8位进行数字表示,计算机会直接截取靠右8位作为最终结果,即,在计算机中进行以上的8位加法运算,结果应该是:

[0000 0001] + [1111 1111] = [0000 0000]

而根据数学公式,x – x = 0,我们可以得出,[0000 0001]的负数即为[1111 1111],刚好是前者的补码。

回顾补码的计算规则,计算补码的时候要先对原数进行求反操作,先考虑一位数值,有下表:

二进制数字(w) 求反结果(~w) 和(w+~w)
1 0 1
0 1 1

因此,对于任意的n位二进制数字:

[wn-1 wn-2 … w1w0]2

求反后将得到:

[~wn-1 ~wn-2… ~w1~w0]2

两数相加,刚好就是:

[11…11]2

在此基础上加一, 将发生进位,即数值会溢出,因此计算结果为:

[00…00]2(截取后)

因此,可得出,使用计算机进行计算时,一个二进制数加上该数的补码的结果为0,因此我们可以在计算机上使用一个二进制数的补码表示该数的负数。
此时,对于二进制数字[wn-1 wn-2 … w1w0]2 ,其求值公式为:

[待补充]

但是,为什么要使用补码来表示负数?或者说使用补码代码了什么好处?

[待补充]

注:
[1] 计算机是做为一种科研工具被研发出来的,很自然的,科学家们希望能够辅助进行各种大数值的科学计算,这个时候单一的位并没有意义,因此二进制数字是成组的被使用的。但是初时并不都是以8位为一字节的标准,而是各种位制的并存。最终由IBM公司根据实际情况推出了8位为一字节的数据表示单位,并逐渐成为现在公认的标准。

你可能感兴趣的:(整数的二进制表示)