今天在学习Python核心编程的时候,十进制浮点数那段看到一个有趣的事情。
>>>0.1
0.1000000000000001
为什么会这样?
这是因为Python语言的浮点型实现遵守IEEE754规范。Python是使用其中53位用做指数偏移值,因此浮点值只能有53位精度,类似这样的值用二进制表示只能像上面那样被截断。根据IEEE754规范,0.1的二进制表示是1.100110011001100110011001…*2-4 ,因为它最接近的二进制近似值是0.0001100110011…,或1/16+1/32+1/256+…
意思就是四舍五入之后就变成0.1000000000000001了,上面这段话你很可能看得似懂非懂。
后来Python的更新解决了上述情况,将代码截断输出,我在Python 3跟Python2.7中都试过,并没有上述所说的这种问题。
但你可以试下
3 * 0.1 == 0.3
这段代码输出为False
要解答上面这个0.1的输出,咱们就需要一步步来了。
第一步,先把 0.1 转成二进制
整数转二进制大家肯定都知道的,这个就不说了,但是小数部分怎么转可能还是有些同学不知道。没关系,附上链接:二进制十进制间小数怎么转换
0.1 = 1/16 + 1/32 + …
我简单画个图,后面的位自己补上。
二进制 | 1/2 | 1/4 | 1/8 | 1/16 | 1/32 | 1/64 | 1/128 | 1/256 | 1/512 | 1/1024 | 1/2048 | … |
---|---|---|---|---|---|---|---|---|---|---|---|---|
值 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 1 | 0 | 0 |
根据上面的方法继续往下算可以知道十进制0.1的二进制就是0.00011001100110011…,移码后就是
1.100110011001100110011001…*2-4
在转码的时候由于位数限制,后面部分精度被丢弃,也就是53位之后的精度,而这部分丢弃的位继而导致在转回10进制的时候精度丢失。
有兴趣额了解的 IEEE 754 的同学可以看第二、三步,也可直接跳过。
第二步,大概了解下IEEE 754
IEEE 754 标准是IEEE二进位浮点数算术标准(IEEE Standard for Floating-Point Arithmetic)的标准编号,IEEE 754 标准规定了计算机程序设计环境中的二进制和十进制的浮点数自述的交换、算术格式以及方法。
参考:
百度百科 IEEE 754
维基百科 IEEE 754
这里引用一段阮一峰的网络日志
根据国际标准IEEE 754,任意一个二进制浮点数V可以表示成下面的形式:
(1) (-1)s 表示符号位,当s=0,V为正数;当s=1,V为负数。
(2) M表示有效数字,大于等于1,小于2。
(3) 2 E 表示指数位。
举例来说,十进制的5.0,写成二进制是101.0,相当于1.01×22。那么,按照上面V的格式,可以得出s=0,M=1.01,E=2。
十进制的-5.0,写成二进制是-101.0,相当于-1.01×22。那么,s=1,M=1.01,E=2。
IEEE 754规定,对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。
对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。
IEEE 754对有效数字M和指数E,还有一些特别规定。
前面说过,1≤M<2,也就是说,M可以写成1.xxxxxx的形式,其中xxxxxx表示小数部分。IEEE
754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。至于指数E,情况就比较复杂。
首先,E为一个无符号整数(unsigned
int)。这意味着,如果E为8位,它的取值范围为0255;如果E为11位,它的取值范围为02047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE
754规定,E的真实值必须再减去一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。比如,210的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。
然后,指数E还可以再分成三种情况:
(1)E不全为0或不全为1。这时,浮点数就采用上面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。
(2)E全为0。这时,浮点数的指数E等于1-127(或者1-1023),有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字。
(3)E全为1。这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s);如果有效数字M不全为0,表示这个数不是一个数(NaN)。
第三步,把十进制 0.1 用32位bit位表示
0.1的二进制是1.100110011001100110011001…*2-4
根据公式
正数符号位为0;省略第一位的1,M为100110011001100110011001;E=-4+127=123,二进制表示为
可以得出 s=0,M=100 1100 1100 1100 1100 1100,E=0111 1011
所以写成二进制形式是
0 10011001100110011001100 01111011
第四步,二进制转回十进制
这个怎么转回10进制呢?刚刚十进制转二进制是乘2得出每一位,那现在就是反过来,每一位除以2加起来就是了。
刚刚说的0.1的二进制
0.0001100110011…
转回十进制大概是这样
1*(2-4)+1*(2-5)+1*(2-8)+1*(2-9)+1*(2^-11)+…
由于53位之后的1被丢弃了,所以换算回十进制的时候导致精度不准确,算出来的结果会根据不同编程语言跟变量类型有所差异,多数情况下与原来输入不同。
所以在编程的时候一定要注意浮点型的应用。建议在语言具备 decimal 类型的情况下选择 decimal 。
由于 decimal 类型是将小数在十进制下移位成整数存储,所以规避了上述问题。比如上述 0.1,decimal 类型会移位成 1 * 101, 分别存储整数部分 1 与 指数部分 1。