精度计算整理

由于最近在开发交易所，里边涉及到金钱的计算，因此整理了一下单精度、双精度做计算的坑。如果最大值以及最小单位能够确定的话，那么建议将小数计算换成整数计算，比如比特币用int64来表示交易的金额，小数部分通过整数除法换算。

一、IEEE754规定：

1）单精度浮点数字长32位，尾数长度23，指数长度8，指数偏移量127；双精度浮点数字长64位，尾数长度52，指数长度11，指数偏移量1023；

2）约定小数点左边隐含有1位，通常这位数是1，所以上述单精度尾数长度实际为24(默认省略小数点左边的1则为23)，双精度尾数长度实际为53（默认省略小数点左边的1则问53）；

数符（sign）阶码（exponent）尾数（fraction）总位数偏移值

单精度 1 8 23 32 127

双精度 1 11 52 64 1023

举例：将176.0625表示为单精度

1）整数部分176转换为二进制为10110000

小数部分.0625转换为二进制为0001

所以176.0625转换为二进制为10110000.0001

2）由于IEEE754约定小数点左边隐含1位，因此1011000.0001 = 1.01100000001 * 2^7

指数偏移为7 + 127 = 134，即10000110

尾数23位，即01100000001000000000000

因此得到IEEE754格式化后的表示0 10000110 01100000001000000000000

（PS：单精度能表达的最大值形式：0 11111111 11111111111111111111111）

二、尾数位数限制带来的精度误差：

无论是整数还是小数都会产生误差。

以单精度整数为例。由于尾数为23位，加上隐含的1位‘1’，因此24位1的二进制表示的十进制为16777215，单精度表示为1001011011111111111111111111111。

那么16777216的二进制为1000000000000000000000000，单精度表示为1001011100000000000000000000000。最后一个0被抛弃，很幸运，此时还是没有误差的。

那么16777217的二进制为1000000000000000000000001，单精度表示为1001011100000000000000000000000。最后一个1被抛弃，此时，产生了误差。

三、为什么不能用float和double做精确计算：

因为尾数位数限制会导致精度误差。

举例如下：

1.内存里实际的值

float c = 5.1;

cout.precision(30); //不设置精度，输出会被四舍五入截断，看上去没有误差了

cout

输出：5.09999999999999964472863211995

2.整数误差

float d= 16777217;

double dd = d+ 2f;

System.out.println(dd); //输出：1.6777218E7

而我们期望的值是1.6777219E7

3.小数误差

System.out.println(1.1 + 0.8); //输出1.9000000000000001

而我们期望的值是1.9

四、如何做精确计算

原理很简单，就是用字符串做计算，而不是float或者double直接或者间接计算。

Java里可以使用BigDecimal类，c/c++可以使用mpdecimal库。

举例：

会产生误差的直接计算，这种跟直接运算符计算没有差别。如果BigDecimal实现的精度更高，只会减少误差，无法消灭：

BigDecimalb1 = new BigDecimal(v1);

BigDecimalb2 = new BigDecimal(v2);

b1.add(b2).doubleValue();

会产生误差的间接计算，这种依然无法避免16777217这种截断误差：

BigDecimalb3 = newBigDecimal(Float.toString(v1));

BigDecimalb4 = newBigDecimal(Float.toString(v2));

b3.add(b4).doubleValue();

计算过程不会产生误差的方法：

BigDecimal b5 = new BigDecimal(“16777217”);

BigDecimal b6 = new BigDecimal(“2”);

B5.add(b6).doubleValue();

注意：这三种情况最后转换为double的时候都可能产生误差，除非继续转变为字符串使用。

精度计算整理

你可能感兴趣的:(精度计算整理)