精度计算整理

由于最近在开发交易所,里边涉及到金钱的计算,因此整理了一下单精度、双精度做计算的坑。如果最大值以及最小单位能够确定的话,那么建议将小数计算换成整数计算,比如比特币用int64来表示交易的金额,小数部分通过整数除法换算。

一、IEEE754规定:

    1)单精度浮点数字长32位,尾数长度23,指数长度8,指数偏移量127;双精度浮点数字长64位,尾数长度52,指数长度11,指数偏移量1023;

    2)约定小数点左边隐含有1位,通常这位数是1,所以上述单精度尾数长度实际为24(默认省略小数点左边的1则为23),双精度尾数长度实际为53(默认省略小数点左边的1则问53);

            数符(sign)    阶码(exponent)   尾数(fraction)         总位数        偏移值

单精度       1                          8                             23                          32              127

双精度       1                         11                            52                           64             1023


举例:将176.0625表示为单精度

1)整数部分176转换为二进制为10110000

     小数部分.0625转换为二进制为0001

     所以176.0625转换为二进制为10110000.0001

2)由于IEEE754约定小数点左边隐含1位,因此1011000.0001 = 1.01100000001 * 2^7

     指数偏移为7 + 127 = 134,即10000110

     尾数23位,即01100000001000000000000

因此得到IEEE754格式化后的表示0 10000110 01100000001000000000000

(PS:单精度能表达的最大值形式:0 11111111 11111111111111111111111)


二、尾数位数限制带来的精度误差:

无论是整数还是小数都会产生误差。

      以单精度整数为例。由于尾数为23位,加上隐含的1位‘1’,因此24位1的二进制表示的十进制为16777215,单精度表示为1001011011111111111111111111111。

      那么16777216的二进制为1000000000000000000000000,单精度表示为1001011100000000000000000000000。最后一个0被抛弃,很幸运,此时还是没有误差的。

      那么16777217的二进制为1000000000000000000000001,单精度表示为1001011100000000000000000000000。最后一个1被抛弃,此时,产生了误差。


三、为什么不能用float和double做精确计算:

因为尾数位数限制会导致精度误差。

举例如下:

1.内存里实际的值

    float c = 5.1;

    cout.precision(30); //不设置精度,输出会被四舍五入截断,看上去没有误差了

    cout

输出:5.09999999999999964472863211995


2.整数误差

  float d= 16777217;

  double dd = d+ 2f;

  System.out.println(dd); //输出:1.6777218E7

而我们期望的值是1.6777219E7


3.小数误差

  System.out.println(1.1 + 0.8); //输出1.9000000000000001

而我们期望的值是1.9


四、如何做精确计算

原理很简单,就是用字符串做计算,而不是float或者double直接或者间接计算。

Java里可以使用BigDecimal类,c/c++可以使用mpdecimal库。

举例:

会产生误差的直接计算,这种跟直接运算符计算没有差别。如果BigDecimal实现的精度更高,只会减少误差,无法消灭:

        BigDecimalb1 = new BigDecimal(v1);  

        BigDecimalb2 = new BigDecimal(v2);

        b1.add(b2).doubleValue();

会产生误差的间接计算,这种依然无法避免16777217这种截断误差:

        BigDecimalb3 = newBigDecimal(Float.toString(v1));  

        BigDecimalb4 = newBigDecimal(Float.toString(v2));

        b3.add(b4).doubleValue();

计算过程不会产生误差的方法:

       BigDecimal b5 = new BigDecimal(“16777217”);  

       BigDecimal b6 = new BigDecimal(“2”);

       B5.add(b6).doubleValue();

注意:这三种情况最后转换为double的时候都可能产生误差,除非继续转变为字符串使用。

你可能感兴趣的:(精度计算整理)