浅谈浮点数运算的误差

测试程序

我们知道,浮点数运算存在舍入误差。在某些特殊的情况下,舍入误差还可以累计到非常大的地步。让我们来看一下测试程序吧:

 1 using System;
 2  
 3 static class DecimalSumTester
 4 {
 5   static void Main(string[] args)
 6   {
 7     try
 8     {
 9       var n = (args.Length > 0) ? int.Parse(args[0]) : 10;
10       for (var i = 0; i < 3; i++) Console.WriteLine(F(n, i));
11     }
12     catch (Exception ex) { Console.WriteLine(ex.Message); }
13   }
14     
15   static decimal F(int n, int k)
16   {
17     var z = 0.1m + k * 1000000000000000000000000000m;
18     var w = decimal.Round(z) / 2;
19     while (n-- > 0) z += z / 2 - w;
20     return z - w * 2;
21   }
22 }

在这个程序中:

  • 第 19 行通过 while 循环不断进行累加: z += z / 2 - w; 。w 是不变的,而 z 是通过不断累加而增大的。
  • 第 9 行读取命令行参数作为 n 的值来决定 while 循环次数。
  • 第 15 至 21 行的 F 方法第一个参数 n 就是循环次数。第二个参数 k 决定累加初值的整数部分的大小。
  • 在这个程序中参数 k 仅取 0、1 和 2 三种情况。如果算术运算没有误差的话,这三种情况下 F 方法的返回值应该一样。

在 Linux 中编译和运行

在 Arch Linux 64-bit 操作系统的 Mono 3.0.4 环境下编译和运行:

work$ dmcs DecimalSumTester.cs
work$ mono DecimalSumTester.exe 24
1683.4112196028232574462890625
2730.9
2730.9

上述结果中第一行是计算出来的准确值。第二行和第三行的值理论上应该等于第一行。但是由于浮点数运算的舍入误差累计的结果,最终答案的误差相当大。在我的上一篇随笔“浅谈 System.Decimal 结构”中提到,decimal 的算术运算在 Linux 环境下的舍入规则是四舍五入,这可能导致误差累计得比较大。而在 Windows 环境下的舍入规则是四舍六入五向偶。那么我们就接着往下看吧。

在 Windows 中编译和运行

在 Windows 7 SP1 32-bit 操作系统的 Microsoft .NET Framework 4.5 环境下编译和运行:

D:\work> csc DecimalSumTester.cs
Microsoft(R) Visual C# 编译器版本 4.0.30319.17929
用于 Microsoft(R) .NET Framework 4.5
版权所有 (C) Microsoft Corporation。保留所有权利。
D:\work> DecimalSumTester 24
1683.4112196028232574462890625
2097.9
0.1

这个运行结果和在 Linux 环境下大不相同。但是误差也是相当的大。

调试程序

让我们来看看在运算过程中发生了什么吧。在上述测试程序中插入一些调试语句:

 1 using System;
 2  
 3 static class DecimalSumDebug
 4 {
 5   static void Main(string[] args)
 6   {
 7     var n = (args.Length > 0) ? int.Parse(args[0]) : 10;
 8     for (var i = 0; i < 3; i++)
 9       Console.WriteLine(F(n, i).ToString().PadRight(77, '-'));
10   }
11     
12   static decimal F(int n, int k)
13   {
14     var z = 0.1m + k * 1000000000000000000000000000m;
15     var w = decimal.Round(z) / 2;
16     for (decimal x, y; n-- > 0; z += x)
17     {
18       x = (y = z / 2) - w;
19       Console.WriteLine("{0,-30}: {1,-30}: {2}", z, y, x);
20     }
21     return z - w * 2;
22   }
23 }

这个程序和前面的测试程序的功能是相同,仅仅是运算过程中增加输出中间变量的值的语句。

在 Linux 中调试

在 Arch Linux 的 Mono 环境下编译和运行,输出一大堆调试信息:

work$ dmcs DecimalSumDebug.cs
work$ mono DecimalSumDebug.exe 10
0.1                           : 0.05                          : 0.05
0.15                          : 0.075                         : 0.075
0.225                         : 0.1125                        : 0.1125
0.3375                        : 0.16875                       : 0.16875
0.50625                       : 0.253125                      : 0.253125
0.759375                      : 0.3796875                     : 0.3796875
1.1390625                     : 0.56953125                    : 0.56953125
1.70859375                    : 0.854296875                   : 0.854296875
2.562890625                   : 1.2814453125                  : 1.2814453125
3.8443359375                  : 1.92216796875                 : 1.92216796875
5.76650390625----------------------------------------------------------------
1000000000000000000000000000.1: 500000000000000000000000000.05: 0.05
1000000000000000000000000000.2: 500000000000000000000000000.1 : 0.1
1000000000000000000000000000.3: 500000000000000000000000000.15: 0.15
1000000000000000000000000000.5: 500000000000000000000000000.25: 0.25
1000000000000000000000000000.8: 500000000000000000000000000.4 : 0.4
1000000000000000000000000001.2: 500000000000000000000000000.6 : 0.6
1000000000000000000000000001.8: 500000000000000000000000000.9 : 0.9
1000000000000000000000000002.7: 500000000000000000000000001.35: 1.35
1000000000000000000000000004.1: 500000000000000000000000002.05: 2.05
1000000000000000000000000006.2: 500000000000000000000000003.1 : 3.1
9.3--------------------------------------------------------------------------
2000000000000000000000000000.1: 1000000000000000000000000000.1: 0.1
2000000000000000000000000000.2: 1000000000000000000000000000.1: 0.1
2000000000000000000000000000.3: 1000000000000000000000000000.2: 0.2
2000000000000000000000000000.5: 1000000000000000000000000000.3: 0.3
2000000000000000000000000000.8: 1000000000000000000000000000.4: 0.4
2000000000000000000000000001.2: 1000000000000000000000000000.6: 0.6
2000000000000000000000000001.8: 1000000000000000000000000000.9: 0.9
2000000000000000000000000002.7: 1000000000000000000000000001.4: 1.4
2000000000000000000000000004.1: 1000000000000000000000000002.1: 2.1
2000000000000000000000000006.2: 1000000000000000000000000003.1: 3.1
9.3--------------------------------------------------------------------------

上述结果中第一组是准确值,没有发生舍入误差。后两组的舍入情况不同,但最终结果居然一样。至于为什么进行这样的舍入,请参阅我的上一篇随笔。

在 Windows 中调试

在 Windows 的 .NET Framework 中编译和运行,也输出一大堆调试信息:

D:\work> DecimalSumDebug 10
0.1                           : 0.05                          : 0.05
0.15                          : 0.075                         : 0.075
0.225                         : 0.1125                        : 0.1125
0.3375                        : 0.16875                       : 0.16875
0.50625                       : 0.253125                      : 0.253125
0.759375                      : 0.3796875                     : 0.3796875
1.1390625                     : 0.56953125                    : 0.56953125
1.70859375                    : 0.854296875                   : 0.854296875
2.562890625                   : 1.2814453125                  : 1.2814453125
3.8443359375                  : 1.92216796875                 : 1.92216796875
5.76650390625----------------------------------------------------------------
1000000000000000000000000000.1: 500000000000000000000000000.05: 0.05
1000000000000000000000000000.2: 500000000000000000000000000.1 : 0.1
1000000000000000000000000000.3: 500000000000000000000000000.15: 0.15
1000000000000000000000000000.4: 500000000000000000000000000.2 : 0.2
1000000000000000000000000000.6: 500000000000000000000000000.3 : 0.3
1000000000000000000000000000.9: 500000000000000000000000000.45: 0.45
1000000000000000000000000001.4: 500000000000000000000000000.7 : 0.7
1000000000000000000000000002.1: 500000000000000000000000001.05: 1.05
1000000000000000000000000003.2: 500000000000000000000000001.6 : 1.6
1000000000000000000000000004.8: 500000000000000000000000002.4 : 2.4
7.2--------------------------------------------------------------------------
2000000000000000000000000000.1: 1000000000000000000000000000  : 0
2000000000000000000000000000.1: 1000000000000000000000000000  : 0
2000000000000000000000000000.1: 1000000000000000000000000000  : 0
2000000000000000000000000000.1: 1000000000000000000000000000  : 0
2000000000000000000000000000.1: 1000000000000000000000000000  : 0
2000000000000000000000000000.1: 1000000000000000000000000000  : 0
2000000000000000000000000000.1: 1000000000000000000000000000  : 0
2000000000000000000000000000.1: 1000000000000000000000000000  : 0
2000000000000000000000000000.1: 1000000000000000000000000000  : 0
2000000000000000000000000000.1: 1000000000000000000000000000  : 0
0.1--------------------------------------------------------------------------

同样,第一组的结果是准确值,后两组有着不同的舍入误差。第二组的舍入误差比 Linux 中的要好。第三组就很糟糕了,被累加的值直接被舍入到 0 了。

System.Double 数据类型的情况

把前面的测试程序稍加修改,就可用于测试 double 数据类型的舍入误差:

 1 using System;
 2  
 3 static class DoubleSumTester
 4 {
 5   static void Main(string[] args)
 6   {
 7     try
 8     {
 9       var e = (args.Length > 0) ? int.Parse(args[0]) : 15;
10       for (var i = 0; i < 3; i++) Console.WriteLine(F(10, i, e));
11     }
12     catch (Exception ex) { Console.WriteLine(ex.Message); }
13   }
14     
15   static double F(int n, int k, int e)
16   {
17     var z = 0.1 + k * Math.Pow(10, e);
18     var w = (long)z / 2.0;
19     while (n-- > 0) z += z / 2 - w;
20     return z - w * 2;
21   }
22 }

这时把循环次数固定为 10,命令行参数指定影响舍入误差的整数部分的 10 的幂指数。运行结果如下所示:

work$ dmcs DoubleSumTester.cs
work$ mono DoubleSumTester.exe 0
5.76650390625
5.76650390625
5.76650390625002
work$ mono DoubleSumTester.exe 1
5.76650390625
5.76650390624993
5.76650390625
work$ mono DoubleSumTester.exe 4
5.76650390625
5.76650390631767
5.76650390624854
work$ mono DoubleSumTester.exe 10
5.76650390625
5.76657485961914
5.76650238037109
work$ mono DoubleSumTester.exe 12
5.76650390625
5.761962890625
5.7666015625
work$ mono DoubleSumTester.exe 14
5.76650390625
5.6875
5.0625
work$ mono DoubleSumTester.exe 15
5.76650390625
9
0
work$ mono DoubleSumTester.exe 16
5.76650390625
0
0

这次,Linux 和 Windows 中的运行结果是相同的。同样,每次运行的第一行是准确值,其余两行是不同的舍入误差形成的结果。

参考资料

  1. 博客园:浅谈 System.Decimal 结构

你可能感兴趣的:(浮点数)