上面这张图主要是用来吸引人的,跟本文内容没啥关系(偷笑~)
还是跟之前一样,本文是阅读《基于物理的渲染:从理论到实践》的总结,文中不会涉及到方方面面,只会整理笔者认为重要的一两个点。本文关注的重点是误差,尤其是舍入误差(Rounding Error),主要来源书中的3.9节。
由于作者水平所限,文中如果有错误或者没有解释到位的地方,还请读者不吝指正。
误差的来源
首先我们必须认识到,没有任何方法可以避免误差,我们能做的就只能是减少误差。为啥?从误差的来源我们就可以看出来了。
误差会来自两个方面:
第一,用于计算的数据(即输入数据)本身就不是精确的,即输入数据本身就带有误差。
第二,保存数据的工具会产生误差。这个怎么理解?我们用计算机来保存数据,计算机是二进制的,我们用来保存数据的大小也有限制,不可能表示数学上类似于“实数”这种无限精度的数字。
从误差的来源我们就可以看出,误差无法避免,无论是哪个方面的误差我们都无法避免,只能尽可能的减少误差。这就意味着,当我们进行计算的时候(尤其是要进行光线和表面交点这种精度要求非常高的计算),我们必须把误差考虑进去,否则渲染出来的场景会和理想中的场景相差很大。而输入数据本身的精确性我们没法控制,就当它是精确的吧!我们要让第二个误差,也就是保存数据的工具产生的误差减少!
舍入误差
舍入误差,英文名叫rounding error,是用计算机保存实数的时候,由于精度有限,导致的保存的数据和原来的数据的差距。这个差距,就是舍入误差。
就拿32位浮点数来说。IEEE的标准(下面讲的内容都是IEEE标准)是32位浮点数,首位用来保存符号+/-(用s表示),接下来的8位用来保存指数值e,最后的23位用来保存有效数字m(二进制0或者1),即:
于是,我们的数字可以表示成。如果你的观察够敏锐的话,会发现,这种表示方式无法表示0,这是不能容忍的,所以IEEE又规定,如果指数e是0,那么表示的数字将是,这样,如果m等于0的话,我们就能表示0了,虽然有+0和-0之分。当然,这时候IEEE又跳出来了,规定说+0和-0的表现必须是一样的,这样才有了唯一的0值。
绝大多数情况下,我们的指数e不会等于0,所以我们可以放心大胆地只考虑第一种情况。考虑这样一个问题,浮点数1和离1最近的比1大的浮点数之间的间隔是多少呢?
我们来看一下,表示1的时候,m值是00...00,然后e是127,这样求出来。而比这个数稍微大点的数就是在第23位的地方是1,这就比1大了,也是比1大的最小数,它比1大了。这也就说明了,我们没法表示和之间的数字。而这个就是通常所说的机器精度(machine epsilon),我们用表示。
很少有数字正好落在浮点数能精确表示的位置上,不在这个位置上的数怎么办呢?就比如说怎么表示?有两种方法可以采用,一是多出来的精度我就不管了,直接舍弃。二是我先看看这个精确的数字更接近哪个数,然后表示成那个数。和的中间量是,显然要比这个中间量小,所以它会被表示成。
那么,正好落在中间的数怎么办?比如说?这又是一个麻烦事,还是得寄出IEEE大法:
IEEE舍入最近法则:
如果第24位,为1,第24位后的所有已知位是0,那么如果第23位是1,就往第23位加1,如果第23位为0,就不加。
如果第24位为1,第24位之后还有至少一个1,那么就往第23位上加1.
如果第24位为0,那么就舍弃之后的所有位数,保持第23位的数不变。
很绕的一个方法,解释一下。
情况一、表示
因为这个数第24位是0,第25位是1,根据IEEE舍入最近法则,第24位为0的话,保持第23位数不变的原则,第25位会被舍弃,而这个数就会被舍入成。
情况二、表示
这个数第24位是0,之后的所有数位都是0,而的第23位是0,所以不会进位,导致它也会被表示成。
情况三、表示
这个数的第24位是1,并且之后所有的数位都是0,而的第23位是1,所以它会进位,导致最后表示成。
神奇吧?
误差的表示
知道舍入误差产生的原因之后,接下来就要表示误差了。在分析误差的时候,我们需要两个概念:绝对误差(absolute error)和相对误差(relative error)。
令是精确值,而是浮点值
绝对误差表示为
即,浮点值与精确值之差的绝对值。
相对误差表示为
即,绝对误差与精确值绝对值之比。
由于舍入的规则,精确值和浮点值之间的相对误差不会超过半个机器精度,即,大小是。
用表示将精确值舍入成浮点值,舍入后的浮点值通常表示成,就是在上面加个波浪线。然后,用符号来表示浮点算术运算:
误差计算
确定了符号之后,紧接着进行误差的计算。标准的误差计算模型是
每当发生一次浮点运算的时候,引入一个的相对误差,这个误差的大小不超过机器精度的一半。这是一个非常合理的模型,用来分析误差大小非常合适。
误差的累积
考虑这样一个计算:,假设都是精确值。在计算机中,我们可以认为它的计算顺序是这样的,于是它的误差可以表示成:
展开式子可得
这个式子的最大误差是
但是这个表示过于繁琐,我们考虑误差不想这么复杂大计算这么一个长式子,所以把它简化为:
虽然扩大了误差,但是简化了计算。还有就是要注意,这里必须要有绝对值,因为如果中有负数的话,那么相加之后的误差会减少,只有当这些数的符号都相同的时候,它才是最大误差,所以我们在这里加上绝对值符号。比如说,考虑如下的情况:
假设有两个数相加,,计算表达式为:,我们可以得到最终结果是,误差是,用绝对值限制的误差结果是,真实误差在绝对值限制误差之内,而如果没有绝对值,得到的误差会是,显然真实误差要超过限制了,这是不允许的。
这里要指出书上的一处错误,书上说如果中,a和b的符号相同的话,那么最大误差为,这很明显太大了。从它的实现代码来看,它用的也不是这个范围,而是我上面说的那个。
对乘法的计算来说,考虑误差的计算非常直观:
因为本身就要引入的误差,所以最后的误差指数需要再加。
除法的计算就不那么直观了:
你没看错,是而不是,因为这里的有正有负,它是一个范围,所以不能把它消掉,它的误差和相乘的误差是一样的!
一个简洁的记号
根据从其他书上借来的引理,如果,并且对正整数n有,可以得到以下式子:
这样,就可以简单地记作了。
误差计算的实例
根据上面的原理,我们可以看到pbrt中有正确的误差,有错误的误差,还有不知道是不是正确的误差(-_-)!
先看正确的误差:
用计算公式计算出球表面和光线的交点后,还需要执行一步,把交点投射到球表面上去,因为由于误差的缘故,计算出来的交点可能不在表面上。这个投射的过程是
是投射后的x坐标,投射y和z坐标的方式一样。我们来分析一下这个操作的误差
其中,操作引入的误差为,然后为了开根号,我们把分母内的误差扩大了,使得最后的式子非常简洁。可以查看pbrt-v3的代码,我们可以看到:
// Compute error bounds for sphere intersection
Vector3f pError = gamma(5) * Abs((Vector3f)pHit);
没错,就是。
再来看个错误的误差:
在用矩阵转换顶点的时候,代码是这样的
T xp = m.m[0][0] * x + m.m[0][1] * y + m.m[0][2] * z + m.m[0][3];
而书中的式子是这样的
注意这里在后面加了个括号,代码中是没有这个括号的,有了括号之后,计算出来的误差和没有括号计算的误差是不一样的。
我们先来看有括号之后的计算过程是什么
最终引入的误差是。
不加括号是什么样子?
没错,最终引入的误差是。而它的代码中,引入的误差却仍然是:
T xAbsSum = (std::abs(m.m[0][0] * x) + std::abs(m.m[0][1] * y) +
std::abs(m.m[0][2] * z) + std::abs(m.m[0][3]));
*pError = gamma(3) * Vector3(xAbsSum, yAbsSum, zAbsSum);
最后是不知道正确不正确的误差:
计算光线和三角形交点的时候,涉及到的计算非常复杂,最终的计算公式是
但是里面的所有参数,都是从别的地方计算出来的,也就是说这些参数本身就包含误差在里面。误差的计算过程也弄不清楚,为啥要分别计算x,y,z分量的绝对误差值,然后再计算t值的误差,完全搞不懂啊!
总结
说了这么多,你一定觉得误差非常恐怖。其实不然,因为不管误差怎么累积,它的量级也不会太大,除非你放大误差。跟分析误差相比,更应该关注的是算法的稳定性和精确度,因为如果算法不好,它会放大某些误差,导致结果完全不一样。所以,更多地关注算法,在算法出现问题的时候,从误差的角度去思考一下,是一个不错的方法。
参考资料
Physically Based Rendering
pbrt源码,版本3
Accuracy and Stability of Numerical Algorithm
数值分析(第二版)
Rounding Errors in Algebraic Processes