浮点优化

警惕 Extended
extended很大(10字节,如果代码对齐就有12字节),读写运算都很慢,是优化的大敌。且Delphi2-4对extended的代码对齐有bug。因此,若非必要,不要用extended。
同时,在混合浮点类型的运算中,编译器为了不丢失精度,临时变量以extended类型存储,所以要避免混合浮点运算。
还有,用const定义的常量,如不加指明,则也默认为extended类型。解决办法是,配合$J指示字,定义指明类型常量(typed constand)。

一.改变FPU控制字
默认的FPU控制字令除法运算和PII/PIII上的平方根运算慢而精确,当无须得到这样的结果时,可用Set8087CW让FPU“偷懒”。
对于Single类型:Set8087CW(Default8087CW and $FCFF)
对于Double类型:Set8087CW((Default8087CW and $FCFF) or $0200)
对于extended类型:Set8087CW(Default8087CW or $0300)

二.多用Round
Trunc会读写FPU指令字,而Round不会,所以可以的话,尽量用Round。

三.传送实参
对于返回浮点值的函数,入口和出口处会有附加的压栈退栈,对形如:
function func(x : SomeType): SomeFloat; 不妨改写为:
procedure func(x : SomeType; var fp : SomeFloat); 对于在过程中未修改的浮点形参,没必要用const修饰,因为那除了增加一个编译期检查外,别无用处。相应的对策是用var修饰为实参,强制传址。

四.自己动手,丰衣足食
Delphi本身不对浮点运算作任何优化,因此很多时候,还得自己用汇编来解决。
值得注意的是,Delphi中浮点异常的触发,不是在出错之后,而是在下一条浮点指令之前。因此,通常的作法是,在一次浮点操作完毕后,加一条FWAIT指令。

五.减少除法
 fp:=fp*3*4/5+3*4/2; 在Delphi 4中,会被编译为:
 fp:=fp*3*4/5+6; 而只有:
 fp:=3*4/5*fp+3*4/2; 才会被编译为:
 fp:=2.4*fp+6; 鉴于编译器的繁复规则,建议这一步优化自己完成。

六.浮点零的检查
检查一个浮点数是否为零,如果简单的“Afloat=0”,会把0转换为浮点零。而更好的办法是这样:
对于Single类型:
 (Dword(pointer(Asingle))shl 1) =0 对于Double类型:
type DoubleData=record lo,hi:Dword end; Var ADouble:Double; Dd:DoubleData absolute Adouble; begin … if ((dd.hi shl 1)+dd.lo)=0 then… end; 此法在PII上有30%-40%的效率提升。

你可能感兴趣的:(优化)