最近在知乎上看到了一个话题:世界上有哪些代码量很少,但很牛逼很经典的算法或项目案例?其中有一个回答是雷神之锤3中的快速逆平方根算法,我本以为是电影中雷神3中出现的代码,就特别好奇点进去看了一下,结果真是对应了代码注释中的一句话“what the fuck?”。
越不会越好奇,查过之后才知道这是一款游戏中的部分代码,1999年发布,2005年开源,距离现在已经有20年了,据说这部分代码出现在公共场合时,几乎震住了所有人,也就是下面这几行代码:
float Q_rsqrt( float number )
{
long i;
float x2, y; #公众号【测试员小何】
const float threehalfs = 1.5f;
x2 = number * 0.5f;
y = number;
i = * ( long * ) &y; // evil floating point bit level hacking
i = 0x5f3759df - ( i >> 1 ); // what the fuck?
y = * ( float * ) &i;
y = y * ( threehalfs - ( x2 * y * y ) ); // 1st iteration
// y = y * ( threehalfs - ( x2 * y * y ) ); // 2nd iteration, this can be removed
return y;
}
可能很多程序员老手都知道这段牛B的代码,但对于很多人应该是空白的。求一个数的平方根我们通常会用到库中的内置方法,也就是sqrt,比如C语言中求一个数的平方根倒数,利用float(1.0/sqrt(x))即可。
可能那个时候没有sqrt方法,作者被“被逼无奈”想到了这种方法,但是最牛逼的是这种方法要比sqrt方法快的多,据说在有的CPU上可以快4倍,也有说快20%的,但我的电脑上编译是要快接近30%,而快的很大原因之一是因为代码中的一串神秘的数字0x5f3759df。下面结合一些相关知识和推导来介绍作者几个骚操作,最终的目的都是为了得到这个神秘数字。
首先我们要先明确一个基础知识,即单精度浮点数在32位中是如何储存的。32bit可以共分为三个部分S、E、M,其中S只有1位,0表示正数、1表示负数;E表示小数,共有8位;M表示尾数,共有23位,如下图:
以数字4.25为例,整数4的二进制表示为0100;与二进制表示整数同理,小数也是如此,比如202^020右侧就是2−12^{-1}2−1,那么4.25转化为二进制形式就是0100.01。将二进制形式转用科学计数法的形式可以表示为1.0001×22=(1+0.0001)×221.0001\times2^2=(1+0.0001)\times2^21.0001×22=(1+0.0001)×22。
这里先用s、e、m表示,因为S、E、M另有含义
由于4.25是正数,那么s位就存储为0,然后可以将指数处的2+127以二进制形式存储至e中,加上127的理由是将指数的范围由(-127,128)移码至(0,255),这样就可以用指数位置就不用考虑符号问题。最后将小数点后的0001存储至m中,因为后面的数足以确定小数点前为1,所以没有必要再存储1,综上就是一个单精度浮点数在32位内存中的存储方式,如下图:
所以对于一个要开放的浮点数x,有以下表示形式,先暂称为存储表达式(这个表达式下文需要用到):
x=(−1)s+(1+m)×2ex = (-1)^s+(1+m)\times 2^ex=(−1)s+(1+m)×2e
虽然e和m表示的实际意义是浮点数,但是毕竟二进制是都可以转换成十进制的整数嘛,那么如果从整数的角度看,整数E和浮点数e、整数M和浮点数m有没有某种关系呢?答案是肯定有的,但是理由呢我不知道=.=
E=127+eE = 127+eE=127+e
M=1019mM = 10^{19}mM=1019m
加127的原因上文已经介绍了,就是为了调整指数的符号范围;101910^{19}1019是m中1后所需补零的个数,因为当从浮点数角度看时,1左边的0是有起到占位作用的,而如果从整数角度看时,1右边的0才有实际意义,所以在原基础的m上乘以1后零个数的次幂就可以转化至整M。
我们再回到最初的问题,对于一个浮点数x,求它的逆平方根:
y=1x√=x−12y = \frac{1}{\sqrt{x} \quad} = x^ {- \frac{1}{2}}y=x1=x−21
如果对等式两边同时取对数:
log2y=−12log2xlog_2 y = - \frac{1}{2} log_2xlog2y=−21log2x
如果结合上面的存储表达式,又可以得到一个新的等式:
对于上式中的log2(1+mx)log_2(1+m_x)log2(1+mx)可以绘制出一条平滑的曲线,我们可以用直线y=mxy=m_xy=mx对比(如下图),可以看到两条线在(0,1)之间非常相近,那么如果再将这条直线向上平移一点点,可以假设这个平移的距离为b,那么两条线就有一种近似相等的关系:log2(1+mx)≈mx+blog_2(1+m_x)\approx m_x+blog2(1+mx)≈mx+b。
需要注意的是这种关系成立的前提是0≤mx≤10\leq m_x\leq 10≤mx≤1,经代入得到下面式子:
如果对log2ylog_2 ylog2y做相同处理,那么就有下面式子:
my+ey+b≈−12(mx+ex+b)m_y+e_y+b \approx -\frac{1}{2}(m_x+e_x+b)my+ey+b≈−21(mx+ex+b)
上面我们不是利用整数型的M和E分别表示m和e嘛,那么自然可以用整数型套用上式中的浮点型,对于不同数字,整数型和浮点型之间的关系也不同,所以这里统一用常量B和L表示,如下:
E=B+eE = B+eE=B+e
M=LmM = LmM=Lm
用整数型替换浮点型可以得到新式子:
可以看到整理后的式子左右有一个相同的部分M+LEM+LEM+LE,我们已经知道了这三个字母代表的意思,但合在一起表达的又是一个新概念,合并两个整数是一个很简单的问题,比如合并33和55,33×100+55=335533\times100+55=335533×100+55=3355,那么LE+MLE+MLE+M不就是这个道理嘛,只不过前者是十进制后者是二进制,所以LE+MLE+MLE+M的作用就是将M和E存储的数字捆绑在一起,用来表示储存的数字,有人想前面不是还有一位S吗?S的作用是表示存储数字的正负,根号下的数字一定为正,所以S这位一定为0,没有实际意义。有没有感觉真的秒!
既然这个组合用来表示一个数字,那么就可以用另一个变量I来表示:
Iy≈32L(B−b)−12IxI_y \approx \frac{3}{2}L(B-b) - \frac{1}{2}I_xIy≈23L(B−b)−21Ix
其实代码中下面这条语句就是套用的这个公式。
代码中利用了一个右移运算表示公式中的12\frac{1}{2}21,而32L(B−b)\frac{3}{2}L(B-b)23L(B−b)就是求出代码中这串神秘数字的基础,至于怎么求得的,只有作者知道。后面又有一位大佬对这串数字进行推导,经过精密的演算求得了一串新的数字0x5f375a86,它略优于原常数,大佬只管算,我们膜拜就好。
因为上文中含I的公式是从整型的角度计算的,所以需要强制类型转换将整形转回浮点型,紧接着最后一行代码是利用牛顿迭代法提高结果的精确度,没有什么惊奇之处,下面回顾一下上文过程中作者的几个骚操作:
也许作者利用的想法是已经存在了很久的理论,但是能把这些理论相组合并灵活运用创造出这种新兴高效的算法,真的不得不感叹一句NiuB,但需要注意的是这个算法依赖于浮点数的储存和字节顺序,所以在Mac上行不通。
上面代码可以再精简一些,但是原理一致,只是将一些变量简化:
float InSqrt(float x)
{
float xhalf = 0.5f * x; #公众号【测试员小何
int i = *(int*)&x;
i = 0x5f3759df - (i>>i);
x = *(float*)&i;
x = x*(1.5f-xhalf*x*x);
return x;
}
可能你看到最后还是那句"what the fuck",毕竟太多的公式推导都并没有相应的理论依据,只是靠着作者这些脑洞大开的想法,难道就是“我不要你觉得,我只要我觉得?”,关键还是要了解一下流程中几处很牛逼的想法,平时编程中不失为一种办法嘛,也可以当成一次知识拓展。
如果对软件测试有兴趣,想了解更多的测试知识,解决测试问题,以及入门指导,
帮你解决测试中遇到的困惑,我们这里有技术高手。如果你正在找工作或者刚刚学校出来,
又或者已经工作但是经常觉得难点很多,觉得自己测试方面学的不够精想要继续学习的,
想转行怕学不会的,都可以加入我们644956177。
群内可领取最新软件测试大厂面试资料和Python自动化、接口、框架搭建学习资料!