float数在内存中的分布,以及以其他进制表示的最终值

        float数在32位系统下,占用四字节32位。表示的目标是,将一个数映射到负无穷到正无穷上的某个点。所以,针对于float数,人为的将其划分为三部分:

        1字节的符号位  +  8字节的指数位  +  23字节的尾数位

        为什么要这么划分呢?我也不知道,不过猜测是挑选的一种较好的、约定俗成的划分方式。

         这里,就有两个疑问?①一个小数怎么转换成最终的二进制表达。②比较浮点数一般使用a与b的绝对值与0.000001比较,为什么是六位?

         先解决第二个问题吧,为什么是六位?32位数字被我们最终留下了23位的尾数位,那么23位位数为表示的最大数是多少?经科学计算器计算,2的23次方为8,388,608‬。一共是7位,那么当他被表示成科学计数法的时候,小数点后偏移六位,所以一般我们用0.000001与计算的差值绝对值比较,确定两个浮点数是否相等。

         第二个问题,现在开始:以0.1为例。把大象装进冰箱拢共分几步,嗯,三步。转换的过程也分三步:①将浮点数转换成0101表示的二进制。②将其转换为科学计数法表示。③根据正负号、指数值、尾数值填写最终的32位数。

         ①将浮点数转换成0101表示的二进制:小数位的表示是乘2的方式,0.1*2=0.2,填0;  0.2*2=0.4,填0;  0.4*2=0.8,填0;0.8*2=1.6,填1;0.6*2=1.2,填1。又成了0.2,重复了,所以最终的二进制串如下。

 0.0001 1001 1001 1001 1001 1001 1001 1001

          ②以科学计数法表示,那么上面的二进制串最终表示为:1.1001 1001 1001 1001 1001 1001 1001  *  10 -4

          ③以浮点数规则映射。浮点数映射时候,指数位需要手动+127,为什么要加127呢?因为指数位没有正负的概念,而我们指数会有正数。所以最终需要加127,比如我们指数是3,那么最终存储就是130,指数是-4,最终存储123。

           所以,最后符号位为0,指数位为123(01111011)。最终的二进制串:0011 1101 1100 1100 1100 1100 1100 1100

这里这里这里,有一个很重要的点,因为我们最终的表示是循环小数,除不尽。float的标准计算规则,并非只有一个,其实有多个。这也就是为什么,在不同的平台上,可能浮点数的最终值不一样。这里,按照我们最常接触的进位方式,最后一组(四位)二进制表达被修改为了 1101,进位了。

为了方便查看,以16进制表示出来:0x3dcccccd

           写了这么多,是骡子是马,拉出来遛遛。用C++的方式,来验证一下,0x3dcccccd和0.1f 是不是相同:

#include 
using namespace std;

int main()
{
	float x = 0.1f;
	int* pst = (int*)&x;
	printf("%d\n", *pst);

	int y = 0x3dcccccd;
	printf("%d\n", y);
}

 

            浮点数的这套规则,应用广泛,有一点原因原因在于,他在表达很小的数值区间,例如0-1的时候,划分很细。而表示较大的数值区间,划分就相对宽松。因为尾数位固定。这样的规则,使他在表示的区间的划分上近似于比例性均匀。

你可能感兴趣的:(随笔)