float double的内存表示及比较大小的方法

float和double类型的内存分布和比较方法收藏

Comparing floating point numbers  

总结几点:

0. float占4byte,精度是6~7位;double占8byte,精度是15~16位。 

1. C/C++的浮点数据类型有float和double两种。它们在内存中是以科学计数法的结果来存储的。 

类型float大小为4字节,即32位,内存中的存储方式如下:


 符号位(1 bit)

指数(8 bit)

尾数(23 bit)


类型double大小为8字节,即64位,内存布局如下:


符号位(1 bit)

指数(11 bit)

尾数(52 bit)
  
符号位决定浮点数的正负,0正1负。 
指数和尾数均从浮点数的二进制科学计数形式中获取。

2. 关于比较大小

一般情况下用一个absolute epsilon value来比较(if (fabs(result - expectedResult) < 0.00001))就够了。但是在某些对数字精度有特殊要求的domain,比如graphic,需要用更合理的方法。具体,参见引用文献2.

Comparing for equality

Comparing with epsilon – absolute error

Comparing with epsilon – relative error

你可能感兴趣的:(float double的内存表示及比较大小的方法)