深度剖析数据在内存中的存储——浮点数的存储

一、十进制小数转换为二进制小数

方法:

十进制数的整数位是二进制数的整数位,十进制数的小数位是二进制数的小数位。两部分分开转换。

整数部分 除以2取余,逆序排列。
小数部分 乘 2 取整,顺序排列。

原理:

十进制数的小数部分 M 对应二进制部分应为 A1 * 2^(-1) + A2 * 2^(-2) + ... + An * 2^(-n) 其中An 为 0 或 1

现在将 M 乘 2 :M * 2 = A1 * 2^0 + A2 * 2^-1 + ... + An * 2^(1-n)

此时,A1 * 2^0 = A1 即为 M * 2的整数部分的值 求出了A1.

然后舍弃M * 2 的整数部分,即舍弃了 A1. M * 2 - A1 = A2 * 2^-1 + ... + An * 2^(1-n)

最后不断重复这一计算方式,直到乘2所得的结果小数部分为0(或者达到要求精度的位数)为止,二进制小数即为: 0.A1A2..Am (为0时m=n,否则根据精度要求决定m大小)

例如转换十进制小数11.4,过程如下。

计算整数部分,11转换为二进制位1011:

计算小数部分0.4,首先将小数部分一直乘2,积的整数部分顺序取出:
0.4*2=0.8      取0      |                               
0.8*2=1.6      取1      |  顺
0.6*2=1.2      取1      |  序
0.2*2=0.4      取0      |  排
0.4*2=0.8      取0      |  列
0.8*2=1.6      取1      |
0.6*2=1.2      取1      |
0.2*2=0.4      取0      |

可以看出0110是循环,因此小数部分的二进制是
0.01100110……(循环0110)

最终结果是整数位和小数位合并1101111.01100110……(2)

二、浮点型在内存中的存储。

int main()
{
 int n = 9;
 float *pFloat = (float *)&n;
 printf("n的值为:%d\n",n);
 printf("*pFloat的值为:%f\n",*pFloat);//


 *pFloat = 9.0;
 printf("num的值为:%d\n",n);
 printf("*pFloat的值为:%f\n",*pFloat);
 return 0; }

深度剖析数据在内存中的存储——浮点数的存储_第1张图片

浮点数在计算机内部的表示方法。

详细解读:
根据国际标准 IEEE (电气和电子工程协会) 754 ,任意一个二进制浮点数 V 可以表示成下面的形式:
(-1)^S * M * 2^E
(-1)^s 表示符号位,当 s=0 V 为正数;当 s=1 V 为负数。
M 表示有效数字,大于等于 1 ,小于 2
2^E 表示指数位。

 

举例来说:
十进制的 5.0 ,写成二进制是 101.0 ,相当于 1.01×2^2 。 那么,按照上面 V 的格式,可以得出 s=0
M=1.01 E=2
十进制的 -5.0 ,写成二进制是 - 101.0 ,相当于 - 1.01×2^2 。那么, s=1 M=1.01 E=2
IEEE 754 规定:
对于 32 位的浮点数,最高的 1 位是符号位 s ,接着的 8 位是指数 E ,剩下的 23 位为有效数字 M

深度剖析数据在内存中的存储——浮点数的存储_第2张图片

对于 64 位的浮点数,最高的 1 位是符号位 S ,接着的 11 位是指数 E ,剩下的 52 位为有效数字 M
深度剖析数据在内存中的存储——浮点数的存储_第3张图片
IEEE 754 对有效数字 M 和指数 E ,还有一些特别规定。 前面说过, 1≤M<2 ,也就是说, M 可以写成 1.xxxxxx 的形
式,其中 xxxxxx 表示小数部分。
IEEE 754 规定,在计算机内部保存 M 时,默认这个数的第一位总是 1 ,因此可以被舍去,只保存后面的 xxxxxx 部分。
比如保存 1.01 的时候,只保存 01 ,等到读取的时候,再把第一位的 1 加上去。这样做的目的,是节省 1 位有效数字。
32 位浮点数为例,留给 M 只有 23 位,将第一位的 1 舍去以后,等于可以保存 24 位有效数字。
至于指数 E ,情况就比较复杂。
E 不全为 0 或不全为 1
这时,浮点数就采用下面的规则表示,即指数 E 的计算值减去 127 (或 1023 ),得到真实值,再将有效数字 M
加上第一位的 1 。 比如: 0.5 1/2 )的二进制形式为 0.1 ,由于规定正数部分必须为 1 ,即将小数点右移 1 位,
则为 1.0*2^(-1) ,其阶码为 -1+127=126 ,表示为 01111110 ,而尾数 1.0 去掉整数部分为 0 ,补齐 0 23
00000000000000000000000 ,则其二进制表示形式为 :
E 全为 0
这时,浮点数的指数 E 等于0 -127 (或者0 -1023 )即为真实值,
有效数字 M 不再加上第一位的 1 ,而是还原为
0.xxxxxx 的小数。这样做是为了表示 ±0 ,以及接近于 0 的很小的数字。
E 全为 1
这时,如果有效数字 M 全为 0 ,表示浮点数的最值问题 (正负取决于符号位 s );
好了,关于浮点数的表示规则,就说到这里。
解释前面浮点数在计算机中的存取问题。
int main()
{
 int n = 9;
 float *pFloat = (float *)&n;
 printf("n的值为:%d\n",n);
 printf("*pFloat的值为:%f\n",*pFloat);//


 *pFloat = 9.0;
 printf("num的值为:%d\n",n);
 printf("*pFloat的值为:%f\n",*pFloat);
 return 0; }

 1.首先n作为整数,在内存中是以二进制形式存储的。

9的原、反、补码相同。在内存中的存储为00000000000000000000000000001001以整形输出为9;

pFloat是浮点数类型。所以将9的原码以浮点数的取的方法取出。及符号位s=0,E=00000000,M=00000.....01001,取的时候还原E为0-127,M=0.0000....01001,s=0,这个数无限接近于0,所以结果是0.000000。

2.*pFloat=9.0,所以是以浮点数的形式存储的。转换成二进制为1001.0,写成科学记数法为(-1)^0*1.001*2^3.那么E=3,M=1.001,s=0,那么E=3+127=200,即存入为:

0 10000010 00100000000000000000000

以整形输出(符号位为0,则原、反、补码相同)为1091567616

以浮点数输出,则根据浮点数的规则可知输出为9.000000。

由上题可知:浮点型的存取与整形不同。

你可能感兴趣的:(笔记,C语言,算法)