C语言修炼之路数据类型悟正法 解析存储定风魔下篇

(壹)大端小端藏端倪

1.1  什么是大端小端

大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;

小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地址中。

C语言修炼之路数据类型悟正法 解析存储定风魔下篇_第1张图片

C语言修炼之路数据类型悟正法 解析存储定风魔下篇_第2张图片

1.2  大端小端模式

1)大端模式:

低地址 -----------------> 高地址

0x0A  |  0x0B  |  0x0C  |  0x0D

C语言修炼之路数据类型悟正法 解析存储定风魔下篇_第3张图片

2)小端模式:

低地址 ------------------> 高地址

0x0D  |  0x0C  |  0x0B  |  0x0A

C语言修炼之路数据类型悟正法 解析存储定风魔下篇_第4张图片

1.3  为什么有大端和小端

为什么会有大小端模式之分呢?

这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。

但是在C语言中除了8bit的char之外,还有16bit的short型,32bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

例如:

一个 16bit 的 short 型 x ,在内存中的地址为 0x0010,x 的值为0x1122,那么0x11为高字节,0x22为低字节。对于大端模式,就将0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小

端模式,刚好相反。我们常用的X86结构是小端模式,而KEIL C51则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

1.4  如何判断机器的字节序

一般都是通过 union 来测试的,下面这段代码可以用来测试一下你的编译器是大端模式还是小端模式:

C语言修炼之路数据类型悟正法 解析存储定风魔下篇_第5张图片

 union 型数据所占的空间等于其最大的成员所占的空间。

对 union 型的成员的存取都是相对于该联合体基地址的偏移量为 0 处开始,也就是联合体的访问不论对哪个变量的存取都是从 union 的首地址位置开始。

联合是一个在同一个存储空间里存储不同类型数据的数据类型。这些存储区的地址都是一样的,联合里不同存储区的内存是重叠的,修改了任何一个其他的会受影响。那么通过强制类型转换,判断其实存储位置,也可以测试大小端了:

C语言修炼之路数据类型悟正法 解析存储定风魔下篇_第6张图片

C语言修炼之路数据类型悟正法 解析存储定风魔下篇_第7张图片

(二) 浮点型在内存中的存储

常见的浮点数:

3.14159 1E10

浮点数家族包括:float、double、long double类型。

浮点数表示的范围:float.h中定义

浮点数存储的例子:

C语言修炼之路数据类型悟正法 解析存储定风魔下篇_第8张图片

 输出的结果是什么呢?

C语言修炼之路数据类型悟正法 解析存储定风魔下篇_第9张图片

num和*pFloat在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么大?

要理解这个结果,一定要搞懂浮点数在计算机内部的表示方法。

2.1  浮点数在内存中的储存

根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:

C语言修炼之路数据类型悟正法 解析存储定风魔下篇_第10张图片

举例来说:

十进制的 5.0 ,写成二进制是101.0,相当于 1.01×2^2 。 那么,按照上面V的格式,可以得出 s=0,M=1.01,E=2。 

十进制的 - 5.0,写成二进制是 -101.0,相当于 -1.01×2^2。那么,s=1,M=1.01,E=2。 

IEEE 754规定:

对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。 

C语言修炼之路数据类型悟正法 解析存储定风魔下篇_第11张图片

对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。 

C语言修炼之路数据类型悟正法 解析存储定风魔下篇_第12张图片

IEEE 754对有效数字M和指数E,还有一些特别规定。

前面说过,1≤M<2,也就是说,M可以写成1.xxxxxx的形式,其中xxxxxx表示小数部分。

IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。

比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。 

至于指数E,情况就比较复杂。

首先,E 为一个无符号整数(unsigned int) 这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。

但是,我们知道,科学计数法中的 E是可以出现负数 的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

然后,指数E从内存中取出还可以再分成三种情况:

①E不全为0或不全为1

 ②E全为0

 ③E全为1

2.2  题目解释

下面,让我们回到一开始的问题:为什么0x00000009还原成浮点数,就成了0.000000?

首先,将0x00000009拆分,得到第一位符号位s=0,后面8位的指数E=00000000,最后23位的有效数字M=000 0000 0000 0000 00001001。

由于指数E全为0,所以符合上一节的第二种情况。因此,浮点数V就写成:

V=(-1)^0 ×0.00000000000000000001001×2^(-126)=1.001×2^(-146)

显然,V是一个很小的接近于0的正数,所以用十进制小数表示就是0.000000。 

再看例题的第二部分。 请问浮点数9.0,如何用二进制表示?还原成十进制又是多少? 首先,浮点数9.0等于二进制的1001.0,即1.001×2^3。

那么,第一位的符号位s=0,有效数字M等于001后面再加20个0,凑满23位,指数E等于3+127=130,即10000010。 所以,写成二进制形式,应该是s+E+M,即

这个32位的二进制数,还原成十进制,正是1091567616。 

到此这篇关于C语言修炼之路数据类型悟正法 解析存储定风魔下篇的文章就介绍到这了,更多相关C语言 数据类型内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

你可能感兴趣的:(C语言修炼之路数据类型悟正法 解析存储定风魔下篇)