深度剖析数据在内存中的储存

整形在内存中的存储

一个变量的创建要在内存中开辟空间,空间的大小是根据不同的类型决定的。
那数据在数据在所开辟的空间中是如何存储的呢?
首先我们要了解三个概念:

原码 反码 补码

计算机中的有符号数有三种表示方法,即原码、反码和补码。
三种表示方法均有符号位数值位两部分,符号位都是用0表示正,用1表示负,而数值为的三种表示方法各不同。
原码:
直接将二进制按照正负数的形式翻译成二进制就可以。
反码:
将原码的符号位不变,其他位依次按位取反就可以得到了。
补码:
反码+1就可以得到补码。

正数的原码、反码、补码相同。
我们所看到的二进制是原码的形式,而它们在内存中是以补码的形式存放的。
下面来举几个例子

	int i = 10;
	int j = -8;

对于I,它的原码是:
00000000 00000000 00000000 0001010
而它所存放在内存是补码,而正数的补码即是它的原码,所以存放形式为:
00000000 00000000 00000000 0001010

对于j, 它的原码是:
10000000 00000000 00000000 0001000
它的反码为:
11111111 11111111 11111111 1110111
它的补码为:
11111111 11111111 11111111 1111000
它存放在内存中就是以上面的补码形式存放的。

为什么我们要以这种补码的形式存放在内存中呢?

在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理。同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码和原码相互转换,其运算过程是相同的,不需要额外的硬件电路

那如何用加法器来实现减法呢?
因为负数用补码来存放
所以例如
i = 1-1
我们可以把它看成
i = 1 + (-1)
1的补码为
00000000 00000000 00000000 0000001
-1的补码为
11111111 11111111 11111111 1111111
两者相加得到
00000000 00000000 00000000 0000000
这就是我们想要的结果,同理除法和乘法也可以用加法器来实现。

下面我们要了解不同字节的数据类型之间的计算方式。
如果我们要将一个高字节的数据存放在一个低字节的类型中,例如将int型存放在char型中,我们要用到一种方法,叫做截断

为什么是截断?
下面举一个例子

      char a = 1;

对于1,它在内存中存放的形式是这样的:
在这里插入图片描述
而我们将它存放在仅仅只有一个字节的char型中,它就会被截断为最低位的那个字节中的数据
在这里插入图片描述
即:00000001

那如果我们想要将一个低字节的数据类型用高字节的方式输出呢?
例如:

#include
int main()
{
	char a = -128;
	printf("%u",a); 
	return 0;
} 

它的输出结果为
在这里插入图片描述
为什么我们会得到这样一个奇怪的数据呢?
在这里,我们还要引入一个概念,叫做整型提升

那么,什么是整型提升?
对于一个低字节的数据类型,如果我们将它转换为高字节的数据类型,我们需要将它的二进制位补充到对应的字节,补充的规则是当数据为有符号数的时候,补符号数,如果为无符号数,补0.

对于上面的代码,我们就来分析一下。
首先整型-128的原码为
10000000 00000000 00000000 1000000
反码
11111111 11111111 11111111 0111111
补码
11111111 11111111 11111111 10000000
然后将其截断,存放在char中的二进制位为
10000000
同时我们将其以无符号整型的方式输出,所以需要先将其提升为整型,它的符号位为1,则前面全部补1
11111111 11111111 11111111 10000000
而因为我们输出的是无符号的整形,所以我们将上面的二进制补码直接当作原码,所以我们就得到了这个巨大的数字。

浮点型在内存中的存储

#include
int main()
{
	int n = 1;
	float *p = (float *)&n;
	printf("n = %d\n",n);
	printf("*p = %f\n\n",*p);
	
	*p = 1.0;
	printf("n = %d\n",n);
	printf("*p = %f\n",*p);
	return 0; 
} 

对于上面这段代码,它的运行结果是:
深度剖析数据在内存中的储存_第1张图片
*明明n 和 p在内存中是同一个数,为什么浮点数和整型的解读结果会差别这么大?要理解这个结果,一定要搞懂浮点数在计算机内部的表示方法

根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数V可以表示成下面的形式:

  • (-1)^ S * M * 2 ^ E
  • (-1)^ S表示符号位,当S=0,V为整数。当S=1,V为负数。
  •  M表示有效数字,大于等于1,小于2
  •  2 * E表示指数位

那如何理解呢?首先我画个图来大概描述一下
深度剖析数据在内存中的储存_第2张图片
这个是二进制前八位代表的数值,当我们要取到小于1的数时,我们可以想到,用2的负数次方来表示,于是可以这样表示
深度剖析数据在内存中的储存_第3张图片
所以十进制的5.0,我们将其用二进制表示就是101.1,相当于(-1) ^ 0 x 1.01 x 2 ^ 2。
用上面的格式的话 S = 0,M = 1.01,E = 2。
那它在内存中又是怎么存放的呢?

IEEE 754 规定 : 对于32位的单精度浮点数,最高的1位是符号位S,接着的8位是指数E,剩下的23位为有效数字M
如下图:
深度剖析数据在内存中的储存_第4张图片
对于64位的双精度浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M
这里的图我就不画了,可以参考上面的自行脑补。

在之前有一条性质,M表示有效数字,大于等于1,小于2,也就是说,这个M必为1,原先的写法为1.xxxxxxxx,而我们可以将这个1省略掉,因为它是一个固定值,我们可以直接写为后面的xxxxxxx,这样我们就可以节约一位,就可以表示24位的有效数字,而当我们要读取的时候,再将这个第一位的1给加上去。

而指数E,它的规则就显得有些复杂

E作为一个无符号的整数,这表示着如果E为8位,它的取值范围为0-255(2^8 -1)。如果E为11位,它的取值范围为0-2047.但是我们知道,科学计数法中的E时可以出现负数的,**所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,**对于8位的E,这个中间数是127(2 ^ (8-1)-1) ;对于11位的E,这个中间值是1023.比如,2^10的E是1-,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

而当我们将指数E从内存中取出的时候,存在三种情况。

E不全为0或者不全为1

这时,浮点数就采用下面的规则表示,即指数E的计算值减去中间数127或1023,得到真实值,再将有效数字M前面加上第一位的1。
比如:0.5的二进制为0.1,用上述表示法则为(-1)^ 0 * 1.0 * 2 ^ (-1),阶码为-1+127 = 126.
126二进制表示为
01111110
尾数1.0去掉常值1,剩下一个0,补齐0到23位,所以二进制表示形式位:
0 01111110 00000000000000000000000

E全为0

这时,指数E等于1-127(1023)得到真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的效数,这样做是为了±0及无限趋近于0的数字

E全为1

这是,如果有效数字M全为0,表示±无穷大(正负取决于符号位S)

你可能感兴趣的:(C语言)