一个变量的创建要在内存中开辟空间,空间的大小是根据不同的类型决定的。
那数据在数据在所开辟的空间中是如何存储的呢?
首先我们要了解三个概念:
计算机中的有符号数有三种表示方法,即原码、反码和补码。
三种表示方法均有符号位和数值位两部分,符号位都是用0表示正,用1表示负,而数值为的三种表示方法各不同。
原码:
直接将二进制按照正负数的形式翻译成二进制就可以。
反码:
将原码的符号位不变,其他位依次按位取反就可以得到了。
补码:
反码+1就可以得到补码。
正数的原码、反码、补码相同。
我们所看到的二进制是原码的形式,而它们在内存中是以补码的形式存放的。
下面来举几个例子
int i = 10;
int j = -8;
对于I,它的原码是:
00000000 00000000 00000000 0001010
而它所存放在内存是补码,而正数的补码即是它的原码,所以存放形式为:
00000000 00000000 00000000 0001010
对于j, 它的原码是:
10000000 00000000 00000000 0001000
它的反码为:
11111111 11111111 11111111 1110111
它的补码为:
11111111 11111111 11111111 1111000
它存放在内存中就是以上面的补码形式存放的。
为什么我们要以这种补码的形式存放在内存中呢?
在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理。同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码和原码相互转换,其运算过程是相同的,不需要额外的硬件电路
那如何用加法器来实现减法呢?
因为负数用补码来存放
所以例如
i = 1-1
我们可以把它看成
i = 1 + (-1)
1的补码为
00000000 00000000 00000000 0000001
-1的补码为
11111111 11111111 11111111 1111111
两者相加得到
00000000 00000000 00000000 0000000
这就是我们想要的结果,同理除法和乘法也可以用加法器来实现。
下面我们要了解不同字节的数据类型之间的计算方式。
如果我们要将一个高字节的数据存放在一个低字节的类型中,例如将int型存放在char型中,我们要用到一种方法,叫做截断
为什么是截断?
下面举一个例子
char a = 1;
对于1,它在内存中存放的形式是这样的:
而我们将它存放在仅仅只有一个字节的char型中,它就会被截断为最低位的那个字节中的数据
即:00000001
那如果我们想要将一个低字节的数据类型用高字节的方式输出呢?
例如:
#include
int main()
{
char a = -128;
printf("%u",a);
return 0;
}
它的输出结果为
为什么我们会得到这样一个奇怪的数据呢?
在这里,我们还要引入一个概念,叫做整型提升。
那么,什么是整型提升?
对于一个低字节的数据类型,如果我们将它转换为高字节的数据类型,我们需要将它的二进制位补充到对应的字节,补充的规则是当数据为有符号数的时候,补符号数,如果为无符号数,补0.
对于上面的代码,我们就来分析一下。
首先整型-128的原码为
10000000 00000000 00000000 1000000
反码
11111111 11111111 11111111 0111111
补码
11111111 11111111 11111111 10000000
然后将其截断,存放在char中的二进制位为
10000000
同时我们将其以无符号整型的方式输出,所以需要先将其提升为整型,它的符号位为1,则前面全部补1
11111111 11111111 11111111 10000000
而因为我们输出的是无符号的整形,所以我们将上面的二进制补码直接当作原码,所以我们就得到了这个巨大的数字。
#include
int main()
{
int n = 1;
float *p = (float *)&n;
printf("n = %d\n",n);
printf("*p = %f\n\n",*p);
*p = 1.0;
printf("n = %d\n",n);
printf("*p = %f\n",*p);
return 0;
}
对于上面这段代码,它的运行结果是:
*明明n 和 p在内存中是同一个数,为什么浮点数和整型的解读结果会差别这么大?要理解这个结果,一定要搞懂浮点数在计算机内部的表示方法
根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数V可以表示成下面的形式:
- (-1)^ S * M * 2 ^ E
- (-1)^ S表示符号位,当S=0,V为整数。当S=1,V为负数。
- M表示有效数字,大于等于1,小于2
- 2 * E表示指数位
那如何理解呢?首先我画个图来大概描述一下
这个是二进制前八位代表的数值,当我们要取到小于1的数时,我们可以想到,用2的负数次方来表示,于是可以这样表示
所以十进制的5.0,我们将其用二进制表示就是101.1,相当于(-1) ^ 0 x 1.01 x 2 ^ 2。
用上面的格式的话 S = 0,M = 1.01,E = 2。
那它在内存中又是怎么存放的呢?
IEEE 754 规定 : 对于32位的单精度浮点数,最高的1位是符号位S,接着的8位是指数E,剩下的23位为有效数字M
如下图:
对于64位的双精度浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M
这里的图我就不画了,可以参考上面的自行脑补。
在之前有一条性质,M表示有效数字,大于等于1,小于2,也就是说,这个M必为1,原先的写法为1.xxxxxxxx,而我们可以将这个1省略掉,因为它是一个固定值,我们可以直接写为后面的xxxxxxx,这样我们就可以节约一位,就可以表示24位的有效数字,而当我们要读取的时候,再将这个第一位的1给加上去。
而指数E,它的规则就显得有些复杂
E作为一个无符号的整数,这表示着如果E为8位,它的取值范围为0-255(2^8 -1)。如果E为11位,它的取值范围为0-2047.但是我们知道,科学计数法中的E时可以出现负数的,**所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,**对于8位的E,这个中间数是127(2 ^ (8-1)-1) ;对于11位的E,这个中间值是1023.比如,2^10的E是1-,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。
而当我们将指数E从内存中取出的时候,存在三种情况。
这时,浮点数就采用下面的规则表示,即指数E的计算值减去中间数127或1023,得到真实值,再将有效数字M前面加上第一位的1。
比如:0.5的二进制为0.1,用上述表示法则为(-1)^ 0 * 1.0 * 2 ^ (-1),阶码为-1+127 = 126.
126二进制表示为
01111110
尾数1.0去掉常值1,剩下一个0,补齐0到23位,所以二进制表示形式位:
0 01111110 00000000000000000000000
这时,指数E等于1-127(1023)得到真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的效数,这样做是为了±0及无限趋近于0的数字
这是,如果有效数字M全为0,表示±无穷大(正负取决于符号位S)