深度剖析数据在内存中的存储(原码、补码、反码、大小端、面试题)

我们知道基本的数据类型有char ,short, int, long,long long ,float,double.那么这些数据在内存中是怎样存储的呢?  

 一、整形在内存中的存储

int a=10;

这句代码大家应该扫一眼就能看懂;这代表我们为变量a分配4个字节;那这个数据在内存中怎么存储的?

我先为大家解开谜题:对于整形来说,数据存放内存中其实是存放补码。

补码又是什么鬼?接下来咱们先补补课

计算机中的有符号数有三种表示方法,既原码、反码、补码

三种表示方法均有符号位和数值位两部分,符号位用0表示正,用1表示负

原码:也就是将该整形数据按照正负数直接转换为二进制数。

比如上述代码中int a = 10;我们先将其转换为2进制就是1010,由于int是四个字节,需要32位存储,所以10 的原码就为 0000 0000 0000 0000 0000 0000 0000 1010

反码:符号位不变,其它位次取反

比如10的补码为0111 1111 1111 1111 1111 1111 1111 0101

补码:反码+1就可以得到补码

比如10的补码为0111 1111 1111 1111 1111 1111 1111 0110

由此我们知道了整形数据在内存中的存储是以补码的形式,但是为什么计算机大佬要这么做呢,把一个数据颠来倒去的?

因为使用补码,可以将符号位和数值域统一处理;同时加法和减法也可以统一处理(CPU只有加法器),此外,原码和补码相互转换,其运算过程是想同的,不需要额外的硬件电路。

好,那接下来我们通过vs2013验证一下:

深度剖析数据在内存中的存储(原码、补码、反码、大小端、面试题)_第1张图片

 这好像不大对劲啊,就算你是以16进制展现,那么也应该是00 00 00 0a;怎么还反过来了;原来这个和字节序有关,也就是大小端。那么,什么是大小端?

大小端

大端(存储)模式:指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;

小端(存储)模式:指数据的低位保存在内存的低地址中,而数据的高位,保存在内存的高地址中;

由此来看疑问解开,我的电脑字节序为小端模式。

为什么会有大小端呢:

在计算机系统中,以字节为单位,每个地址单元都对应着一个字节,一个字节为8bit。但是在C语言中除了8bit的char外,还有16bit的short类型,32bit的long型,另外对于位数大于8位的处理器,由于寄存器宽度大于一个字节,那么必然存在着将多个字节安排的问题,由此产生大小端。

下面我们看一道百度面试题:

请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。

简述概念不用我多说,那么代码如何来写呢?那么我们的结题思路很简单,就是找到数据的低位或者高位,与其在内存中的存储位置做比较;那么具体怎么来做,我们可以先定义一个int类型的数据,再强制转换为char,此时我们取到的就为该数据存储的低位,将其对1进行与运算,若结果为1;表示数据的低位存储有数据,为小端模式,反之则为大端模式。上代码!

#include
int check_key()
{
	int i = 1;
	return(*(char*)&i==1);
}
int main()
{
	int ret = check_key();
	if (ret)
	{
		printf("小端");
	}
	else
	{
		printf("大端");
	}
	return 0;
}

二、浮点型在内存中的存储

我们先来看例子:

#include
int main()
{
	int n = 9;
	float *pFloat = (float*)&n;
	printf("n的值为:%d\n", n);
	printf("*pFloat的值为:%f\n", *pFloat);

	*pFloat = 9.0;
	printf("num的值为:%d\n", n);
	printf("*pFloat的值为:%f\n", *pFloat);
	return 0;
}

结果却是这样式的:

深度剖析数据在内存中的存储(原码、补码、反码、大小端、面试题)_第2张图片

为什么会出现如此巨大的差距呢?这就得联系到浮点数在计算机内部的表示方法了

根据国际标准IEEE(电气和电子工程协会)754;任意一个二进制浮点数v可以表示成下面的形式:

  • (-1)^S*M*2^E
  •  (-1)^S表示符号位,当S=0,V为正数;当S=1,V为负数
  • M表示有效数字,大于等于1,小于2
  • 2^E表示指数位

举例来说:十进制的5.0;写成2进制为101.0,相当于1.01*2^2 。那么可以得出s=0;M=1.01,E=2

深度剖析数据在内存中的存储(原码、补码、反码、大小端、面试题)_第3张图片

这是32位的浮点数存储模式;对于64位的浮点数,最高的1位是符号位S,接着是11位的指数E,剩下为52位的有效数字M;

由此我们就可以解释刚开始的例子;当我们把9还原成浮点数后变成0.000000;第一个符号位为S=0;指数位E=0000 0000;有效数字为M=000 0000 0000 0000 0000 1001 ;所以通过计算得到1.001*2^(-146),这个正数数十分接近于0;所以用十进制表示就是0.00000

9->0000 0000 0000 0000 0000 0000 0000 1001 

第二部分的又怎么解释呢?首先,9.0用二进制表示为1001.0;可以写为1.001*2^3

9->0 10000010 001 0000 0000 0000 0000 0000

将其转换为10进制,结果就为1091567616

你可能感兴趣的:(C语言,c语言,后端)