《C语言进阶》 第一部分 深度剖析数据在内存中的存储

大家好,从这篇文章开始,我们就进入了C语言进阶部分。内容比较丰富,干货多多,希望大家能够有所收获。
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第1张图片

文章目录

  • 1. 数据类型介绍
    • 1.1 类型的基本归类
  • 2. 整形在内存中的存储
    • 2.1 原码、反码、补码
    • 2.2 大小端介绍
    • 2.3 练习:
  • 3. 浮点型在内存中的存储
    • 3.1 一个例子
    • 3.2 浮点数存储规则

1. 数据类型介绍

前面我们已经学习了基本的内置类型,以及它们所占存储空间的大小。
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第2张图片
在这里注意几个小点:
在C语言中规定:sizeof(long)>=sizeof(int)。
long long是8个字节,在C99中才能支持,老版本的编译器不一定支持。

类型的意义:
1.使用这个类型开辟内存空间的大小(大小决定了使用范围)。
2.如何看待内存空间的视角。

1.1 类型的基本归类

整形家族:
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第3张图片
在这里,我们将char类型放在了整型家族里面,因为char在内存中存放的是字符的ASCII码值。
这里的unsigned表示的是无符号的,用%u来打印。定义时方括号[]里的东西可以写可以不写。
注意:
short等于signed short
int等于signed int
long等于signed long

但是,char不等于signed char
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第4张图片
浮点数家族:
在这里插入图片描述
float是单精度浮点类型,double是双精度浮点类型。

构造类型(自定义类型):
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第5张图片
指针类型:
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第6张图片
空类型:
void 表示空类型(无类型)
通常应用于函数的返回类型、函数的参数、指针类型。

2. 整形在内存中的存储

我们之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。那接下来我们谈谈数据在所开辟内存中到底是如何存储的?
比如:

int a = 10;
int b = -10;

我们知道为 a 分配四个字节的空间。那如何存储?
开始了解下面的概念:

2.1 原码、反码、补码

计算机中的整数有三种表示方法,即原码、反码和补码。
三种表示方法均有符号位数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位正数的原、反、补码都相同。
负整数的三种表示方法各不相同。
原码
直接将二进制按照正负数的形式翻译成二进制就可以。
反码
将原码的符号位不变,其他位依次按位取反就可以得到了。
补码
反码+1就得到补码。
对于整形来说:数据存放内存中其实存放的是补码。
为什么呢?
在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。

我们看看在内存中的存储:

#include 
int main()
{
	int a = 10;
	int b = -10;
	return 0;
}

10的原码:00000000000000000000000000001010
正数的原,反,补相同,所以补码也是:00000000000000000000000000001010
转换为16进制:0x00 00 00 0a
我们看一下内存中的存储:
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第7张图片
-10的原码:10000000000000000000000000001010
-10的反码:11111111111111111111111111110101
-10的补码:11111111111111111111111111110110
转换为16进制:0xff ff ff f6
我们看一下内存中的存储:
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第8张图片
我们可以看到对于a和b分别存储的是补码。但是我们发现顺序有点不对劲。
这是又为什么?

2.2 大小端介绍

什么大端小端:
大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中。
小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地址中。

为什么有大端和小端:
这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。但是在C语言中除了8 bit的char之外,还有16 bit的short型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

一道笔试题:
设计一个小程序来判断当前机器的字节序:
我们先定义一个:int a=1;它的16进制是0x 00 00 00 01
所以当我们知道它的第一个字节是1的话,机器就是小端存储。如果是0的话,机器就是大端存储。
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第9张图片
那我们该如何拿到第一个字节呢?
我们将a强制类型转换成char*,然后解引用访问的就是一个字节。

#include 
int main()
{
	int a = 1;
	char* p = (char*)&a;

	if (1 == *p)
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
	}
	return 0;
}

这样就可以判断出机器是大端存储还是小端存储。

2.3 练习:

1

int main()
{
    char a= -1;
    signed char b=-1;
    unsigned char c=-1;
    printf("a=%d,b=%d,c=%d",a,b,c);
    return 0; 
}

首先,我们知道-1是int类型,4个字节,char是1个字节,所以-1放到char里面会发生截断。
-1的补码是:11111111111111111111111111111111
放到a里面的只有后八位:11111111
同理,放在b和c里面的也是后面八位:11111111
当我们用%d打印时,char类型需要整型提升。
在VS的编译器下,char等价于signed char。是有符号的。
所以整型提升后:11111111111111111111111111111111-补码
打印时是按照原码打印:10000000000000000000000000000001
就是-1。同理:b也是-1。
c是无符号char,所以整型提升时补0,提升后:00000000000000000000000011111111-补码
按%d打印就是认为内存中存的是有符号的。
所以0认为是符号位,是正数,原,反,补相同:
00000000000000000000000011111111-原码
结果就是255

2

int main()
{
    char a = -128;
    printf("%u\n",a);
    return 0; 
}

-128的原码是:10000000000000000000000010000000
-128的反码是:11111111111111111111111101111111
-128的补码是:11111111111111111111111110000000
放在a里面会发生截断取后面八位:10000000
然后按%u打印,会发生整型提升,char是有符号的,提升后11111111111111111111111110000000-补码
%u会认为内存中存的是无符号数,所以原码,反码,补码相同。
结果是一个非常大的数。

3

int main()
{
int i= -20;
unsigned int j = 10;
printf("%d\n", i+j);
return 0;
}

首先,我们先算出-20的补码:
在这里插入图片描述
然后,我们算出10的补码:
在这里插入图片描述
相加就得到:
在这里插入图片描述
按%d形式打印,我们应该转换成原码:
在这里插入图片描述
结果就是-10。

4

int main()
{
unsigned int i;
for(i = 9; i >= 0; i--) 
 {
    printf("%u\n",i);
 }
}

我们先来看一下运行结果:
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第10张图片
为什么会是这个结果呢?
我们知道unsigned int是无符号整型,它里面是不能解读出负数的。所以i>=0是恒成立的。

5

int main()
{
    char a[1000];
    int i;
    for(i=0; i<1000; i++)
   {
        a[i] = -1-i;
   }
    printf("%d",strlen(a));
    return 0; 
}

我们在讲这道题之前先说一个知识点:
一个char类型的变量中到底能放什么数值。
首先,我们讨论无符号char,它在内存中存储这些数值:
00000000 - 0
00000001 - 1
00000010 - 2

01111111 - 127
10000000 - 128
10000001 - 129

11111111 - 255
所以,unsigned char的取值范围是0~255。
那有符号char呢:
00000000 - 0
00000001 - 1
00000010 - 2

01111111 - 127
从这里开始要求原码:
10000000 - 这个在计算机里不会计算,它直接解析成-128。

10000001 - 11111111 - -127

11111110 - 10000010 - -2
11111111 - 10000001 - -1
所以,signed char的取值范围是-128~127。
我们可以将这个char的取值范围画出一个圆:
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第11张图片
数组里面应该是这样存的:
-1,-2,-3,… ,-128,127,126,…,3,2,1,0,-1,-2,-3…
然后strlen计算的是0前面的,所以长度应该是128+127=255。

6

unsigned char i = 0;
int main()
{
    for(i = 0;i<=255;i++)
   {
        printf("hello world\n");
   }
    return 0; 
}

根据上面的结论我们知道,unsigned char的取值范围是0~255,所以当255+1时,会变为0,所以会一直打印,成死循环。

3. 浮点型在内存中的存储

3.1 一个例子

浮点数存储的例子:

int main()
{
 int n = 9;
 float *pFloat = (float *)&n;
 printf("n的值为:%d\n",n);
 printf("*pFloat的值为:%f\n",*pFloat);
 *pFloat = 9.0;
 printf("num的值为:%d\n",n);
 printf("*pFloat的值为:%f\n",*pFloat);
 return 0; 
}

输出的结果是什么呢?
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第12张图片
从这里,我们得出整数存储和浮点数存储的方式是不一样的。
那么我们就说一下浮点数的存储。

3.2 浮点数存储规则

根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:
(-1)^S * M * 2^E
(-1)^s表示符号位,当s=0,V为正数;当s=1,V为负数。
M表示有效数字,大于等于1,小于2。
2^E表示指数位。

举例来说:
十进制的5.0,写成二进制是 101.0 ,相当于 1.01×2^2 。
那么,按照上面V的格式,可以得出s=0,M=1.01,E=2。
十进制的-5.0,写成二进制是 -101.0 ,相当于 -1.01×2^2 。
那么,s=1,M=1.01,E=2。

当我们知道S,M,E,时,就可以推到出(-1)^S * M * 2^E,然后就能转成二进制,最后转成十进制浮点数。所以,我们只需要存S,M,E就行了。
那么存S,M,E的规则是什么:
IEEE 754规定:
对于32位的浮点数(float),最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第13张图片
对于64位的浮点数(double),最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第14张图片
IEEE 754对有效数字M和指数E,还有一些特别规定:
前面说过, 1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中xxxxxx表示小数部分。
IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。
比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。
以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。
至于指数E,情况就比较复杂。
首先,E为一个无符号整数(unsigned int)。
这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0-2047。但是,我们知道,科学计数法中的E是可以出现负数的。
所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。
比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

然后,指数E从内存中取出还可以再分成三种情况:
在这里插入图片描述
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第15张图片
在这里插入图片描述
好了,关于浮点数的表示规则,就说到这里。

解释前面的题目:

int main()
{
 int n = 9;
 float *pFloat = (float *)&n;
 printf("n的值为:%d\n",n);
 printf("*pFloat的值为:%f\n",*pFloat);
 *pFloat = 9.0;
 printf("num的值为:%d\n",n);
 printf("*pFloat的值为:%f\n",*pFloat);
 return 0; 
}

首先,我们将内存图画一下:
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第16张图片
第一个,我们是用整型存的,然后用%d打印,一定是9,这是没有问题的。

第二个,按%f打印,是按照浮点数的视角来打印。
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第17张图片
由于指数E全为0,所以符合上一节的第二种情况。因此,浮点数V就写成:
V=(-1)^0 × 0.00000000000000000001001×2^(-126)= 1.001×2^(-146)
显然,V是一个很小的接近于0的正数,所以用十进制小数表示就是0.000000。

再看例题的第二部:
首先,浮点数9.0等于二进制的1001.0,即1.001×2^3。
那么,第一位的符号位S=0,E=3+127=130, M=1.001。
有效数字M等于001后面再加20个0,凑满23位,指数E等于3+127=130, 即10000010。
所以,写成二进制形式,应该是S+E+M,即
0 10000010 001 0000 0000 0000 0000 0000
这个32位的二进制数,还原成十进制,正是 1091567616 。

总结:
到这里,我们就把整数和浮点数在内存中的存储讲解完了,这些知识会增加我们的内功,希望能把这块内容掌握。如果大家认为我有哪些不足之处或者知识上的错误都可以告诉我,我会在之后的文章中不断改正,也请大家多多包涵。如果大家觉得这篇文章有用的话,也希望大家可以给我关注点赞,你们的支持就是对我最大的鼓励,我们下一篇文章再见。
《C语言进阶》 第一部分 深度剖析数据在内存中的存储_第18张图片

你可能感兴趣的:(C语言,c语言,开发语言,后端)