C语言进阶语法--深度剖析数据存储

文章目录

  • 前言
  • 一、数据类型介绍
  • 二、整形在内存中的存储
    • 2.1 原码、反码、补码
    • 2.2 大小端字节序
    • 2.3 示例
  • 三、浮点型在内存中的存储
    • 3.1 引例
    • 3.2 浮点数存储规则
  • 总结

前言

数据存储对象包括数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。数据以某种格式记录在计算机内部或外部存储介质上。数据存储要命名,这种命名要反映信息特征的组成含义。数据流反映了系统中流动的数据,表现出动态数据的特征;数据存储反映系统中静止的数据,表现出静态数据的特征。接下来,让我们一起了解数据在内存中的存储规则。


一、数据类型介绍

1.1 基本内置类型:

char            //字符数据类型       
short          //短整型                   
int              //整形                        
long           //长整型
long long  //更长的整形
float          //单精度浮点数
double     //双精度浮点数

1.2 类型的意义:

1. 使用这个类型开辟内存空间的大小(大小决定了使用范围)。
2. 如何看待内存空间的视角。

在C语言中,将其内置类型有着不同的划分:

整形家族

char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]

浮点数家族

float
double

构建类型

> 数组类型
> 结构体类型 struct
> 枚举类型 enum
> 联合类型 union

指针类型

int *pi;
char *pc;
float* pf;
void* pv;

空类型

void 表示空类型(无类型)
通常应用于函数的返回类型、函数的参数、指针类型

二、整形在内存中的存储

2.1 原码、反码、补码

计算机中的整数有三种2进制表示方法,即原码反码补码
三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”

数值位正数的原、反、补码都相同。
负整数的三种表示方法各不相同。

原码
直接将数值按照正负数的形式翻译成二进制就可以得到原码。
反码
将原码的符号位不变,其他位依次按位取反就可以得到反码。

补码
反码+1就得到补码。

对于整形来说:数据存放内存中其实存放的是补码。

原因:在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。

示例:

C语言进阶语法--深度剖析数据存储_第1张图片

 C语言进阶语法--深度剖析数据存储_第2张图片

 结论:整数在内存中其实存放的是补码。

但是又为什么顺序和其补码转换为16进制的形式不同呢?

2.2 大小端介绍

2.2.1 什么是大端、小端:

大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;
小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地址中。

2.2.2 为什么有大端和小端?

为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bit的char之外,还有16 bit的short型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

2.3 示例

C语言进阶语法--深度剖析数据存储_第3张图片

char 分为有符号的和无符号的char

有符号的char 的范围是-128--127

无符号的char 的范围是0--255 

三、 浮点型在内存中的存储

3.1 引例


int main()
{
	int n = 9;
	float* pFloat = (float*)&n;
	printf("n的值为:%d\n", n);
	printf("*pFloat的值为:%f\n", *pFloat);
	*pFloat = 9.0;
	printf("num的值为:%d\n", n);
	printf("*pFloat的值为:%f\n", *pFloat);
	return 0;
}

输出结果:

C语言进阶语法--深度剖析数据存储_第4张图片

3.2 浮点数存储规则 

num 和 *pFloat 在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么大?
要理解这个结果,一定要搞懂浮点数在计算机内部的表示方法。

详细解读:
根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:
(-1)^S * M * 2^E
(-1)^S表示符号位,当S=0,V为正数;当S=1,V为负数。
M表示有效数字,大于等于1,小于2。
2^E表示指数位。

举例来说:
十进制的5.0,写成二进制是 101.0 ,相当于 1.01×2^2 。
那么,按照上面V的格式,可以得出S=0,M=1.01,E=2。
十进制的-5.0,写成二进制是 -101.0 ,相当于 -1.01×2^2 。那么,S=1,M=1.01,E=2。

IEEE 754规定:
对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。

C语言进阶语法--深度剖析数据存储_第5张图片

对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。

请问浮点数9.0,如何用二进制表示?还原成十进制又是多少?
首先,浮点数9.0等于二进制的1001.0,即1.001×2^3。
那么,第一位的符号位s=0,有效数字M等于001后面再加20个0,凑满23位,指数E等于3+127=130,
即10000010。
所以,写成二进制形式,应该是s+E+M,即
这个32位的二进制数,还原成十进制,正是 1091567616 。

总结

以上即为今天所讲内容,整形和浮点形有着不同的存储规则,这就要求我们要对两者有更深层次的理解,这是一项我们必修的内功,希望通过本文的学习,可以对读者理解数据存储的规则起到帮助。

你可能感兴趣的:(c++,c语言,c#,开发语言,算法)