C语言的数据类型及其存储方式

C语言的数据类型及其存储方式

  • 一、C语言的数据类型
    • 1.常见的数据类型
    • 2.整型家族
    • 3.构造类型
    • 4.指针类型
  • 二、整形在内存中的存储
    • 1.大小端字节序
    • 2.源码、反码和补码
  • 三.浮点数在内存中的存储
    • 1.从一个栗子开始
    • 2.浮点数的存储规则
  • 总结


一、C语言的数据类型

1.常见的数据类型

下面是几种C语言常见的数据类型

char 字符数据类型
short 短整型
int 整型
long 长整型
long long 长长整型
float 单精度浮点型
double 双精度浮点型

C99新增了_Bool(布尔类型),用来表示真假:
true 表示真
false 表示假

但是C语言可以用整型表示表达式的真或假,而布尔类型其实就是对C语言的int类型进行了重命名而已,所以在C语言中几乎见不到布尔类型。

2.整型家族

整形分为有符号整形和无符号整型:

无符号整型 有符号整型
unsigned char signed char
unsigned short [ int ] signed short [ int ]
unsigned int signed int
unsigned long [ int ] signed long [ int ]

其实对于char类型来说,虽然其存储的是字符,但是却是以字符对应的ASCII码值的整型来存储的

对于我们正常情况下的类型声明比如:int其实前边省略了signed,对于short,long来说同样如此。但是要注意的是char的类型是不确定的,在不同的编译器下可能会不相同。

在一些常见的编译器下char就是signed char.

3.构造类型

一下是C语言的四种构造类型:

数组类型 int [ ], char [ ]等
结构体类型 struct
枚举类型 enum
联合类型 union

4.指针类型

整形指针 int*
字符指针 char*
单精度浮点型指针 float*
空类型指针 void*

除了这四种之外还有doube*等,同时还包括一级指针,二级指针,三级指针等,以及数组指针等各种指针类型。

二、整形在内存中的存储

我们知道,一个变量的存储是要在内存中开辟空间的,而开辟空间的大小就是根据变量的类型决定的。
例如:

int a = 10;
int b = -10;

根据整型的类型,会为其分配四个字节的空间。那这四个字节究竟如何存储呢?我们来分析一下:

先来看一下变量a在内存中的存储:
C语言的数据类型及其存储方式_第1张图片
最上面的一行所对应的就是变量a的地址及其存储的内容。每一行刚好就是四个字节的内容。这里每个地址空间所存储的值是以十六进制的形式存储的,为啥不用二进制存储呢?计算机在内存中存储不都是二进制吗?

这是因为虽然计算机是以二进制形式存储的,但是如果给我们展示二进制的话,不太方便我们观察,所以这里是十六进制。

接下来,我们来看下变量b在内存中的存储吧:
C语言的数据类型及其存储方式_第2张图片
最上面一行就是变量b在内存中的存储,为什么是这样呢,因为数据在内存中的存储都是以二进制补码形式存储的。

如果对存储形式有疑问的话,先看下面的源码,反码和补码的介绍会好一些哦!

1.大小端字节序

好了,我们知道了存储方式,但是大家可以发现,上述图片中存储却是倒过来的,这是为什么呢?

这里就涉及到了大小端字节序的存储方式了:
小端字节序
小端字节序就是低位字节的数据存放在内存的低地址端,高位字节的数据存放在内存的高地址端。

大端字节序:
大端字节序就是低位字节的数据存放在内存的高地址端,高位字节的数据存放在内存的低地址端。

为何会有大小端字节序之分呢?

这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。
但是在C语言中除了8 bit的char之外,还有16 bit的short型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高地址中,即 0x0011 中。小端模式,刚好相反。

我们常用的 X86 结构是小端模式,而 KEIL C51 则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以
由硬件来选择是大端模式还是小端模式。

2.源码、反码和补码

整型数据可以分为正数和负数:

正数的源码,反码和补码是相同的,将一个十进制数转换为二进制数所对应的就是正数的源码了。

而负数的源码则需要将对应正数的源码的二进制最高位,也就是符号位变为1,反码就是在源码符号位不变的基础上把所有位按位取反就可以得到反码,而补码则需要在把对应的反码加1就得到了补码。

同时,如果知道负数的补码,想要去求源码或者反码,只需要进行相反的计算就可以了。

那为什么整型数据在内存中的存储形式是补码呢?

在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;

同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。

三.浮点数在内存中的存储

1.从一个栗子开始

首先请大家猜一下下面代码的执行结果:

int main()
{
	int n = 9;
	float* pFloat = (float*)&n;
	printf("n的值为:%d\n", n);
	printf("*pFloat的值为:%f\n", *pFloat);
	*pFloat = 9.0;
	printf("num的值为:%d\n", n);
	printf("*pFloat的值为:%f\n", *pFloat);
	return 0;
}

如果以浮点数的形式从内存输出整型数据结果会是9.0吗?
那如果以整型形式从内存输出浮点数数据结果会是9吗?

下面让我们来看一下结果是否如我们预期的那样:
C语言的数据类型及其存储方式_第3张图片
嗯~,好像不是我们想的那样哦,但是这也太离谱了吧,为什么以浮点数形式输出整型数据和以整型形式输出浮点数数据会和原来差别这么大呢?

其实这是因为浮点数在内存中的存储方式和整型数据在内存中的存储方式有着巨大的差别。

2.浮点数的存储规则

根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:

(-1)^S * M * 2^E
(-1)^s表示符号位,当s=0,V为正数;当s=1,V为负数。
M表示有效数字,大于等于1,小于2。
2^E表示指数位。

举个例子:
十进制的5.0,写成二进制是 101.0 ,相当于 1.01×2^2 。那么,按照上面V的格式,可以得出S=0,M=1.01,E=2。
十进制的-5.0,写成二进制是 -101.0 ,相当于 -1.01×2^2 。那么,S=1,M=1.01,E=2。
以单精度浮点型32位数据为例:
C语言的数据类型及其存储方式_第4张图片
而双精度浮点型64位数据则是:一位S符号位,紧接着是十一位E指数位,再就是M有效数字52位。

IEEE 754对有效数字M和指数E,还有一些特别规定:
前面说过, 1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中xxxxxx表示小数部分。

IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以舍去,只保存后面的xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。

以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。等于说可以多出一位来保存数据。

至于指数E,情况就比较复杂。
首先,E为一个无符号整数(unsigned int)这意味着,如果E为8位,它的取值范围为0-255。如果E为11位,它的取值范围为0~2047。
但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

然后,指数E从内存中取出还可以再分成三种情况:

第一种:E不全为0或不全为1

浮点数就采用以下的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。
例如:
0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为1.0*2^(-1),其阶码为-1+127=126,表示为01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进制表示形式为:

第二种:E全为0

这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字。

第三种:E全为1

这时,如果有效数字M全为0(虽然M全为0,但是我们省略了小数点前的1),表示±无穷大(正负取决于符号位s)

总结

本篇文章主要介绍了C语言的数据类型及其存储方式,同时涉及到了源码,反码以及补码的介绍,还包括大小端字节序的说明。同时还有浮点型数据的与整型数据截然不同的存储方式。因为理解数据在内存中的存储对每一个程序员来讲都是非常重要的。最后大家如果有问题,欢迎在评论区探讨!

你可能感兴趣的:(C语言,c语言,开发语言,后端)