C语言基本数据类型的存储

前言

学习C语言时,我对于C语言基本数据类型不太懂。后来学习计组之后,了解了计算机内部数据的存储。这篇文章将从底层,剖析基本数据类型在计算机中是如何存储。

整型数据的表示方法

在计算机中,数据以二进制的方式存储,即我们平时所使用的十进制数,都会被转化为0101等数据。如十进制的12,转化成二进制就是1010。
我平时习惯将四个二进制数写在一起,第一,便于书写时一眼能看清位数;第二,也便于二进制与16进制的转换。
比如十进制数99,我会先看成64+32+2+1,因此转换成二进制数的时候,就是0110 0011。要记得常见的2的几次方,比如2的0次方等于1, 2的十次方等于1024。

计算机的主存储器是由一个个存储0和1的存储元件组成,每个存储元里面存储的一个二进制数,我们成为1bit 。我们常用的计算机中,一般是8个存储元为一组,存储的8个二进制数为1B(字节)。

参与运算的机器数有两种,一种是无符号数,一种是有符号数。
无符号数中,整个机器字表示的二进制位均表示数值。比如计算机中存储了机器数1000 0001,即表示十进制数129。当我们在C语言中某个数据类型前加入unsigned时,表示该数为无符号数。存储的时候,首位就是数值位。比如 存储129,且该计算机是8位计算机,那么在计算机中存储的就是1000 0001。
对于有符号数,计算机中最高位,即最前面的那一位表示符号。0表示该数为正数,1表示该数为负数。
对于有符号数的表示,有四种方式。原码、补码、反码、移码。
我们先不必在意这四个码分别是什么。
我们只需要知道,我们常用的计算机,一般都是以补码存储。
因此,我们先介绍原码和补码。为了便于举例,我们假设某个计算机是8位计算机。
127转换成二进制是多少呢——0111 1111。那-127呢?如果直接转换,根据之前所讲的首位为1则为负数,我们很容易得到1111 1111。
是的,这就是原码。我们不必死扣概念,知道这个例子即可。也就是说,正数和负数之间的差别,其实仅仅是首位的符号位。
但是,在计算机中存储的,并不是原码,而是补码。(为什么?感兴趣的可以查一下相关的资料)
对于补码而言,其正数与原码的表示方式完全相同。也就是说,127,在计算机中存储的,其实就是0111 1111。那-129呢?先给结论,-127是以1000 0001存储的。
是不是没有找出规律?
那请把目光返回到我讲补码时的1111 1111。其实,负数的补码就是将原码的符号位不变,数值位全部取反,最后在末位+1,因此,我们就得到了-127的补码——1000 0001。
发现了没有,无符号数129和有符号数的-127的存储,都是1000 0001。
理解了这两种码。那在C语言中,int,short int,long,long long仅仅是位数上的差别。
需要注意的是,32位机器中, int 是4字节,short int 是2字节,long 是4字节,long long是8字节。
执行以下代码,我们可以得到结果。

int main()
{
     
	printf("sizeof_int= %d \n", sizeof(int));
	printf("sizeof_short= %d \n", sizeof(short));
	printf("sizeof_long= %d \n", sizeof(long));
	printf("sizeof_long long= %d \n", sizeof(long long));
}

C语言基本数据类型的存储_第1张图片

浮点型数据的存储

对于浮点数的存储,目前遵循一个标准——IEEE 754标准。
该标准中,将数据分为以下几部分。
数符、阶码部分、尾数部分。
我们先举一个十进制的例子。1001用科学计数法怎么表示?
——1.001×10^4。
这里的4指的就是阶码,因为是十进制,因此10为底,而1.001,就是尾数。
比如9,转化成二进制就是1001,那用科学计数法表示,就是1.001×2^0011。0011就是十进制的3,此时要写成二进制。
以float为例,数符即表示该数的符号,存储在最高位,占1bit。阶码是中间的8位,尾数则是后面的23位。这是规定,知道即可。
因此,float在32位机器中,占32bit,即4B。
注意,表面上是23位,实际上这23位都是小数点后的23位。小数点前面的1被隐含了。
比如上面的9的尾数,1.001,在存储的时候只存储001,前面的1被隐含了。
在我们上面举的例子中,尾数部分决定了一个数的精确度。也就是说,float尾数实际精确度为24位。

为什么要强调这一点?
比如我们要将int转换成float,那有没有可能出现精度丢失?答案是肯定的。int可以保留32位精度,而float只能保存24位,因此是可能出现精度丢失的。
我们给出如下代码

int main()
{
     
	printf("sizeof_float= %d \n", sizeof(float));
	printf("sizeof_double= %d \n", sizeof(double));

}

在这里插入图片描述
可以看出,double需要用8B存储。根据IEEE 754标准,double保存精度的位数为52+1位(+1同float),即将int转化为double时,不会出现精度丢失。

注意:float和double在存储一些小数时,无法实现精确存储。比如,小数点后,可以精确的是0.5, 0.25,0.125,0.75等。而对于2.323,1.332这类数,计算机是无法精确存储的。因此,在判断语句中,我们不能判断两个小数数据是否相等。
如下列代码是不规范的。

double a ,b;
...
if (a == b)

字符型的存储

int main()
{
     
	printf("sizeof_char= %d \n", sizeof(char));
}

在这里插入图片描述
可以看出,char型在内存中占1B。
char型存储的时候后并不是把该符号存储到内存中,而是将某些数据以二进制的形式放到内存中。这些数据就是ASCII码值。该表具体如下:
C语言基本数据类型的存储_第2张图片
由图可知,不同的ASCII码对应不同的字符。

小结

C语言中,数据类型分为整型、实数型、字符型。整型又分为short, int ,long, long long, 实数型又分为float, double等,不同的类型其存储所占的字节数不同。
我们要谨慎使用强制类型转换,要注意精度丢失的问题,编程时要非常小心。

你可能感兴趣的:(c语言,数据类型)