在之前,我们学习了有关C语言中的各种数据类型以及它们的存储空间大小,如下图所示
类型的意义:
接下去我将上面的这些类型做一个分类,大致分为以下5类
首先看到的是【整型家族】,分别有char
、short
、int
、long
可能有些同学看到上面的这些很多类型有点懵,什么signed
、unsigned
,下面我就为你来先做一个解答
char为何归到整型家族?
为什么有unsigned和signed两个不同的类型呢
子分类后面的[int]
是什么?
short
、long
这些都是属于整型的范畴,其实应该写成【signed short int】和【unsigned short int】这样,只是为了简写忽略了后面的int
像[char]、[signed char]、[unsigned char]
这些该如何区分?
浮点数只分为两类,一个是【float】,一个则是【double】,这里只是做介绍,下文会专门介绍浮点数在内存中的存储
有关构造类型的话就分为以下这四种,对于【结构体】、【枚举】、【联合】这里不再细说,会专门开章节叙述
接下去是指针类型,对于int
、char
、float
这三种类型的指针我们之前都见到过,但是可能有同学没有遇见过这个void
类型的指针
void
类型的指针可以用来接收任何类型数据的地址【它就像一个垃圾桶一样,起到临时存放的作用】void 表示空类型(无类型)
通常应用于函数的返回类型、函数的参数、指针类型
接下去我们来聊聊有关整型的数据在内存中的存储形式
对于原码、反码、补码来说我们之前在学习【操作符】的时候有遇到过,这么我们再来正式地介绍一下
计算机中的整数有三种2进制表示方法,即原码、反码和补码。
0
表示“正”,用1
表示“负”,而数值位
接下去就来分别讲讲正数和负数的原、反、补码有什么不同
int a = 10;
int a = -10;
其实除了这三种之外,还有一种叫做【移码】,如果你学习过《计算机组成原理》这门课应该就可以知道移码就是符号位与补码相反,数值位与补码相同。本文不过过多细究
学习了概念后,我们来总结一下有关原码与补码的之间的转换
上面说到了三种整型编码方式,但是真正到了计算机内部使用的是哪个呢?
对于整形来说:数据存放内存中其实存放的是补码。
f6 ff ff ff
是啥呀,怎么就补码了?通过看前面的内存地址可以发现这其实是16进制的表示方式,若是以32位2进制来进行存放的话就太长了,所以采取十六进制的形式ff ff ff f6
,但是仔细一看却可以发现这和VS中我们所观察的结果有所不同,感觉倒了一下【这就要涉及到我们下面所要将的大小端存储】但是你有疑惑过在计算机内部要以【补码】的形式进行存放,而不是以原码的形式存放呢?
+
来看看int a = 1;
int b = -1;
int c = a + b;
printf("c = %d\n", c);
int a = 1;
00000000 00000000 00000000 00000001 - 原/反/补码
int b = -1;
10000000 00000000 00000000 00000001 - 原码
11111111 11111111 11111111 11111110 - 反码
11111111 11111111 11111111 11111111 - 补码
int c = a + b;
00000000 00000000 00000000 00000001
11111111 11111111 11111111 11111111
---------------------------------------------
100000000 00000000 00000000 00000000
100000000 00000000 00000000 00000000
00000000 00000000 00000000 00000000 - 整型只能存放4B,32b
1 - 1 = 0
是这样计算的,你明白了吗?【总结一下】:
我们在开始可以先看这样一个故事
有两个特别强大的国家在过去进行了36个月的战争,在这期间发生了件事情,就是吃鸡蛋的时候,原始的方法是打破鸡蛋较大的一端,可那时的皇帝的祖父由于小时侯吃鸡蛋,按这种方法把手指弄破了,因此他的父亲,就下令,命令所有的子民吃鸡蛋的时候,必须先打破鸡蛋较小的一端,违令者重罚。然后老百姓对此法令极为反感,期间发生了多次叛乱,其中一个皇帝因此送命,另一个丢了王位,产生叛乱的原因就是另一个国家Blefuscu的国王大臣煽动起来的,叛乱平息后,就逃到这个帝国避难。据估计,先后几次有11000余人情愿死也不肯去打破鸡蛋较小的端吃鸡蛋。这个其实讽刺当时英国和法国之间持续的冲突。Danny Cohen一位网络协议的开创者,第一次使用这两个术语指代字节顺序,后来就被大家广泛接受,这个就是关于大端小端名词的由来
在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8 bit
0x12345678
在内存中12为1个字节,34为一个字节,56为一个字节,78为一个字节,所以通过右侧的【内存】我们就可以看出虽然呈现的是一个倒着存放样子,但是呢并不是完全倒着,像87 65 43 21
,而是78 56 34 12
。这就是因为它们整体作为一个字节,讨论的是每个字节顺序,而不是每个字节内部的顺序
这,也就导致了【大端】和【小端】的由来,接下去呢就正式地来给读者介绍一下这种倒着存放的方式
首先来看一下它们的概念,这至关重要⭐
低位
保存在内存的高地址
中,而数据的高位
,保存在内存的低地址
中;低位
保存在内存的低地址
中,而数据的高位
,,保存在内存的高地址
中;0x11223344
,以进制的权重来看的话右边的权重低【0】,左边的权重高【3】,所以11为高位,44为低位。所以若是对其进行小端字节存储的话就要将44存放到低位,11存放到高位,这也就印证了为什么我们最后在看到内存中的存放是倒着的原因请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。(10分)
那有同学看到这个就懵逼了如何去判断一个机器的大端和小端呢?
下面我通过一个简单的数作为案例来进行一个分析
int a = 1;
01
放在低位;而以【大端字节序存储】会将01
放在高位,那么此时我们只需要获取到内存中规定最低位即可,因为01
在内存中表示一个字节,而一个【char】类型的数据就为1个字节,所以此时我们可以使用到一个字符型指针接受要存放到内存中的这个数,然后对其进行一个解引用,便可以获取到低位的第一个字节了char* p = &a;
1
的话那就是【小端】,反之则是【大端】char* p = (char *)&a;
if (*p == 1){
printf("小端\n");
}
else {
printf("大端\n");
}
运行结果如下:
int check_sys(int num)
{
char* p = (char*)#
if (*p == 1) {
return 1;
}
else {
return 0;
}
}
int ret = check_sys(1);
if (*(char*)&num == 1)
int check_sys(int num)
{
return *(char*)#
}
在上面,我们说到了有关【原码】、【反码】、【补码】的一些知识,若是用前面的
1
和0
去进行标识,可以将它们称之为有符号数
char
和无符号的char
在内存中所能表示的范围各自是多少
-128 ~ 127
0 ~ 255
但是为什么可以表示成这个范围呢,我们来细讲一下
00000000
开始存放,每次+1上去然后逢二进一,之后你就可以得出最大能表示的正整数为【127】,可是呢在继续+1后又会进行进位然后变为10000000
,符号位为1,表示为负数,但有同学说:“这不是-0
吗,怎么就-128
了呢?”继续看下去你就知道了1 1111111
只不过是补码的形式,若是还要再输出到外界,则需要转换为【原码】的形式,两种方式任选其一,在转换完后就可以发现呈现的数便是我最早给出的数字10000000
我们直接将其记作【-128】,它就对应的【-128】在内存中的补码,为什么可以直接这么认为呢?通过去写出【-128】的原、反、补码可以发现是需要9个比特位来进行存放,但是我们知道,对于char
类型的数值而言只能存放8个比特位,因此在转换为补码之后会进行一个截断10000000
,即为有符号char的最小负数为【-128】127
,接下去如果再进一位的话那就只能变成10000000
即为负数的最小值-128
,接着再慢慢往上变为【-4】、【-3】、【-2】、【-1】11111111
再+1的话就会变成100000000
,但是因为char类型的数据只能存放8个比特位,因此又需要做截断,只剩下00000000
,此时又变回了一开始的【0】,形成了一个轮回-128 ~ 127
,你明白了吗在看了有符号char的取值范围对于无符号char的数据范围就简单多了
0 ~ 255
学会了如何去分析有/无符号char的数据范围,那short呢?int呢?其实都是同理
【总结一下】:
在上面我们说到了有关无符号数和有符号的数据范围,都是在内存中的存放形式,也就是【补码】的形式,那【原码】和【反码】是怎样的呢?
10000000
相信不用我多说了,认真看了上文的一定可以明白,主要来讲一下这个00000000
,为什么+0
和-0
的补码都是它们呢?还记得那个轮回的圈吗,当我们最后加到-1的时候,要继续再+1就又变回0了,本来应该是-0
才对,不过char类型的数据只能存放8个比特位,所以截断了最前面的1,也就看上去和+0
的位置发生了一个重合+0
和-0
的补码相同,均为00000000
能算出8个比特位的数据范围,那么16个、32个、64个…n个比特位的数据都可以算出来✒
通过学习了各种数据的范围后,我们趁热打铁,练几道历年在各大厂笔试题中非常经典的一些笔试题⌨️
在看这一模块之前你要先了解什么是整型提升
并且你要知道以%u
和%d
打印数据有什么区别
%u
是打印无符号整型,认为内存中存放的补码对应的是一个无符号数%d
是打印有符号整型,认为内存中存放的补码对应的是一个有符号数① 第一道
#include
int main()
{
char a = -1;
signed char b = -1;
unsigned char c = -1;
printf("a = %d, b = %d, c = %d", a, b, c);
return 0;
}
-1
存放到这两个数据中去,首先你应该要考虑到的是一个数据放到内存中去是以什么形式?没错,那就是【补码】-1
转换为补码的形式1 0000000 00000000 00000000 00000001
1 1111111 11111111 11111111 11111110
1 1111111 11111111 11111111 11111111
11111111
这8个字节。-1
存放到它里面还是11111111
这8个字节不会改变,只不过在内存中的变化与有符号char不太一样。接下去就来看看会如何进行打印printf("a = %d, b = %d, c = %d", a, b, c);
%d
的形式进行一个打印,但是呢三个变量所存放的都是char类型的变量,因此会进行一个整型提升,只是有符号数的整型提升和无符号数不太一样//a b - 有符号数
11111111111111111111111111111111 - 补符号位
//c - 无符号数
00000000000000000000000011111111 - 补0
11111111111111111111111111111111
10000000000000000000000000000000
10000000000000000000000000000001 ——> 【-1】
00000000000000000000000011111111 ——> 【255】
运行结果如下:
② 第二道
#include
int main()
{
char a = -128;
printf("%u\n",a);
return 0;
}
10000000 00000000 00000000 10000000
11111111 11111111 11111111 01111111
11111111 11111111 11111111 10000000
char
类型的变量中,因为进行截断为10000000
char
类型的变量将会填充符号位11111111111111111111111110000000
%u
的形式进行打印,认为在内存中存放的是一个无符号整数。我们知道,对于无符号整数来说,不存在负数,所以其原、反、补码都是一样的,因此在打印的时候就直接将其转换为十进制进行输出printf("%u\n",a);
③ 第三道
#include
int main()
{
char a = 128;
printf("%u\n",a);
return 0;
}
-128
变成了128
而已00000000 00000000 00000000 10000000
10000000
,那后面就是一样的了 ,同上运行结果如下:
④ 第四道
int main(void)
{
int i = -20;
//1 0000000 00000000 00000000 00010100
//1 1111111 11111111 11111111 11101011
//1 1111111 11111111 11111111 11101100
unsigned int j = 10;
//0 0000000 00000000 00000000 00001010
printf("%d\n", i + j);
//1 1111111 11111111 11111111 11101100
//0 0000000 00000000 00000000 00001010
//------------------------------------------
//1 1111111 11111111 11111111 11110110
//1 1111111 11111111 11111111 11110110
//1 0000000 00000000 00000000 00001001
//1 0000000 00000000 00000000 00001010 —— 【-10】
//按照补码的形式进行运算,最后格式化成为有符号整数
return 0;
}
int
类型的数据,一个是有符号的,一个是无符号的。但无论是有符号还是无符号,放到内存中都是要转换为补码的形式,所以若是你碰到很复杂的题目,不要害怕,先把数字在内存中补码的形式写出来,然后再慢慢地去分析int
类型的变量中去,所以不需要进行【截断】和【整型提升】 1 1111111 11111111 11111111 11101100
0 0000000 00000000 00000000 00001010
------------------------------------------
1 1111111 11111111 11111111 11110110
%d
的形式进行打印输出,那就会将内部中存放的补码看做是一个有符号数,既然是有符号数的话就存正负,可以很明显地看到最前面的一个数字是1
,所以是负数,要转换为原码的形式进行输出1 1111111 11111111 11111111 11110110
1 0000000 00000000 00000000 00001001
1 0000000 00000000 00000000 00001010 —— 【-10】
运行结果如下:
⑤ 第五道
int main(void)
{
unsigned int i;
for (i = 9; i >= 0; i--)
{
printf("%u\n", i);
}
return 0;
}
我们可以先来看一下运行结果
unsigned
,把它去掉之后就可以正常打印了char
类型来说是0 ~ 255
;short
来说是0 ~ 65536
;int
类型来说是0 ~ 16,777,215
;i == 0
再去--
,此时就会变成【-1】11...11
是全部都是1,而此时这这个变量i又是个无符号的整型,所以不存在符号位这一说,那么在计算机看来它就是一个很大的无符号整数。此时当i以这个数值再次进入循环的时候,继续进行打印,然后执行--i
,最后知道其为0的时候又变成了-1,然后继续进入循环。。。光是这么说说太抽象了,我们可以通过Sleep()函数在打印完每个数之后停一会,来观察一下
#include
int main(void)
{
unsigned int i;
for (i = 9; i >= 0; i--)
{
printf("%u\n", i);
Sleep(200);
}
return 0;
}
i
循环到0的时候,突然就变成了一个很大的数字,这也就是印证了我上面的说法⑥ 第六道
unsigned char
来说,最大的整数范围不能超过255
,所以当这里的【i】加到255之后又会再+1就会变成00000000
,此时又会进入循环从0开始,也就造成了死循环的结果unsigned char i = 0;
int main()
{
for (i = 0; i <= 255; i++)
{
printf("hello world\n");
}
return 0;
}
所以对于有符号数和无符号数的数据范围一定要牢记于心❤️对边界值做到非常敏感
⑦ 第七道
int main()
{
char a[1000];
int i;
for (i = 0; i < 1000; i++)
{
a[i] = -1 - i;
}
printf("%d", strlen(a));
return 0;
}
-1 -2 -3 -4 -5 -6 -7 ...
signed char
,它和char
是一样的,数据的范围在【-128 ~ 127】,所以当i
加到128的时候,这个位置上的值变为【-129】,此时在计算机内部会将它识别成【127】,同理【-130】会被识别成为【126】。。。依次类推,最后当这个值为【0】的时候若再去减就会变成【-1】,然后又变成【-2】【-3】【-4】。。。一直当这个i
累加到1001的时候截止strlen()
去求这个数字的长度,对于strlen()来说,求的长度是到\0
截止,那也就是上面的【0】,不需要去关心后面的第二、三轮回-128 ~ +127
,二者的绝对值一加便知为255
//-1 -2 -3 -4 -5 -6 -7 ...-128 127 126 ... 0 -1 -2 -3....
printf("%d", strlen(a));
来看一下运行结果
到这里,七道非常经典的笔试题就全部讲完了,你学会【废︿( ̄︶ ̄)︿】了吗
在第二模块,我有提到过一个叫做【浮点数家族】,里面包含了[float]
和[double]
类型,对于浮点数其实我们不陌生,在上小学的时候就有接触到的3.14
圆周率,还有以科学计数法表示的1E10
limits.h
;浮点型类型的取值范围限定在:float.h
float.h
这个头文件首先要了解浮点数在内存中的存储规则,我们要通过一个案例来进行引入。请问下面四个输出语句分别会打印什么内容?
int main()
{
int n = 9;
float* pFloat = (float*)&n;
printf("n的值为:%d\n", n); //1
printf("*pFloat的值为:%f\n", *pFloat); //2
*pFloat = 9.0;
printf("num的值为:%d\n", n); //3
printf("*pFloat的值为:%f\n", *pFloat); //4
return 0;
}
9
float
类型的指针与int一样都可以访问四个字节的地址,所以解引用便访问到了n中的内容,又因为浮点数小数点后仅6位有效,因此打印出来应该是9.000000
%d
的形式进行打印,应该也还是9
9.000000
n
和 *pFloat
在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么大?这要涉及到浮点数在内存中【存】与【取】规则,接下去我们首先来了解一下这个规则
根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:
V = (-1)^S * M * 2^E
(-1)^S
表示符号位,占一位。当S = 0
,V为正数;当S = 1
,V为负数E
为指数,占用8位【阶符采用隐含方式,即采用移码方法来表示正负指数】在讲解例题之前,你首先要知道对于一个二进制数来说,其整数部分和小数部分每一位上所占的权重分别是多少
101
,这毋庸置疑,但是这个小数部分的5要如何去进行转换呢?对于0.5
来说我们刚才看了小数部分的权重之后知道是2-1,所以直接使这一位为1即可101.1
却远远大于1,所以我们可以通过在操作符中学习的【移位】操作将这个数进行左移两位,但是左移之后又要保持与原来的数相同,所以可以再乘上22使得与原来的二进制相同。接着根据公式就可以写出(-1)0 * 1.011 * 22这个式子,然后可以得出S、M、E为多少了S == 1
0.5
,如果是0.25
的话你可以将【2-2】置为1,依次类推。。。可以对于下面这个3.3
里面的0.3
你会如何去凑数呢,首先0.5
肯定不能,那只能有0.25
,但若是再加上0.125
的话那就多出来了,那应该配几呢?0.3
的。所以我们可以得出这个数字其实是无法在内存中进行保存。这也是为什么浮点数在内存中容易发生精度丢失的原因在上面,我们通过知晓了一些概念和案例,对浮点数首先有了一个基本的了解,其实呢对于浮点数来说是有一个统一标准来进行保存的
IEEE 754标准规定:
对于32位
的浮点数【float】,最高的1位是符号位S
,接着的8位是指数E
,剩下的23位为有效数字M
对于64位
的浮点数【double】,最高的1位是符号位S
,接着的11位是指数E
,剩下的52位为有效数字M
首先是对于有效数字(尾数)M
1 ≤ M < 2
,也就是说,M可以写成 1.xxxxxx
的形式,其中xxxxxx表示小数部分1
,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的时候,只保存01
,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。22位
,但若是将第一位的1舍去以后,等于可以保存23位
有效数字,精度相当于又高了一位至于指数E,情况就比较复杂
unsigned int
)[0 - 255]
;如果E为11位,它的取值范围为[0 - 2047]
好,通过上面的叙述,相信你对浮点数如何放到内存中有了一个了解,接下去我们马上来练习巩固一下
5.5
,注意如果定义成【float】类型的变量的话要在后面加上一个f
作为和【double】类型的区分float f = 5.5f;
5.5
这个数字去进行分析它存入到内存中的样子。通过上面算出来的S = 0, M = 1.011, E = 2
去写出这32位浮点数存放到内存中是一个怎样的形式
10000001
011
这三位放到内存中,但是规定了M为23位,此时我们只需要在后面补上20个0即可40 b0 00 00
00 00 b0 40
好,了解了如何将浮点数存放到内存中,先来我们来考虑一下如何将浮点数从内存中【读取】出来呢
指数E从内存中取出还可以再分成三种情况:
1. E不全为0或不全为1
127
,那么此时减去127即可;在计算尾数M的时候舍去了整数部分的1,那次此时再补上这个1即可2. E全为0
00000000
,这个情况是在指数E加上127之后的结果,那么原先最初的指数是多少呢?那也只能是-127
了。那如果这个指数是-127的话也就相当于是【1.xxxx * 2-127】,是一个非常小的数字,几乎是和0没有什么差别±0
,以及接近于0的很小的数字3. E全为1
11111111
,这个情况也是在指数E加上127之后的结果,那么原先最初的指数是多少呢?那便能是128
了,那也只能是-127
了。那如果这个指数是-127的话也就相当于是【1.xxxx * 2128】,是一个非常大的数字以上就是有关浮点数如何【写入】内存和从内存中【读取】的所有相关知识,你学会︿( ̄︶ ̄)︿了吗
讲了这么多 ,相信你也看烦了,还记得在本模块一开头我们遗留下来的那道题,现在通过学习了浮点数存与取的相关知识,我们再来做一下这道题
0 0000000 00000000 00000000 00001001
。然后是将这个n的地址存放到了一个浮点型的指针中去int n = 9;
float* pFloat = (float*)&n;
%d
的形式打印n不用考虑就是9;但是后一个就不一样了,对浮点型的指针进行解引用,那也就是要将存放在内存中的浮点数进行读取出来printf("n的值为:%d\n", n);
printf("*pFloat的值为:%f\n", *pFloat);
00000000000000000000000000001001
,将第一位看做是符号位0,即S == 0
,然后接下去就是8个比特位E,不过可以发现这个E是全0呀00000000
,就是我们上面所讲到的这种特殊情况0.xxxxxx
的形式即0.000000000000000000001001
。那对于指数E应该等于1-127为【-126】。所以最后写出来v的形式为(-1)^0 * 0.000000000000000000001001 * 2^ (-126)
0.000000
9.0
存放到n这块地址中去,那也就相当于是我们最先学习了如何将一个浮点数存放到内存中去*pFloat = 9.0;
1001.0
,然后通过v的公式得出(-1)^0 * 1.001 * 2^3
10000010
,尾数M也是同理,舍去1后看到001
,后面添上20个0补齐23个尾数位。最后的结果即为——> 0 10000010 00100000000000000000000
%d
的形式打印n,那么这一串二进制就会被编译器看做是补码,既然是打印就得是原码的形式,不过看到这个符号位为0,那我们也不需要去做一个转换,它就是原码printf("num的值为:%d\n", n);
01000001000100000000000000000000 —— 1,091,567,616
最后再来看一下运行结果
最后来总结一下本文所学习的内容
以上就是本文要介绍的所有内容,由衷得感谢您的阅读