本章内容是【C语言进阶学习笔记】第一篇内容,主要探讨数据的分类、数据的存储方式、大小端字节序判断等。
用户自定义的类型,使用者自主设计的类型
要理解好这些类型,我们要思考好类型的意义。
类型的意义,可以从以下两个角度考虑:
1.使用这个类型开辟内存空间的大小(大小决定了使用范围)
比如说使用char类型创建的变量,开辟的内存空间是1个字节,使用int类型创建的变量,开辟的内存空间是4个字节。
2.如何看待内存空间的视角
比如:
int a = 0;
float b = 0.0;
虽然 a, b都是占用4个字节的空间,但是我们在看待a的时候,因为其类型是int,所以我们会把a当做整型来看待,在看待b的时候,因为其类型是float,所以我们会把b当做小数(而非整型)来看待。
[int] 可以省略 unsigned (无符号) signed(有符号)
注意:char也算到整型家族里面,因为字符在底层存储的时候,存储的是字符所对应的ASCII值(整数)
unsigned / signed的理解和区别 有符号signed的最高位为符号位,1表示负数,0表示正数, unsigned均为正数,最高位1是实数位,不为符号位。例如char类型,一个char是一个字节 = 8bit,10001101 如果是signed char,则最高位1是符号位,表示 - 1,如果是unsigned char,则最高位是实数位(有效位),不为符号位。
char的类型到底是unsigned char还是signed char是不确定的,取决于编译器。
short的类型明确规定为 signed
short int的类型明确规定为 signed int
long的类型明确规定为 signed long
两类,均是小数(浮点数没有signed 和unsigned区分)
整型和浮点型属于内置类型:
看下面这个例子:
#include
int main()
{
int a = 3;
int b = -1;
return 0;
}
为了查看a, b在内存中的存储形式,我们在编译器里面按F10进入调试,变量a,b创建后,打开内存监视器,输入& a,& b查看a,b对应的地址及其内容。
& a:
& b:
数据在内存中存储时是按二进制的补码存储的
VS在展示内存的时候,为了方便展示,显示的是16进制数据。
什么意思呢?我们定义一个变量c,以16进制形式对其赋值,然后& c,可以看到:
c输入的16进制形式是11223344,存储的时候是44332211,可以发现是倒着存储的(这个后面会详细讲解)。
下面先来了解几个概念︰原码、反码、补码
计算机中的有符号数有三种表示方法,即原码、反码和补码。
三种表示方法均有符号位和数值位两部分,符号位都是用0表示′正”,用1表示"负”,而数值位三种表示方法各不相同。
原码:直接将二进制按照正负数的形式翻译成二进制就可以。
反码:将原码的符号位不变,其他位依次按位取反就可以得到了。
补码:反码 + 1就得到补码。
(正数原码反码补码三码合一,负数的原反补按照上面的规则进行转换)
整数有两种,有符号数和无符号数
有符号数-- - 符号位 + 数值位
正数 0 + 数值位
负数 1 + 数值位
int b = -1;
//10000000 00000000 00000000 00000001 - 原码
//11111111 11111111 11111111 11111110 - 反码
//11111111 11111111 11111111 11111111 - 补码
//ff ff ff ff - 十六进制显示形式
int a = 3;
//00000000 00000000 00000000 00000011 - 原码、反码、补码
//0000 0000 0000 0000 0000 0000 0000 0000 0000 0011
//0 0 0 0 0 0 0 0 0 3
// 00 00 00 03
unsigned short n = 0; // 0 --65535
signed short m = 0; // -32768–32767
对于整型来说:数据存放内存中其实存放的是补码。
我们首先来看一下 1 - 1这个例子:
①先按照原码的方式去计算。
在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理; 同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
怎么理解补码与原码相互转换,其运算过程是相同的?(以下运算,符号位均不变)
原码->取反 + 1->补码
补码->取反 + 1->原码
当然补码到原码也可以是:补码 -> - 1 取反->原码
例如 - 1:
11111111 11111111 11111111 11111111 - 补码
补码->取反 + 1->原码
10000000 00000000 00000000 00000000 - 取反
10000000 00000000 00000000 00000001 - +1
补码 -> - 1 取反->原码
11111111 11111111 11111111 11111110 - -1
10000000 00000000 00000000 00000001 - 取反
最终得到的结果均是:10000000 00000000 00000000 00000001
大端(存储)模式:是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;
小端(存储)模式:是指数据的低位保存在内存的低地址中,而数据的高位, , 保存在内存的高地址中。
①为什么叫大端、小端呢?
和格列佛游记故事有关
②为什么会有大小端模式之分呢 ?
这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。
但是在C语言中除了8bit的char之外,还有16bit的short型,32bit的long型(要看具体的编译器)。
另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如果将多个字节安排的问题。
因此就导致了大端存储模式和小端存储模式。
例如一个16bit的short型x,在内存中的地址为ox0010),x的值为0×1122,那么0x11为高字节,0x22为低字节。对于大端模式,就将0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式,刚好相反
我们常用的x86结构是小端模式,而KEIL c51则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。
③如何判断大端、小端(字节序)呢?
思路:
int a = 1;
将a的第一个字节内容拿出来,判断其是1还是0,1为小端,0为大端。
当然,这里我们也可以将其封装成一个函数,根据其返回值确定是大端还是小端字节序。
int check_sys()
{
int a = 1;
char* p = (char*)&a;
if (*p == 1)
return 1;//小端
else
return 0;//大端
}
当然这个函数我们也可以进行简化:
int check_sys()
{
int a = 1;
return (char*)&a;
}
#include
int main()
{
char a = -1;
signed char b = -1;
unsigned char c = -1;
printf("a = %d,b = %d,c = %d\n", a, b, c);
return 0;
}
结果展示:
结果分析:这里我们知道VS2019的编译器下char 类型等同于 signed char类型
进一步分析:a, b, c三者的存储形式是什么样子的?为什么% d打印出来的结果不同?
#include
int main()
{
char a = -128;
printf("%u\n", a);
return 0;
}
分析:
#include
int main()
{
char a = 128;
printf("%u\n", a);
return 0;
}
int main()
{
int i = -20;
unsigned int j = 10;
printf("%d\n", i + j);
return 0;
}
#include
int main()
{
unsigned int i = 0;
for (i = 9; i >= 0; i--)
{
printf("%u\n", i);
}
return 0;
}
unsigned int i//i为无符号整型,恒>=0,循环语句的判断条件恒成立。
为了能更好的观察到代码结果的变化,我们加上Sleep(1000),每打印一行都暂停1000ms = 1s。
#include
#include
int main()
{
unsigned int i = 0;
for (i = 9; i >= 0; i--)
{
printf("%u\n", i);
Sleep(1000);
}
return 0;
}
#include
#include
int main()
{
char arr[1000];
int i;
for (i = 0; i < 1000; i++)
{
arr[i] = -1 - i;
}
printf("%d", strlen(arr));
return 0;
}
数组arr是char类型,char类型的取值范围为 - 128 — 127 用strlen函数求字符串的长度,
strlen会在找到\0后停止计算长度,\0的ASCII码值为0 arr[0] = -1, 从 - 1 —> 0要经过 - 1, - 2, - 3,…… - 128, 127, 126……3, 2, 1, 0
128 + 128 = 256个数字,将最后一位的\0排除(strlen在计算字符串长度的时候,遇到\0停止且不计算\0的长度),所以最后的结果是255。
#include
unsigned char i = 0;
int main()
{
for (i = 0; i <= 255; i++)
{
printf("hello world\n");
}
return 0;
}
分析:
和第六题的原理类似,条件 <= 255恒成立,死循环了。