我们已经学习了基本的内置类型
char //字符数据类型
short //短整型
int //整型
long //长整型
long long //更长的整型
float //单精度浮点型
double //双精度浮点型
//C语言中没有字符串类型
他们所占的存储空间大小.特别注意的是long>=int
类型的意义
char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]
[]当中的内容可以省略
数值
正数和负数:
有些数值只用正数,没有负数(身高)
有些数值有正数也有负数(温度)
浮点型家族
float
double
构造类型
> 数组类型
> 结构体类型 struct
> 枚举类型 enum
> 联合类型 union
数组为什么也是构造类型?
int arr[5]
int arr[6]
char brr[5]
这就说明数组类型是不唯一的,所以也属于构造类型
指针类型
int* pi
char* pc
float* pf
void* pv
空类型
void标识空类型(无类型)
通常应用函数的返回值,函数的参数,指针类型
一个变量的创建是要在内存中开辟空间的.空间的大小是根据不同的类型决定的,接下来我们讲讲数据在所开辟内存中到底是如何存储的?
比如:
int a = 20;
int b = -10;
我们知道这里分别为a,b
开辟四个字节的空间
究竟如何存储,我们首先要了解下面的概念:
计算机中的整数有3种2进制表示方法,即原码,反码,补码
三种表示方法均有符号位和数值位两部分,符号位都用0表示"正",1表示"负",而数值位正数的原,反,补码相同.
负数的三种表示方法各不相同
原码
直接将数值按照正负数的形式翻译成二进制就可以得到原码
反码
将原码的符号位不变,其它位依次按位取反就可以得到原码
补码
反码加1就可以得到补码
对于整型来说,数据存放到内存中其实存放的是补码
为什么呢?
在计算机系统中,数值一律用补码来表示和存储.原因在于,使用补码,可以将符号位和数值域统一处理;
同时,加法和加法也可以统一处理(CPU只有加法器),此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路
原码-->补码
原码符号位不变,其它位按位取反再加1就可以得到补码
补码-->原码
1.补码减1,符号位不变,其它位置取反
2.补码取反加1得到原码
一个数值超过一个字节了,要存储在内存中就会有顺序的问题
假如
0x11223344
这个十六进制数字在内存中到底是怎么存储的呢?,
以下图,到底是哪一个存储方式,首先要了解大端和小端的概念
什么是大端小端
大端(存储)模式:是指数据的低位保存在内存中的高地址中,而数据的高位,保存在内存的低地址中
小端(存储)模式:是指数据的低位保存在内存中的低地址中,而数据的高位,保存在内存的高地址中
为什么有大端小端
为什么有大小端模式之分那?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元对应一个字节,一个字节8个比特位.但是在C语言中除了8个bite的
char
之外,还有16个bite的short
,另外对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在一个如何将多个字节安排的问题.因此就导致了大端存储模式和小端存储模式.
一个数字权重低的是低位,
例如0x11223344
从右到左权重首先是16^0,16^1,依次升高
小端存储:是指数据的低位
保存在内存中的低地址
中,数据的高位
保存在内存中的高地址
中
大端存储:是指数据的低位
保存在内存中的高地址
中,数据的高位
保存在内存中的低地址
中
自己总结的口诀:小同大异
程序设计:
#include
int main() {
int a = 1;
char* p = (char*)&a;
if(*p == 1) {
printf("小端\n");
}else {
printf("大端\n");
}
}
思路:
1的十六进制表示为0x00 00 00 01
假设是小端存储就是这个样子:
假设是大端存储,是这个样子:
我们把这个
int
强转为char
只取最低的地址,如果最低位中存放的是1,就是小端存储,如果是0就是大端存储
这里告诉同志们一个题外的知识:
未来在找工作的时候,这一类公司一定要小心:
- 你没有投递过这家公司
- 但是打电话让你去面试
这其实都是培训机构,打着招聘的幌子在招生
注意:
1.内存中存放的是补码
2.整型表达式计算使用的内存中补码计算的
3.打印和我们看到的都是原码
//输出什么
#include
int main() {
char a = -1;
signed char b = -1;
unsigned char c = -1;
printf("%d %d %d", a, b, c);
return 0;
}
又因为题目中定义的是char
所以要发生截断,只保留前8个比特位所以-1就变为:
内存中存的也是如上图所示,打印的时候因为是%d
,是十进制的整型,所以要发生整型提升,变为:
所以a和b的值都是-1,对于c的整型提升
#include
int main() {
char a = -128;
printf("%u\n", a);
return 0;
}
//%u 是打印无符号整型,认为内存中存放的补码对应是一个无符号数
//%d 是打印有符号整型,认为内存中存放的补码对应是一个有符号数
内存中存放的是:
整型提升后:
最后是无符号打印,所以是
注意
我在看到这道题目的时候,
误区
整形提升看的是定义的时候,规定的是否是有无符号,不是看的打印时候规定的是有符号还是无符号的,%u
打印的时候当成的是无符号,但实际还是一个有符号的数字
#include
int main() {
char a = 128;
printf("%u\n", a);
return 0;
}
首先发生截断:
最后结算的结果(其中的补码是整型提升得到的):
又因为这是个正数,所以原码,反码,补码相同
#include
int main() {
int i = -20;
unsigned int j = 10;
printf("%d\n", i + j);
return 0;
}
因为这是个正数,正数的原码,反码,补码相同,
最后将两个数的补码相加,得到后,转化为原码就可以了
1.计算机中存的都是补码,显示出来的是原码
2.整型提升的时候看的是定义的时候是否有符号位
3.对于少于4个字节的数据类型,首先要按照int类型来求原码,反码,补码,最后截断存放到对应的地址中
4.正数的原码,反码,补码相同
最后的最后就是整型提升的方法:
整型提升是C程序设计语言中的一项规定:在表达式计算时,各种整形首先要提升为int类型,如果int类型不足以表示则要提升为unsigned int类型;然后执行表达式的运算。
提升规则:如果有符号按照符号补全如(10001111整型提升为11111111111111111111111110001111)
如果无符号整形提升,则直接补0
#include
int main() {
unsigned int i;
for(i = 9; i >= 0; i--) {
printf("%u\n",i);
}
}
这个题目中定义的是一个无符号的
i
,说明i
永远都大于等于0,所以这是一个死循环.
#include
#include
int main() {
char a[1000];
int i;
for(int i = 0; i < 1000; i ++) {
a[i] = -1 - i;
}
printf("%d\n", strlen(a));
return 0;
}
我们知道
strlen
是计算字符串的长度,并且遇到0停止,又因为是char
类型,所以只能存放8个比特位,这是一个,看下面这个图片可以知道0到-1之间有225个数字
#include
unsigned char i = 0;
int main() {
for(int i = 0; i <= 255; i ++) {
printf("hello world!");
}
return 0;
}
因为这是一个无符号的
i
,所以他的最大值只能是255,所以这是一个死循环.
#include
int main() {
int n = 9;
float *pFloat = (float*)&n;
printf("n的值为:%d\n", n);
printf("*pFloat的值为:%f\n", *pFloat);
*pFloat = 9.0;
printf("num的值为:%d\n", n);
printf("*pFloat的值为:%f\n", *pFloat);
}
运行结果是
至于为什么是这样,我们要先了解浮点数在内存中到底是怎么存储的
根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数V可以表示成下面的形式:
- (-1)^S * M * 2^E
- (-1)^S 表示符号位,当S=0,V为正数,当S=1, V 为负数
- M表示有效数字,大于等于1,小于2
- 2^E表示指数位
可以看成S = 0 , M = 1.011, E = 2;
IEEE754的规定
对于32的浮点数,最高的一位是符号位S,接着8位是指数E,剩下的23位为有效数字M
对于64位的浮点数,最高的一位是符号位S,接着的11个位置是指数E,剩下的52位为有效数字M
IEEE 754对有效数字M和指数E,还有一些特别的规定
前面说过
1<=M<2
,也就是说,M可以写成1.xxxxxx
的形式,其中xxxxx表示小数部分
IEEE 754规定,在计算机内部保存M时,默认这个数的第一总是1,因此可以被舍去,只保存后面的小数部分,等到读取的时候,再把第一位的1加上去.这样做的目的是为了节省一位有效数字.以32为浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字
至于指数E情况比较复杂
首先,E为一个无符号整数(unsigned int),
这意味着如果E是8位,它的取值范围0~255;如果E是11位它的取值范围0 ~ 2047,但是我们知道科学计数法中的E是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须加上一个中间数,对于8位的E这个中间数是127,对于11位的E这个中间数是1023.比如2^10,在保存成32位浮点数的时候,必须保存成10+127=137,然后从E内取出还分为3种情况:
E不全为0或E不全为1
这是浮点数就采用下面的规则来表示,即指数E的计算减去127(或1023),得到真实值,再将有效数字M前加上第一位的1
E全为0
这是浮点数的指数E等于1-127(或者1-1023),即为真实值,是一个接近0的很小的数字
E全为1
这是表示正负无穷大
解释前面的例子
9是以整型的规则存进内存,所以表示补码的形式存储
但是如果直接转换为float的形式,就不一样了
这是E全为0的情况,实际的E是-127所以这是一个无穷小的数字,打印的结果就是0
接着题目又以float的形式存入一个9.0,所以用浮点型的规则打印的时候是9.0,但是用整型的规则打印就是这样
这串数字如果用整型来打印就是1091567616,所以才会造成例子中的情况
这里要特别注意不能忘记E在存入的时候要加上一个中间值,否则结果会错误.
当打印后面的时候,好像不能很好的打印出来,这就是因为在凑小数的时候,很难凑整,所以会造成精度丢失.