C语言数据的存储

目录

 数据类型介绍

整形在内存中的存储

1.原码、反码、补码

2.大端小端介绍

 为什么会存在大端小端呢?

3.char型​​​​​​​

4.浮点数存储规则


 *本文内容主要来源于网络与自己的学习笔记

 数据类型介绍

1.C语言基本内置类型

char           //字符型

short          //短整形

int              //整形

long           //长整型

long long    //更长的整形

浮点数:

float            //单精度浮点数

double      //双精度浮点数

char

                unsigned char

                signed char

short

                unsigned short [int]

                 signed short [int]

int

                 unsigned int

                signed int

long

                unsigned long [int]

                signed long [int]

指针类型: int* p

                char*  p

                float*  p

                void*  p

(void 表示空类型(无类型)通常应用于函数的返回类型、函数的参数、指针类型)

开辟空间的大小决定了使用范围

整形在内存中的存储

1.原码、反码、补码

计算机中整数的表示方法为原、反、补码三种;

三种表示方法均有符号位数值位两部分,符号位都是用0表示“正”,用1 表示“负”,而数值位负整数的三种表示方法各不相同。

正数的原码、反码、补码相同

原码:直接将二进制按正负数形式翻译为二进制

反码:将原码的符号位不变,其他位依次按位取反就可以得到了

补码:反码加1得到补码

C语言数据的存储_第1张图片

例如

C语言数据的存储_第2张图片

 对于整型数据来说,数据是以补码的形式存入内存中的,这是为什么呢?

        这样避免了0的编码有两个,同时符号位和有效值位可以一起处理,减法通过加法就可以实现,即简化了计算机的结构设计也提高了运算速度。

2.大端小端介绍

大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址

小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地

中。

eg:假如有0x 11 22 33 44要存入内存

C语言数据的存储_第3张图片

 为什么会存在大端小端呢?

        计算机系统中内存是以字节为单位进行编址的,每个地址单元都唯一的对应着1个字节(8 bit)。这可以应对char类型数据的存储要求,因为char类型长度刚好是1个字节,但是有些类型的长度是超过1个字节的,还有16 bit的short型,32 bit的long型。另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。不同的安排顺序导致了大端存储模式小端存储模式的存在

3.char型

首先举个例子://输出什么?

#include 
int main() {   
    char a= -1; 
    signed char b=-1;
    unsigned char c=-1;
    printf("a=%d,b=%d,c=%d",a,b,c);
    return 0;
 }

结果为:-1,-1,  255

C语言数据的存储_第4张图片

 分析:首先char a=-1,定义了一个有符号的类型(我们先明确a在内存中放的是它的补码)

        写出其32位二进制原码://10000000000000000000000000000001

                               反码://11111111111111111111111111111110

                               补码://11111111111111111111111111111111

                                

        得到了-1   32位的补码,但是char类型只占一个字节(8位),

        所以只能存8位所以a里就存了8位

        b与c与a类似(都为char)存的都是11111111

  接着分析:

                对于a和b,两者都是有符号数,最高位1表示其符号,c是无符号数,最高位的1就没有表示符号。 到了打印部分将a,b,c以%d的形式输出,就需要整形提升。

关于整形提升:

整型提升是C程序设计语言中的一项规定:在表达式计算时,各种整型首先要提升为int类型,如果int类型不足以表示则要提升为unsigned int类型;然后执行表达式的运算。

整型提升时是按照变量的补码被截断时的最高位是什么进行补位的,如果截断后最高位(即最左面)的一位数为 1 则在最高位前补 1 ,如果最高位是 0 则在前面补 0 ,补够32位即int类型

1.无符号整形提升,高位补0

2.有符号的整形提升,高位补其符号位


                对于a和b(这两者一样):将11111111整形提升得到补为 :                                              11111111111111111111111111111111

转化为反码:11111111111111111111111111111110

变为原码:10000000000000000000000000000001

        正好就是-1的原码,所以a和b输出都是-1。

对于c:由于c为unsigned类型,最高位没表示符号,所以在整形提升时往高位补0

 其补码为:00000000000000000000000011111111

补完之后其最高位为0,表明为正数,而正数的原、反、补码相同,所以最终以原码的形式输出的结果就是11111111的十进制数255

  


由此,对char类型的内存补码(有符号):

C语言数据的存储_第5张图片

 在内存中,从00000000一直到01111111127)时再加1就变为了10000000,往后最高位的1表示其为负数,比较特别的10000000-128,往后10000001(补码)转换成原码是11111111(-127),往后增加就可以得到有符号char的范围是-128~127.

  类似的无符号char:

C语言数据的存储_第6张图片                                           

范围为0~255 

                

小结:对于有符号char类型,其数据从0开始到127(01111111)时再加一来到了10000000(-128),再往后-127,-126。。。。-2,-1,  0 

C语言数据的存储_第7张图片


4.浮点数存储规则

浮点数与整数的存储是有区别的

首先根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:(-1)^S * M * 2^E

         (-1)^s表示符号位,当s=0,V为正数;当s=1,V为负数。

          M表示有效数字,大于等于1,小于2。

         2^E表示指数位。

eg:9.0

先将其写成二进制:1001.0

然后化为:(-1)^0  * 1.001  *2^3

s=0;

M=1.001

E=3

eg2:5.5

        101.1

可能比较难理解小数点后为什么是1,对于这个二进制数,从右到左权重值为-1->0->1->2这里可以理解为小数点后1的权重值为-1,而2*1的-1次方为二分之一,就是0.5

(-1)^0 *1.01 *2^2


IEEE 754规定: 对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。(float型)

C语言数据的存储_第8张图片

对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。

C语言数据的存储_第9张图片

        先前,我们知道了(1<=M<=2)M写成1.xxxx的形式。IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1因此可以被舍去,只保存后面的 xxxxxx部分。比如保存1.01的时 候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。

        至于E的存入:它为一个无符号整数(unsigned int)因此存的只能是正数。如果E为8位它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我们 知道,科学计数法中的E是可以出 现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数 是127;对于11位的E,这个中间 数是1023

        E的取出也可分三种情况:

1.E不为全0或1

        这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将 有效数字M前加上第一位的1

2.E全为0

        浮点数的指数E等于1-127(或者1-1023)即为真实值, 有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数

3.E全为1

如果有效数字M全为0,表示±无穷大(正负取决于符号位s)

为了理解,接着看一段代码:

#include 
int main()
 {
	 int n = 9;//4byte
	 float* pFloat = (float*)&n;
	 printf("n的值为:%d\n", n);
	 printf("*pFloat的值为:%f\n", *pFloat);

	 *pFloat = 9.0;
	 printf("num的值为:%d\n", n);
	 printf("*pFloat的值为:%f\n", *pFloat);//9.0
	 return 0;
 }

结果为

C语言数据的存储_第10张图片

 第一个和最后一个问题不大,问题出在中间两个,整形以浮点型输出与浮点型以整形输出结果都是不一样的。

分析二三行:

先写出n的二进制:00000000 00000000 00000000 00001001

打印时我们认为其是以浮点数的形式打印,对这个二进制数解读就会如下

这时其最高位:s--0

                 E--00000000(往后8位)为全0,看上面的第二种情况

                M--0000000 00000000 00001001(后23位)

M

               0. 0000000 00000000 00001001

对于E(全0):根据上文写成1-127

所以有:(-1)^0  *  0. 0000000 00000000 00001001  *2^-126

0.xxxx再乘2的-126次就基本上可以看成0了,所以第二行输出0.000000(只呈现后六位)

到第三行:

       将9.0存入数据时

9.0 -> 1001.0 ->(-1)^0  * 1.001  *2^3 -> s=0, M=1.001,E=3+127(中间数)=130

有效数字E:130换为二进制(10000010

有效数字M等于001后面再加20个0,凑满23位

写成二进制形式(s+E+M):

0   10000010   00100000000000000000000

(二进制补码)符号位是0,为正数,原码与补码相同,

因此打印的就是该二进制换成的十进制数,就是1091567616

C语言数据的存储_第11张图片

你可能感兴趣的:(c语言)