在前面一节中简单介绍了变量的使用,当我们定义一个变量的时候,系统就会为变量分配一块存储空间。而变量的数值在内存中是以二进制的形式存储的,这讲来深入研究变量在内存中的一些存储细节。
为了更好地理解变量在内存中的存储细节,先来认识一下内存中的“字节”和“地址”。
1.计算机中的内存是以字节为单位的存储空间。内存的每一个字节都有一个唯一的编号,这个编号就称为地址。就好像酒店是以房间为单位的,每个房间都有一个唯一的房号,我们根据房号就能找到对应的房间。
里面的每个小框框就代表着内存中的一个字节,白色数字就是每个字节的地址(这里采取十六进制来显示,地址值是随便写的,仅作为参考,真实情况中的地址值不一定是这个),可以发现,内存中相邻字节的地址是连续的。
2.大家都知道,一个字节有8位,所能表示的数据范围是非常有限的,因此,范围较大的数据就要占用多个字节,也就是说,不同类型的数据所占用的字节数是不一样的。
跟其他编程语言一样,C语言中用变量来存储计算过程使用的值,任何变量都必须先定义类型再使用。为什么一定要先定义呢?因为变量的类型决定了变量占用的存储空间,所以定义变量类型,就是为了给该变量分配适当的存储空间,以便存放数据。比如char类型,它是用来存储一个字符的,一个字符的话只需要1个字节的存储空间, 因此系统就只会给char类型变量分配1个字节,没必要分配2个字节、3个字节乃至更多的存储空间。
1> 一个变量所占用的存储空间,不仅跟变量类型有关,而且还跟编译器环境有关系。同一种类型的变量,在不同编译器环境下所占用的存储空间又是不一样的。我们都知道操作系统是有不同位数的,比如Win7有分32位、64位,编译器也是一样的,也有不同位数:16位、32位、64位(Mac系统自带的GCC编译器是64bit的)。由于我们是Mac系统下开发,就以64位编译器为标准。
2> 下面的表格描述了在64位编译器环境下,基本数据类型所占用的存储空间,了解这些细节,对以后学习指针和数组时是很有帮助的。
3> 下面的表格描述了在不同编译器环境下的存储空间占用情况
当定义一个变量时,系统就会为这个变量分配一定的存储空间。
1 int main() 2 { 3 char a = 'A'; 4 5 int b = 10; 6 7 return 0; 8 }
1> 在64bit编译器环境下,系统为变量a、b分别分配1个字节、4个字节的存储单元。也就是说:
2> 上述变量a、b在内存中的存储情况大致如下表所示:
(注:"存储的内容"那一列的一个小格子就代表一个字节,"地址"那一列是指每个字节的地址)
在调试过程中,我们经常会采取打印的方式查看变量的地址
1 #include <stdio.h> 2 3 int main() 4 { 5 int a = 10; 6 printf("变量a的地址是:%p", &a); 7 return 0; 8 }
第6行中的&是一个地址运算符,&a表示取得变量a的地址。格式符%p是专门用来输出地址的。输出结果是:
变量a的地址是:0x7fff5fbff8f8
这个0x7fff5fbff8f8就是变量a的内存地址
1 int main() 2 { 3 int b = -10; 4 return 0; 5 }
在第3行定义了一个整型变量,它的值是-10。-10的二进制形式是怎样的呢?一个负数的二进制形式,其实就是对它的正数的二进制形式进行取反后再+1。(取反的意思就是0变1、1变0)
1> 先算出10的二进制形式:0000 0000 0000 0000 0000 0000 0000 1010
2> 对10的二进制进行取反:1111 1111 1111 1111 1111 1111 1111 0101
3> 对取反后的结果+1:1111 1111 1111 1111 1111 1111 1111 0110
因此,整数-10在内存中的二进制形式是:1111 1111 1111 1111 1111 1111 1111 0110。这里还能得出一个结论:负数的二进制形式的最高位一定是1。
变量的作用域就是指变量的作用范围。先来看看下面的程序:
1 int main() 2 { 3 int a = 7; 4 5 return 0; 6 }
1> 代码块其实就是用大括号{}括住的一块代码。
1 int main() 2 { 3 { 4 int a = 10; 5 6 printf("a=%d", a); 7 } 8 9 a = 9; 10 11 return 0; 12 }
2> 如果是下面这种情况
1 int main() 2 { 3 int a = 9; 4 5 { 6 int a = 10; 7 8 printf("a=%d", a); 9 } 10 11 return 0; 12 }
a=10
这里采取的是“就近原则”,也就是第8行访问的是在第6行定义的变量a,并不是在第3行的变量a。
变量在没有进行初始化之前,不要拿来使用,因为它里面存储的是一些垃圾数据
1 #include <stdio.h> 2 3 int main() 4 { 5 int c; 6 7 printf("%d", c); 8 return 0; 9 }
注意第5行的变量c,只是定义了变量,并没有给它赋初值。输出结果:
1606422622
可以发现,变量c里面存储的是一些乱七八糟的数据
上一讲简单介绍了常量和变量,这讲补充一点计算机的基础知识---进制。
我们先来看看平时是如何表示一个整数的,最常见的肯定是用阿拉伯数字表示,比如“十二”,我们可以用12来表示,其实这种表示方式是基于一种叫做“十进制”的计数方式。“进制”是一种计数方式,编程中常见的进制有4种:十进制、二进制、八进制、十六进制。也就是说,同一个整数,我们至少有4种表示方式。
十进制是我们最熟悉、最常用的一种计数方式,它有两个特点:由0、1、2….9十个基本数字组成;运算规则是“逢十进一”。
所谓“逢十进一”,似乎在小学数学中都已经学过了,也就是当数值满十时,就要向前进一位
个位数为9+1,满十了,十位数就进一。
二进制是计算机内部使用的一种计数方式,它有两个特点:由0、1两个基本数字组成;运算规则是“逢二进一”。
1> 有人可能会问:为什么二进制里面没有2~9这些数字呢?都说了,逢二进一,因此当数字满二的时候就会进位。
2> 如果我写个1010,你能看出它是二进制还是十进制么?为了跟其他进制区分开来,书写二进制数的时候,需要以0b或者0B开头。比如0b1010是个二进制数,而1010则还是我们熟悉的十进制数,就是“一千零一十”
做个简单的运算吧,比如1+1
个位数是1+1,值满二了,于是十位数要进一。因此,在二进制中:1 + 1 = 0b10,这里的0b10表示的是十进制中的“二”,并不是“十”。
以此类推,11 + 1 = 0b100
1> 用二进制表示数值,虽然简单、方便,但是不容易阅读,比如随便给出个二进制数0b110111101010,你能立刻看出它表示的是什么数值吗?一般需要将二进制数转为十进制数后才能知道代表的什么数值。
进制里面有个“基数”的概念,基数是用来计算数值的,比如十进制的基数是10,因此十进制是这样算数的:
1230 = 0 * 100 + 3 * 101 + 2 * 102 + 1 * 103 = 0 * 1 + 3 * 10 + 2 * 100 + 1 * 1000
二进制的基数是2,以此类推:
0b1011 = 1 * 20 + 1 * 21 + 0 * 22 + 1 * 23 = 1 * 1 + 1 * 2 + 0 * 4 + 1 * 8 = 1 + 2 + 0 + 8 = 11
因此二进制数0b1011表示的数值是十进制中的11
2> 一位二进制数能表示的最大值是1,而n位二进制数所能表示的最大值是0b111...1111,也就是说n位二进制数都是1,那么它的十进制数值为:
1 * 20 + 1 * 21 + 1 * 22 + 1 * 23 + .... + 1 * 2n-1 = 2n - 1
因此,n位二进制数所能表示的最大值是2n - 1。也就是说,4位二进制数能表示的最大值是0b1111,十进制数值为:24 - 1 = 15;5位二进制数能表示的最大值是25 - 1 = 31。
八进制有两个特点:由0~7八个基本数字组成;运算规则是“逢八进一”。
由于十进制和八进制中都包含了0~7,为了区分开来,在书写八进制数的时候,需要在前面加个0。比如076是个八进制数,76则是个十进制数。
个位数是7+1,值满八了,于是十位数要进一。因此,在八进制中,7 + 1 = 010。010则表示十进制中的“八”,而不是“十”
八进制的基数是8,因此027计算出来就是十进制中的23
027 = 7 * 80 + 2 * 81 = 7 * 1 + 2 * 8 = 23
不难发现一个十进制数可以表示的最大值是9,而一个八进制数可以表示的最大值是7,恰好3个二进制数可以表示的最大值0b111也是7。因此,我们可以用一个八进制数来代替3个二进制数。
0b11110011 = 0b 011 110 011 = 0363
如果是八进制转为二进制,那就反过来,用3位二进制数来表示1位八进制数
025 = 0b 010 101 = 0b10101
十六进制有两个特点:由0~9和A~F组成,A~F分别表示10~15;运算规则是“逢十六进一”。
由于十进制、八进制、十六进制中都包含了0~7,为了区分开来,在书写十六进制数的时候,需要在前面加个0x或者0X。比如0x76是个十六进制数,076是个八进制数,76则是个十进制数。
个位数是B+5,也就是11+5,值满十六了,于是十位数要进一。因此,在十六进制中,B + 5 =0x10。0x10则表示十进制中的“十六”,而不是“十”
十六进制的基数是16,F表示十进制中的15,因此0x2F计算出来就是十进制中的47
0x2F = 15 * 160 + 2 * 161 = 15 * 1 + 2 * 16 = 47
一个十六进制数可以表示的最大值是15,恰好4个二进制数可以表示的最大值0b1111也是15。因此,我们可以用一个十六进制数来代替4个二进制数。
0b11110011 = 0b 1111 0011 = 0xF3
如果是十六进制转为二进制,那就反过来,用4位二进制数来表示1位十六进制数
0x25 = 0b 0010 0101=0b100101
1.一个整数“十二”的4种表示方式分别如下:
十进制:12
二进制:0b1100
八进制:014
十六进制:0xC
2.其实也可以利用Mac中的计算器软件来测试进制之间的转换。
设置计算机的显示模式为“编程器”
先选择10进制,然后输入12,底部显示的二进制数为1100,这里省略最前面的0b
选择八进制,显示为14,这里省略了最前面的0
选择十六进制,显示为0xC
1.上一讲学习了变量的使用,简单回顾一下
1 int main() 2 { 3 int a = 10; 4 return 0; 5 }
在第3行定义了一个变量a,存储的是十进制整数10。其实,这个变量a在内存中是以二进制数的形式存储的,10的二进制形式是1010。
2.除了十进制整数,还可以将其他进制的整数赋值给整型变量
1 int main() 2 { 3 int a = 0b110; // 十进制数:6 4 5 int b = 021; // 十进制数:17 6 7 int c = 12; // 十进制数:12 8 9 int d = 0x1D; // 十进制数:29 10 11 return 0; 12 }
上面的代码中,分别将4种不同进制的数值赋值给不同的整型变量。对应的十进制数值已经写在右边的注释中。它们最终都是以二进制的形式存储在内存中。
前面给变量赋值了各种进制的整数,究竟这些整数的十进制形式为多少呢?我们自己可以换算出来,不过总是自己去算,太麻烦了,我们可是程序员,应该利用程序帮我们算出来。前面已经学过printf("Hello World");语句的作用是在屏幕输出Hello World这一串内容。我们其实也可以利用printf将一个变量输出到屏幕,看看这个变量的值究竟为多少。
这个printf看起来好像是你往它的小括号里面放什么内容,它就会在屏幕上输出什么内容,但是printf的用法有讲究的,像下面的写法就是错误的:
1 #include <stdio.h> 2 3 int main() 4 { 5 int a = 0x1D; 6 7 printf(a); 8 9 return 0; 10 }
有人可能会疑惑,为什么有时需要#include <stdio.h>,有时又不需要#include <stdio.h>?这个暂时不去详细讨论,你先记住只要用了printf,就要添加#include <stdio.h>。
在第5行定义了变量a,初值为一个十六进制数。在第7行想通过printf输出变量a的数值,但是第7行的写法是错误的。 要想利用printf输出一个整型变量,就必须先说明输出的格式,比如是以十进制格式输出还是以八进制格式输出?
下面的写法才是正确的:
1 #include <stdio.h> 2 3 int main() 4 { 5 int a = 0x1D; 6 7 printf("变量a的值为%d", a); 8 9 return 0; 10 }
注意看第7行,左边双引号括住的内容代表着要输出到屏幕的内容,不过并不是直接将 "变量a的值为%d" 输出到屏幕。%d是一种格式符,它的意思是用右边变量a的值替代%d的位置进行输出,并且以十进制格式输出。说白了,格式符是用来控制输出格式的。
程序在终端上的运行结果是:
可以发现,输出了"变量a的值为29",0x1D的十进制数值确实是29,说明这个输出是正确的。但是这个29跟后面的英文连在一起了,非常难看,这时候我们可以在%d的后面加一个\n表示回车换行。
1 #include <stdio.h> 2 3 int main() 4 { 5 int a = 0x1D; 6 7 printf("变量a的值为%d\n", a); 8 9 return 0; 10 }
注意第5行的改变:在%d的后面加了个\n,表示将变量a以十进制格式输出后进行回车换行。
这时候的运行结果是:
除开%d,printf还支持很多格式符,如下表所示(红色表示常用),这份表格的内容不用去死记,用到时再回来查资料即可
接下来简单演示一下%x的使用,它的功能是以十六进制形式输出整数
1 #include <stdio.h> 2 3 int main() 4 { 5 int a = 17; 6 7 printf("%x\n", a); 8 9 return 0; 10 }
在第5行定义了变量a,存储的是十进制整数17,在第7行让变量a以十六进制形式输出,运行结果是:
可以发现,十进制整数17以十六进制形式输出就是11,这是正确的。
看下面代码,利用printf同时输出多个数值
1 #include <stdio.h> 2 3 int main() 4 { 5 int age = 17; 6 7 int no = 10; 8 9 printf("age = %d, no = %d\n", age, no); 10 11 return 0; 12 }
注意看第9行,左边的双引号内有2个%d,age的值会代替第一个%d进行输出,no的值会代替第二个%d进行输出,并且都是以十进制形式输出。输出结果:
1 #include <stdio.h> 2 3 int main() 4 { 5 6 printf("输出的常量为%d\n", 11); 7 8 return 0; 9 }
注意第6行,右边的是一个整型常量11,它会代替%d的位置进行输出。输出结果:
用了半天,似乎还是没有说到printf究竟是个什么东西,这个会放到后面详细讨论,它还有其他复杂用法。