目录
编辑
1. 程序的翻译环境和执行环境
2. 详解编译+链接+运行
2.1 翻译环境
编辑
2.2 编译的几个阶段
编辑
2.3 运行环境
2.4 总结
3. 预处理详解
3.1 预定义符号
编辑3.2 #define
3.2.1 #define定义标识符常量
3.2.1 #define定义宏
3.2.3 #define替换规则
3.2.4 #和##
3.2.5 带副作用的宏参数
3.2.6 宏和函数对比
3.2.7命名约定
3.3 #undef
3.4 命令行定义
3.5 条件编译
3.6 文件包含
3.6.1 头文件被包含的形式
3.6.2 嵌套文件包含
编辑
4. 其他预处理指令
在ANSI C的任何一种实现中,都存在两个不同的环境:
第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。
将test.c文件(源文件 --- 存放的是文本信息的代码)通过翻译环境转换为test.exe文件(可执行程序 --- 存放的是2进制的指令)。
第2种是执行环境,它用于实际执行代码。
将test.exe文件通过运行环境执行成我们想要的代码。
- 组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)。
- 每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
- 链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。
看代码:
sum.c
int g_val = 2016;
void print(const char* str)
{
printf("%s\n", str);
}
test.c
#include
int main()
{
extern void print(char* str);
extern int g_val;
printf("%d\n", g_val);
print("hello world!\n");
return 0;
}
如何查看编译期间的每一步发生了什么呢?
1.预处理 选项 gcc -E test.c -o test.i
预处理完成之后就停下来,预处理之后产生的结果都放在test.i文件中。
2.编译 选项 gcc -S test.c
编译完成之后就停下来,结果保存在test.s中。
3.汇编 gcc -c test.c
汇编完成之后就停下来,结果保存在test.o中。
程序执行的过程:
- 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成;在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
- 程序的执行便开始。接着便调用main函数。
- 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
- 终止程序。正常终止main函数;也有可能是意外终止。
__FILE__
__LINE__
__DATE__
__TIME__
__STDC__//进行编译的源文件
//文件当前的行号
//文件被编译的日期
//文件被编译的时间
//如果编译器遵循ANSI C,其值为1,否则未定义
这些预定义符号都是语言内置的,例如:
#include
int main()
{
printf("file:%s\n", __FILE__);
printf("line:%d\n", __LINE__);
printf("date:%s\n", __DATE__);
printf("time:%s\n", __TIME__);
printf("function:%s\n", __FUNCTION__);
return 0;
}
语法:
#define name stuff
意思是将后边的内容替换成自己想要的内容,在代码中使用#define定义的符号常量可以在整个程序中使用,方便统一修改和管理。
举个例子:
#include
#define MAX 100
#define INT int
#define STR "abcdef"
#define A 3+5
int main()
{
int a = MAX;
INT b = 0;
printf("%s\n", STR);
int c = A;
return 0;
}
替换后的效果:
int main()
{
int a = 100;
int b = 0;
printf("%s\n", "abcdef");
int c = 3+5;
return 0;
}
还有一种比较有意思的写法,有的程序员觉得switch case语句中的break每次都要写,太麻烦了,就想了个办法,用#define CASE break;case 替换,每次只需写CASE就行了,既节省了时间还不容易出错:
#define CASE break;case
int main()
{
int n = 0;
scanf("%d", &n);
switch (n)
{
case 1:
CASE 2:
CASE 3:
}
return 0;
}
替换后的效果:
int main()
{
int n = 0;
scanf("%d", &n);
switch (n)
{
case 1:
break; case 2 :
break; case 3 :
}
return 0;
}
那么,我们在define定义标识符的时候,要不要在最后加上 ; 呢?
比如:
#define MAX 1000;
#define MAX 1000
建议最好不要加上;,这样容易出现问题。
比如下面的场景:
#define MAX 100;
int main()
{
int a = 10;
int b = 0;
if (a > 5)
b = MAX;
else
b = -1;
return 0;
}
上面这种写法会出现语法错误,因为将MAX替换后,会出现两个分号(;),而if语句后面只能默认跟一条语句,这个时候如果后面没有大括号的话就会出现问题。
#define 机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或定义宏(define macro)。
下面是宏的申明方式:
#define name( parament-list ) stuff
其中的 parament-list 是一个由逗号隔开的符号表,它们可能出现在stuff中。
注意:
- 参数列表的左括号必须与name紧邻。
- 如果两者之间有任何空白存在,参数列表就会被解释为stuff的一部分。
举个栗子:
#define sum(x,y) x+y
int main()
{
int a = 10;
int b = 20;
int c = sum(a, b);
printf("%d\n", c);
return 0;
}
这个宏接收两个参数x,y,将变量a和b的值置于程序中,预处理器就会用10+20替换程序中的表达式。
但是这个宏存在一个问题,让我们一起来观察一下下面这段代码:
#define SQUARE(x) x * x
int main()
{
int a = 5;
int x = SQUARE(a + 1);
printf("%d\n", x);
return 0;
}
乍一看,你可能会觉得这段代码将打印36这个值,事实上,它将打印11,为什么呢?
这是因为替换文本时,参数x被替换成a + 1,所以这条语句实际上变成了:
printf ("%d\n",a + 1 * a + 1 );这样就比较清晰了,由替换产生的表达式并没有按照预想的次序进行求值。那该怎么解决这个问题呢,其实很简单,在宏定义上加上两个括号,这个问题便轻松的解决了:
#define SQUARE(x) (x) * (x)
这样预处理之后就产生了预期的效果:
printf ("%d\n",(a + 1) * (a + 1) );
这里还有一个宏定义:
#define DOUBLE(x) (x) + (x)
定义中我们使用了括号,想避免之前的问题,但是这个宏可能会出现新的错误。
#define DOUBLE(x) (x) + (x)
int main()
{
int a = 5;
printf("%d\n", 10 * DOUBLE(a));
return 0;
}
这将打印什么值呢?
看上去,好像打印100,但事实上打印的是55。
我们发现替换之后:printf ("%d\n",10 * (5) + (5));
乘法运算的优先级高于宏定义的加法,所以出现了55 。
这个问题的解决办法是在宏定义表达式两边加上一对括号就可以了。
#define DOUBLE( x) ( ( x ) + ( x ) )
提示:
所有用于对数值表达式进行求值的宏定义都应该用这种方式加上括号,避免在使用宏时由于参数中的操作符或邻近操作符之间不可预料的相互作用。
在程序中扩展#define定义符号和宏时,需要涉及几个步骤:
1.在调用宏时,首先对参数进行检查,看看是否包含任何由#define定义的符号。如果是,它们首先被替换。
2.替换文本随后被插入到文本中原来文本的位置。对于宏,参数名被他们的值所替换。
3.最后,再次对结果文件进行扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上述处理过程。
注意:
1.宏参数和#define定义中可以出现其它#define定义的符号。但是对于宏,不能出现递归。
2.当预处理器搜索#define定义的符号的时候,字符串常量的内容并不被搜索。
如何把参数插入到字符串中呢?
我们先看看这样一段代码:
#include
int main()
{
printf("hello world\n");
printf("hello" " world\n");
return 0;
}
通过上面这段代码我们发现字符串是有自动连接的特点的。
再来看看这段代码:
int main()
{
int a = 10;
printf("the value of a is %d\n", a);
int b = 20;
printf("the value of b is %d\n", b);
float f = 4.5f;
printf("the value of f is %f\n", f);
return 0;
}
我们觉得每次都需要打印一遍,这样太麻烦了,那能不能封装一个函数来一次性解决这个问题呢?
通过观察,我们发现不能用函数来解决,因为这段代码既有整型类型,又有浮点型类型,所以函数类型没法写,而且变量名都各不相同,这也是一个问题。那该用什么办法来解决这个问题呢?
其实很简单,我们可以使用 # ,把一个宏参数变成对应的字符串。
#define PRINT(n, format) printf("the value of "#n" is "format"\n", n)
int main()
{
int a = 10;
PRINT(a, "%d");
//printf("the value of a is %d\n", a);
int b = 20;
PRINT(b, "%d");
//printf("the value of b is %d\n", b);
float f = 4.5f;
PRINT(f, "%f");
//printf("the value of f is %f\n", f);
return 0;
}
代码中的 #n 会预处理器处理为 "n",最终的结果应该是:
#define PRINT(n, format) printf("the value of "#n" is "format"\n", n)
int main()
{
int a = 10;
PRINT(a, "%d");
printf("the value of ""a"" is ""%d""\n", a);
//printf("the value of a is %d\n", a);
int b = 20;
PRINT(b, "%d");
printf("the value of ""b"" is ""%d""\n", b);
//printf("the value of b is %d\n", b);
float f = 4.5f;
PRINT(f, "%f");
printf("the value of ""f"" is ""%f""\n", f);
//printf("the value of f is %f\n", f);
return 0;
}
##的作用:
##可以把位于它两边的符号合成一个符号。
它允许宏定义从分离的文本片段创建标识符。
#define VALUE(v, n) v##n
int main()
{
int value10 = 100;
printf("%d\n", VALUE(value, 10));
return 0;
}
注意:这样的连接必须产生一个合法的标识符。否则其结果就是未定义的。
当宏参数在宏的定义中出现超过一次的时候,如果参数带有副作用,那么你在使用这个宏的时候就可能出现危险,导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。
例如:
int main()
{
int a = 10;
int b = a + 1;//b=11, a=10 不带副作用
int b = ++a; //b=11, a=11 带有副作用
return 0;
}
MAX宏可以证明具有副作用的参数所引起的问题。
#define MAX(x,y) ((x)>(y)?(x):(y))
int main()
{
int a = 3;
int b = 5;
int m = MAX(a++, b++);
printf("%d\n", m);
printf("%d\n", a);
printf("%d\n", b);
return 0;
}
这里我们得知道预处理器处理之后的结果是:
int m = ((a++)>(b++)?(a++):(b++));
所以输出的结果是:
宏通常被应用于执行简单的运算,比如在两个数中找出较大的一个。
#define MAX(a, b) ((a)>(b)?(a):(b))
那为什么不用函数来完成这个任务呢?
原因有二点:
- 用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。所以宏比函数在程序的规模和速度方面更胜一筹。
- 更为重要的是函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。反之这个宏则可以适用于整形、长整型、浮点型等可以用 > 来比较的类型。宏是与类型无关的。
当然和函数相比宏也有劣势的地方(宏的缺点):
- 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度。
- 宏是没法调试的。
- 宏由于类型无关,也就不够严谨。
- 宏可能会带来运算符优先级的问题,导致程序容易出现错误。
宏有时候可以做函数做不到的事情。比如:宏的参数可以出现类型,但是函数做不到。
#define MALLOC(num,type) (type*)malloc(num * sizeof(type))
int main()
{
//使用
MALLOC(10, int);
//预处理器替换之后
(int*)malloc(10 * sizeof(int));
return 0;
}
宏和函数的对比:
一般来讲函数和宏的使用语法很相似,所以语言本身没法帮我们区分二者。
那我们平时的一个习惯是:
- 把宏名全部大写
- 函数名不要全部大写
这条指令用于移除一个宏定义。
#define M 100
int main()
{
int n = M;
printf("n = %d\n", n);
//如果现存的一个名字需要被重新定义,那么它的旧名字首先要被移除。
#undef M
int n = M;
printf("n = %d\n", n);
return 0;
}
许多C 的编译器提供了一种能力,允许在命令行中定义符号。用于启动编译过程。
例如:当我们根据同一个源文件要编译出不同的一个程序的不同版本的时候,这个特性有点用处。(假定某个程序中声明了一个某个长度的数组,如果机器内存有限,我们需要一个很小的数组,但是另外一个机器内存大些,我们就需要一个数组能够大些。)
#include
int main()
{
int array[sz];
int i = 0;
for (i = 0; i < sz; i++)
{
array[i] = i;
}
for (i = 0; i < sz; i++)
{
printf("%d ", array[i]);
}
printf("\n");
return 0;
}
编译指令(linux环境下):
gcc -D sz=10 programe.c
在编译一个程序的时候我们如果要将一条语句(一组语句)编译或者放弃是很方便的,因为我们有条件编译指令。
比如说:
调试性的代码,删除可惜,保留又碍事,所以我们可以选择性的编译。
#include
#define __DEBUG__ int main() { int i = 0; int arr[10] = { 0 }; for (i = 0; i < 10; i++) { arr[i] = i; #ifdef __DEBUG__ printf("%d\n", arr[i]);//为了观察数组是否赋值成功。 #endif //__DEBUG__ } return 0; }
常见的条件编译指令:
1.单分支条件编译
举个栗子:#if 常量表达式 //... #endif //常量表达式由预处理器求值。
int main() { #if 1 printf("hehe\n"); #endif return 0; }
int main() { #if 1 == 2 printf("hehe\n"); #endif return 0; }
2.多个分支的条件编译
#if 常量表达式 //... #elif 常量表达式 //... #else //... #endif
举个栗子:
int main() { #if 1==1 printf("ha\n"); #elif 1 == 2 printf("haha\n"); #else 1 == 3 printf("hahaha\n"); #endif return 0; }
int main() { #if 1==2 printf("ha\n"); #elif 1 == 2 printf("haha\n"); #else 1 == 1 printf("hahaha\n"); #endif return 0; }
3.判断是否被定义
#if defined(symbol) #ifdef symbol #if !defined(symbol) #ifndef symbol
举个栗子:
int main() { #if defined(M)//没有定义M,所以不执行下面的语句 printf("haha\n"); #endif return 0; }
#define M 10 int main() { #if defined(M)//定义了M,所以执行下面语句 printf("haha\n"); #endif return 0; }
#define M 10 int main() { #ifdef M//定义了M,所以执行下面语句 printf("haha\n"); #endif return 0; }
#define M 10 int main() { #ifndef M//刚好和前面的相反,如果没有定义M,就执行下面语句 //这儿定义了M,所以不执行下面语句 printf("haha\n"); #endif return 0; }
int main() { #if !defined(M) printf("haha\n"); #endif return 0; }
4.嵌套指令
#if defined(OS_UNIX) #ifdef OPTION1 unix_version_option1(); #endif #ifdef OPTION2 unix_version_option2(); #endif #elif defined(OS_MSDOS) #ifdef OPTION2 msdos_version_option2(); #endif #endif
我们已经知道, #include 指令可以使另外一个文件被编译。就像它实际出现于 #include 指令的地方一样。
这种替换的方式很简单:
预处理器先删除这条指令,并用包含文件的内容替换。
这样一个源文件被包含10次,那就实际被编译10次。
头文件的包含有2种形式:
1.包含本地文件(自己的.h文件)
#include "xxx.h"
2.包含标准库的头文件
#include
#include
本地文件包含:
查找策略:先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标准位置查找头文件,如果找不到就提示编译错误。
Linux环境的标准头文件的路径:/usr/include
VS环境的标准头文件的路径:
C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\include //这是VS2013的默认路径,注意按照自己的安装路径去找。
库文件包含:
查找头文件直接去标准路径下去查找,如果找不到就提示编译错误。
这样是不是可以说,对于库文件也可以使用 “ ” 的形式包含?
答案是肯定的,可以。
但是这样做查找的效率就低些,当然这样也不容易区分是库文件还是本地文件了。
comm.h和comm.c是公共模块。
test1.h和test1.c使用了公共模块。
test2.h和test2.c使用了公共模块。
test.h和test.c使用了test1模块和test2模块。
这样最终程序中就会出现两份comm.h的内容。这样就造成了文件内容的重复。
如何解决这个问题呢?
答案:条件编译。
每个头文件的开头写:
#ifndef __TEST_H__ #define __TEST_H__ //头文件的内容 #endif //__TEST_H__
或者:
#pragma once
就可以避免头文件的重复引入。
在《高质量C/C++编程指南》一书中附录了考试试卷,其中有这样两道笔试题:
1. 头文件中的 ifndef/define/endif是干什么用的?
防止头文件被多次引用。
2. #include
#include
查找一次,而#include "filename.h"查找两次。所以应用的时候,标准库的头文件一般用<>,而自定义的头文件用" "。
#define:
宏定义
#undef:
撤销已定义过的宏名
#include:
使编译程序将另一源文件嵌入到带有#include 的源文件中
#if;#else;#elif;#endif:
- #if的一般含义是:如果#if后面的常量表达式为true,则编译它与#endif之间的代码,否则跳过这些代码
- 命令#endif标识一个#if块的结束
- #else命令的功能有点像C语言中的else,#else建立另一种选择(在#if失败的情况下)
- #elif命令意义与else if相同,它形成一个if else - if阶梯状语句,可进行多种编译选择
#ifdef;#ifndef:
用#ifdef与#ifndef命令分别表示“如果有定义”与“如果无定义”,是条件编译的另一种方法
#line:
改变当前行数和文件名称,它们是在编译程序中预先定义的标识符命令的基本形式;
#line number["filename"]
#error:
编译程序时,只要遇到#error就会生成一个编译错误提示信息,并停止编译
#pragma:
可以设定编译程序完成一些特定的动作(可以通过编译程序的菜单设定,也可以直接写在源代码中),它允许向编译程序传送各种指令。例如:编译程序可能有一种选择,它支持对程序执行的跟踪,可用#pragma语句指定一个跟踪选择
更多关于宏的问题,有兴趣的铁子可以参考《C语言深度解剖》这本书了解一下。