在ANSI C的任何一种实现中,存在两个不同的环境。
第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。
源文件:各种 .c文件;编译器:cl.exe文件;目标文件:.obj文件;链接器:link.exe;链接库:各种库函数 和自定义函数;最后生成可执行程序.exe文件。
预处理(-E)
预处理就是对源程序中的伪指令(以#开头的指令)和特殊符号进行处理的过程。
伪指令包含宏定义指令,条件编译指令和头文件包含指令。gcc对C源文件进行预处理后会输出.i文件。
主要处理规则如下:
(1)将所有#define删除,并且展开所有的宏定义;
(2)处理所有条件编译指令。如#if、#ifdef等;
(3)处理#include预编译指令,将被包含的文件插入该预编译指令的位置;
(4)删除所有的注释;
(5))添加行号和文件标识,以便于编译时编译器产生调试用的行号信息及编译时产生编译错误或警告时能够显示行号信息;
(6)保留所有的#pragma编译器指令,因为编译器需要使用它们。
编译(-S)
编译就是把预处理完的文件进行一系列词法分析、语法分析、语义分析及优化后生成相应的汇编代码。使用gcc进行编译时,默认情况下,不输出该文件,生成的汇编文件是.s文件
包括:词法分析、语法分析、语义分析和符号汇总。
汇编(-c)
汇编就是将汇编代码转变为机器可以执行的二进制代码,每一个汇编语句几乎都对应一条机器指令。汇编相对于编译过程比较简单,根据汇编指令和机器指令的对照表——翻译即可。
在成功汇编之后,就进入链接阶段。链接主要是为了解决多个文件之间符号引用的问题。编译时编译器只对单个文件进行处理,如果该文件里面需要引用到其他文件中的符号,那么这时在这个文件中该符号的地址是没法确定的,只能等链接器把所有的目标文件链接到一起,才能确定最终的地址,最终生成可执行文件。
第2种是执行环境,它用于实际执行代码。
程序执行的过程:
__FILE__ //进行编译的源文件
__LINE__ //文件当前的行号
__DATE__ //文件被编译的日期
__TIME__ //文件被编译的时间
__STDC__ //如果编译器遵循ANSI C,其值为1,否则未定义
上述预定义符号都是语言内置的。
可以用于记录日志:
#include
#include
int main()
{
FILE* pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("fopen");
return EXIT_FAILURE;//失败返回
}
fprintf(pf, "file:%s line:%d date:%s time:%s\n", __FILE__, __LINE__, __DATE__, __TIME__);
//将文件、位置(行数)、日期、时间记录到文件
fclose(pf);
pf = NULL;
return 0;
}
语法:
#define name stuff
注意:末尾无分号
#define MAX 1000
#define STR "Hello world!"
#define print printf("HaHaHa!\n")
int main()
{
printf("%d\n", MAX);
printf("%s\n", STR);
print;
printf("file:%s line:%d date:%s time:%s\n",\
__FILE__, \
__LINE__, \
__DATE__, \
__TIME__);
//‘\’续行符,用于长语句的分段(除了最后一行外,每行的后面都加一个反斜杠)
return 0;
}
#define 机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或定义宏(define macro)。
宏的申明方式:
#define name( parament-list ) stuff
其中的 parament-list 是一个由逗号隔开的符号表,它们可能出现在stuff中。
注意:
参数列表的左括号必须与name紧邻。
如果两者之间有任何空白存在,参数列表就会被解释为stuff的一部分。
#define SQUARE(x) ((x)*(x))
//注意要加上括号,以防出现次序问题
//例如:对于SQUARE(5+1),他是将5+1不进行计算直接替换,即((5+1)*(5+1)),如果无括号,就会出现5+1*5+1=11
提示:
所以用于对数值表达式进行求值的宏定义都应该用这种方式加上括号,避免在使用宏时由于参数中的操作符或邻近操作符之间不可预料的相互作用。
#define OFFSETOF(type,mem) (size_t)&(((type*)0)->mem)
//可用于求偏移量
在程序中扩展#define定义符号和宏时,需要涉及几个步骤。
注意:
4. 宏参数和#define 定义中可以出现其他#define定义的符号。但是对于宏,不能出现递归。
5. 当预处理器搜索#define定义的符号的时候,字符串常量的内容并不被搜索(即对于字符串中所包含的#define定义的符号,不进行替换)。
如何把参数插入到字符串中?
//将N参数插入到字符串中
#define PRINT1(N) printf("the value of "#N" is %d.\n", N)
#define PRINT2(N,FORMAT) printf("the value of "#N" is "#FORMAT"\n", N)
//PRINT2各种类型皆可以使用
int main()
{
int a = 10;
printf("the value of a is %d.\n", a);
float b = 99;
printf("the value of b is %lf.\n", b);
//对于上述如果想借用宏可以是实现简化
printf("*********************\n");
PRINT1(a);
PRINT2(b,"%lf");
return 0;
}
##可以把位于它两边的符号合成一个符号。
它允许宏定义从分离的文本片段创建标识符。
#define PRINT(STU,NUM) STU##NUM
int main()
{
int Class106 = 100;
printf("%d\n", PRINT(Class,106));
return 0;
}
当宏参数在宏的定义中出现超过一次的时候,如果参数带有副作用,那么你在使用这个宏的时候就可能
出现危险,导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。
//如下例
#define MAX(a, b) ( (a) > (b) ? (a) : (b) )
int main()
{
int a = 5;//6 7
int b = 4;//5
int max = MAX(a++, b++);
printf("max=%d a=%d b=%d\n", max,a,b);
return 0;
}
#define 定义的MAX进行替换,即max=( (a++) > (b++) ? (a++) : (b++) );
首先(a++) > (b++) :后++,先使用后加加,即5>4(a=6,b=5);之后执行(a++):max=a=6(a=7)。
故最后max=6,a=7,b=5。
上述求最大值也可以用函数实现,为什么使用宏呢?
宏的优点:
#define MALLOC(type,num) (type*)malloc(sizeof(type)*(num))
当然宏也有其不足之处:
属性 | #define定义宏 | 函数 |
---|---|---|
代码长度 | 每次使用时,宏代码都会被插入到程序中。除了非常小的宏之外,程序的长度会大幅度增长 | 函数代码只出现于一个地方;每次使用这个函数时,都调用那个地方的同一份代码 |
执行速度 | 更快 | 存在函数的调用和返回的额外开销,所以相对慢一些 |
操作符优先级 | 宏参数的求值是在所有周围表达式的上下文环境里,除非加上括号,否则邻近操作符的优先级可能会产生不可预料的后果,所以建议宏在书写的时候多些括号。 | 函数参数只在函数调用的时候求值一次,它的结果值传递给函数。表达式的求值结果更容易预测。 |
带有副作用的参数 | 参数可能被替换到宏体中的多个位置,所以带有副作用的参数求值可能会产生不可预料的结果。 | 函数参数只在传参的时候求值一次,结果更容易控制。 |
参数类型 | 宏的参数与类型无关,只要对参数的操作是合法的,它就可以使用于任何参数类型。 | 函数的参数是与类型有关的,如果参数的类型不同,就需要不同的函数,即使他们执行的任务是相同的。 |
调试 | 宏是不方便调试的 | 函数是可以逐语句调试的 |
递归 | 宏是不能递归的 | 函数是可以递归的 |
一般来讲函数的宏的使用语法很相似。
所以语言本身没法帮我们区分二者。
那我们平时的一个习惯是:
把宏名全部大写;
函数名不要全部大写。
这条指令用于移除一个宏定义。
#undef NAME
如果现存的一个名字需要被重新定义,那么它的旧名字首先要被移除。
许多C 的编译器提供了一种能力,允许在命令行中定义符号。用于启动编译过程。
例如:当我们根据同一个源文件要编译出一个程序的不同版本的时候,这个特性有点用处。
(假定某个程序中声明了一个某个长度的数组,如果机器内存有限,我们需要一个很小的数组,但是另外一个机器内存大些,我们需要一个数组能够大些。)即数组长度可变。
int main()
{
int array [ARRAY_SIZE];
int i = 0;
for(i = 0; i< ARRAY_SIZE; i ++)
{
array[i] = i;
}
for(i = 0; i< ARRAY_SIZE; i ++)
{
printf("%d " ,array[i]);
}
printf("\n" );
return 0;
}
//再linux环境下可以
//gcc -D ARRATY_SIZE=10 programe.c
在编译一个程序的时候我们如果要将一条语句(一组语句)编译或者放弃是很方便的。因为我们有条件编译指令。
常见的条件编译指令:
#if 常量表达式
//…
#endif
//常量表达式由预处理器求值(为真执行,否则不执行)。
如:
#define DEBUG 1
#if DEBUG
//…
#endif
2.多个分支的条件编译
#if 常量表达式
//…
#elif 常量表达式
//…
#else
//…
#endif
3.判断是否被定义
定义则执行:
- #if defined(symbol)
- #ifdef symbol
未定义则执行:- #if !defined(symbol)
- #ifndef symbol
4.嵌套指令
- #if defined(OS_UNIX)
#ifdef OPTION1
unix_version_option1();
#endif
#ifdef OPTION2
unix_version_option2();
#endif- #elif defined(OS_MSDOS)
#ifdef OPTION2
msdos_version_option2();
#endif- #endif
#define __DEBUG__
int main()
{
int i = 0;
int arr[10] = { 0 };
for (i = 0; i < 10; i++)
{
arr[i] = i;
#ifdef __DEBUG__
//如果定义__DEBUG__,则执行打印,否则不执行
printf("%d\n", arr[i]);//为了观察数组是否赋值成功。
#endif //__DEBUG__
}
return 0;
}
我们已经知道, #include 指令可以使另外一个文件被编译。就像它实际出现于 #include 指令的地方一样。
这种替换的方式很简单:
预处理器先删除这条指令,并用包含文件的内容替换。
这样一个源文件被包含10次,那就实际被编译10次。
#include “filename”
查找策略:先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标准位置查找头文件。
如果找不到就提示编译错误。
#include
查找头文件直接去标准路径下去查找,如果找不到就提示编译错误。
这样是不是可以说,对于库文件也可以使用 “” 的形式包含?
可以,但是这样做查找的效率就低些,当然这样也不容易区分是库文件还是本地文件了。
在实际工程中,都是每个人负责一个文件,最后汇总 .那么就会出现一个文件里对某一个文件多次引用,造成文件重复,预处理将文件多次包含,减慢程序运行.
可用条件编译解决这个问题:
法一:第一次引用后,之后不会再引用
#ifndef TEST_H
#define TEST_H
//头文件的内容
#endif //TEST_H
法二:只引用一次
#pragma once