预处理、编译、汇编、链接

一个c/c++文件要变成可执行文件,首先要把源文件编译成中间代码文件,在Windows下也就是 .obj 文件,UNIX下是 .o 文件,即 Object File,这个动作叫做编译(compile)。然后再把大量的Object File合成执行文件,这个动作叫做链接(link)。

预处理、编译、汇编、链接_第1张图片

一个c/c++文件要经过预处理、编译、汇编和链接才能变成可执行文件。我们经常把前三个步骤统称为编译了(广义上的编译)。预处理用预处理器,编译用编译器,汇编用汇编器,链接用链接器,这几个工具再加上其他一些额外的会用到的可用工具,合起来叫编译工具链。gcc就是一个编译工具链。

一、预处理

C/C++源文件中,以#开头的命令被称为预处理命令,如包含命令#include、宏定义命令#define、条件编译命令#if、#ifdef等。所做的主要工作如下:

  • 将所有的#define删除,并展开所有的宏定义
  • 处理所有的条件预编译指令,如:#if  #ifdef #elif #else #endif
  • 处理#include预编译指令,将被包含的文件插进到该指令的位置,这个过程是递归的
  • 删除所有的注释//与/* */
  • 添加行号与文件名标识,以便产生调试用的行号信息以及编译错误或警告时能够显示行号
  • 保留所有的#pragma编译器指令,因为编译器需要使用它

1.#include预处理命令

(1)#include <> 和 #include""的区别:<>专门用来包含系统提供的头文件(就是系统自带的,不是程序员自己写的),""用来包含自己写的头文件;更深层次来说:<>的话C语言编译器只会到系统指定目录(编译器中配置的或者操作系统配置的寻找目录,譬如在ubuntu中是/usr/include目录,编译器还允许用-I来附加指定其他的包含路径)去寻找这个头文件,如果找不到就会提示这个头文件不存在。

(2)""包含的头文件,编译器默认会先在当前目录下寻找相应的头文件,如果没找到然后再到系统指定目录去寻找,如果还没找到则提示文件不存在。

总结+注意:规则虽然允许用双引号来包含系统指定目录,但是一般的使用原则是:如果是系统指定的自带的用<>,如果是自己写的在当前目录下放着用"",如果是自己写的但是集中放在了一起专门存放头文件的目录下将来在编译器中用-I参数来寻找,这种情况下用<>。

(3)头文件包含的真实含义就是:在#include的那一行,将xx.h这个头文件的内容原地展开替换这一行#include语句。过程在预处理中进行。

2.#define预处理命令

(1)宏定义的解析规则就是:在预处理阶段由预处理器进行替换,这个替换是原封不动的替换

#define pchar char *
typedef char * PCHAR

int main(void)
{
	pchar p3;
	pchar p1, p2;
	
	return 0;
}

 将上述代码只进行预处理(gcc -o define.i -E define.c)得到define.i文件如下:

# 1 "define.c"
# 1 ""
# 1 ""
# 1 "/usr/include/stdc-predef.h" 1 3 4
# 1 "" 2
# 1 "define.c"

typedef char * PCHAR

int main(void)
{
 char * p3;
 char * p1, p2;

 return 0;
}

(2)宏可以带参数,称为带参宏。带参宏的使用和带参函数非常像,但是使用上有一些差异。

实例1:

#define MAX(a, b) (((a)>(b)) ? (a) : (b))

实例2:用宏定义表示一年中有多少秒

#define SEC_PER_YEAR	(365*24*60*60UL)

关键:

第一点:当一个数字直接出现在程序中时,它的是类型默认是int

第二点:一年有多少秒,这个数字刚好超过了int类型存储的范围(所以加上UL代表无符号long型),注意UL的位置

实例3:用宏定义实现两个数相乘

#define TEST(a,b) a*b
 
int main()
{
	int a = TEST(1 + 2, 3);
	printf("result= %d\n", a);
 
	return 0;
}

 由于宏定义是原地展开,即int a = 1+2*3;所以结果为7,这根我们的本意不符。所以在定义带参宏时,每一个参数在宏体中引用时都必须加括号,最后整体再加括号,括号缺一不可。(规范的写法)

所以上述的规范写法如下:

#define TEST(a,b) ((a)*(b))
 
int main()
{
	int a = TEST(1 + 2, 3);
	printf("result= %d\n", a);
 
	return 0;
}

实例4:宏定义来实现条件编译(#define #undef #ifdef)

 

note:带参宏和带参函数的区别(宏定义的缺陷)

(1)宏定义是在预处理期间处理的,而函数是在编译期间处理的。这个区别带来的实质差异是:宏定义最终是在调用宏的地方把宏体原地展开,而函数是在调用函数处跳转到函数中去执行,执行完后再跳转回来。

注:宏定义和函数的最大差别就是:宏定义是原地展开,因此没有调用开销;而函数是跳转执行再返回,因此函数有比较大的调用开销。所以宏定义和函数相比,优势就是没有调用开销,没有传参开销,所以当函数体很短(尤其是只有一句话时)可以用宏定义来替代,这样效率高。

(2)带参宏和带参函数的一个重要差别就是:宏定义不会检查参数的类型,返回值也不会附带类型;而函数有明确的参数类型和返回值类型。当我们调用函数时编译器会帮我们做参数的静态类型检查,如果编译器发现我们实际传参和参数声明不同时会报警告或错误。

注:用函数的时候程序员不太用操心类型不匹配因为编译器会检查,如果不匹配编译器会叫;用宏的时候程序员必须很注意实际传参和宏所希望的参数类型一致,否则可能编译不报错但是运行有误。

总结:宏和函数各有千秋,各有优劣。总的来说,如果代码比较多用函数适合而且不影响效率;但是对于那些只有一两句话的函数开销就太大了,适合用带参宏。但是用带参宏又有缺点:不检查参数类型。

二、编译

把预处理完的文件进行一系列词法分析(lex)、语法分析(yacc)、语义分析及优化后生成汇编代码,这个过程是程序构建的核心部分。 

三、汇编

汇编就是将第二步输出的汇编代码翻译成符合一定格式的机器代码,在Linux系统上一般表现为ELF目标文件(OBJ文件)。反汇编是指将机器代码转换为汇编代码,这在调试程序时常常用到。

四、链接

链接就是将上步生成的OBJ文件和系统库的OBJ文件、库文件链接起来,最终生成了可以在特定平台运行的可执行文件。链接时,主要是链接函数和全局变量,所以,我们可以使用这些中间目标文件(O文件或是OBJ文件)来链接我们的应用程序。链接器并不管函数所在的源文件,只管函数的中间目标文件(Object File),在大多数时候,由于源文件太多,编译生成的中间目标文件太多,而在链接时需要明显地指出中间目标文件名,这对于编译很不方便,所以,我们要给中间目标文件打个包,在Windows下这种包叫“库文件”(Library File),也就是 .lib文件,在UNIX下,是Archive File,也就是 .a 文件。

五、小结

预处理、编译、汇编、链接_第2张图片
hello.c(预处理)->hello.i(编译)->hello.s(汇编)->hello.o(链接)->hello

 

 

详细的每一步命令如下:

gcc -E -o hello.i hello.c
gcc -S -o hello.s hello.i
gcc -c -o hello.o hello.s
gcc -o hello hello.o
上面一连串命令比较麻烦,gcc会对.c文件默认进行预处理操作,使用-c再来指明了编译、汇编,从而得到.o文件, 再将.o文件进行链接,得到可执行应用程序。简化如下:
gcc -c -o hello.o hello.c

gcc -o hello hello.o

 

对于gcc -o test a.c b.c这条命令 它们要经过下面几个步骤:

1).对于a.c执行:预处理 编译 汇编 的过程,a.c -->xxx.s -->xxx.o 文件。
2).对于b.c执行:预处理 编译 汇编 的过程,b.c -->yyy.s -->yyy.o 文件。
3).最后:xxx.o和yyy.o链接在一起得到一个test应用程序。
提示:gcc -o test a.c b.c -v :加上一个‘-v’选项可以看到它们的处理过程,

第一次编译a.c得到xxx.o文件,这是很合乎情理的, 执行完第一次之后,如果修改a.c 又再次执行:gcc -o test a.c b.c,对于a.c应该重新生成xxx.o,但是对于b.c又会重新编译一次,这完全没有必要,b.c根本没有修改,直接使用第一次生成的yyy.o文件就可以了。

缺点:对所有的文件都会再处理一次,即使b.c没有经过修改,b.c也会重新编译一次, 当文件比较少时,这没有没有什么问题,当文件非常多的时候,就会带来非常多的效率问题。
 

如果文件非常多的时候,我们只是修改了一个文件,所用的文件就会重新处理一次,编译的时候就会等待很长时间。

对于这些源文件,我们应该分别处理,执行:预处理 编译 汇编 ,先分别编译它们,最后再把它们链接在一次,比如:

编译:
gcc -o a.o a.c
gcc -o b.o b.c
链接:
gcc -o test a.o b.o

比如:上面的例子,当我们修改a.c之后,a.c会重现编译然后再把它们链接在一起就可以了。b.c 就不需要重新编译。

 

参考链接:

https://www.cnblogs.com/kekec/p/3238741.html

http://wiki.100ask.org/%E7%AC%AC009%E8%AF%BE_gcc%E5%92%8Carm-linux-gcc%E5%92%8CMakefile

https://developer.arm.com/tools-and-software/embedded/arm-compiler

你可能感兴趣的:(ARM)