一个C++程序一般需要经过以下几个步骤才能成为可执行程序:
那么,在以上的每一步中,编译器到底做了哪些工作呢?
一、编译器预处理
C++编译器自带预处理器,在程序编译之前,由预处理器对C++源程序完成预处理工作。
预处理主要将源程序中的宏定义指令、条件编译指令、头文件包含指令以及特殊符号完成相应的替换工作。
预处理指令#include用于包含头文件,有两种形式:#include ,#include "xxx.h"。
尖括号形式表示被包含的文件在系统目录中。如果被包含的文件不一定在系统目录中,应该用双引号形式。
在双引号形式中可以指出文件路径和文件名。如果在双引号中没有给出绝对路径,
则默认为用户当前目录中的文件,此时系统首先在用户当前目录中寻找要包含的文件,
若找不到再在系统目录中查找。对于用户自己编写的头文件,宜用双引号形式。
对于系统提供的头文件,既可以用尖括号形式,也可以用双引号形式,
都能找到被包含的文件,但显然用尖括号形式更直截了当,效率更高。
./表示当前目录,../表示当前目录的父目录。
stdafx.h
在VS中新建一个WIN32工程时,编译器一般默认会在主程序中添加一条#include"stdafs.h"语句。
而stdafx.h只包含如下几行引用头文件的代码:
// stdafx.h : 标准系统包含文件的包含文件,
// 或是经常使用但不常更改的
// 特定于项目的包含文件
//
#pragma once
#include "targetver.h"
#include
#include
// TODO: 在此处引用程序需要的其他头文件
而在stdafx.cpp中,仅有一条语句:
// stdafx.cpp : 只包括标准包含文件的源文件
// defineTest.pch 将作为预编译头
// stdafx.obj 将包含预编译类型信息
#include "stdafx.h"
// TODO: 在 STDAFX.H 中
// 引用任何所需的附加头文件,而不是在此文件中引用
那么stdafx.h的作用是什么呢?
所谓预编译头,就是把一个工程中要使用的一些标准头文件预先编译,以后该工程编译时,
不再编译这部分头文件,仅仅使用预编译的结果。这样可以加快编译速度,节省时间。
关于预编译头文件的简介,百度百科的说法如下:
预编译头文件通过编译stdafx.cpp生成,以工程名命名,由于预编译的头文件的后缀是“pch”,
所以编译结果文件是projectname.pch。
编译器通过一个头文件stdafx.h来使用预编译头文件。
stdafx.h这个头文件名是可以在project的编译设置里指定的。
编译器认为,所有在指令#include "stdafx.h"前的代码都是预编译的,
它跳过#include "stdafx. h"指令,使用projectname.pch编译这条指令之后的所有代码。
因此,所有的MFC实现文件第一条语句都是:#include "stdafx.h"。在它前面的所有代码将被忽略,
所以其他的头文件应该在这一行后面被包含。否则,
你将会得到“No such file or directory”这样让你百思不得其解的错误提示。
关于第二点,srdafx.h这个头文件的文件名在VS2013中实在程序->属性->C/C++->预编译头中设置的。
如下图所示:
而关于stdafx.h的作用:百度百科的说明如下:
stdafx.h中没有函数库,只是定义了一些环境参数,使得编译出来的程序能在32位的操作系统环境下运行。
Windows和MFC的include文件都非常大,即使有一个快速的处理程序,
编译程序也要花费相当长的时间
来完成工作。由于每个.CPP文件都包含相同的include文件,
为每个.CPP文件都重复处理这些文件就显得很傻了。
为避免这种浪费,AppWizard和VisualC++编译程序一起进行工作,如下所示:
◎AppWizard建立了文件stdafx.h,该文件包含了所有当前工程文件需要的MFCinclude文件。
且这一文件可以随被选择的选项而变化。
◎AppWizard然后就建立Stdafx.cpp。这个文件通常都是一样的。
◎然后AppWizard就建立起工程文件,这样第一个被编译的文件就是stdafx.cpp。
◎当VisualC++编译stdafx.cpp文件时,它将结果保存在一个名为stdafx.pch的文件里。
(扩展名pch表示预编译头文件。)
◎当VisualC++编译随后的每个.cpp文件时,它阅读并使用它刚生成的.pch文件。
VisualC++不再分析Windows include文件,除非你又编辑了stdafx.cpp或stdafx.h。
在这个过程中你必须遵守以下规则:
◎你编写的任何.cpp文件都必须首先包含stdafx.h。
◎如果你有工程文件里的大多数.cpp文件需要.h文件,顺便将它们加在stdafx.h(后部)上,然后预编译stdafx.cpp。
◎由于.pch文件具有大量的符号信息,它是你的工程文件里最大的文件。
如果你的磁盘空间有限,你就希望能将这个你从没使用过的工程文件中的.pch文件删除。
执行程序时并不需要它们,且随着工程文件的重新建立,它们也自动地重新建立。
经过预处理后的程序,生成一个没有宏定义、没有条件编译指令、没有特殊符号的输出文件。
这些输出文件的含义与没有经过预处理的源文件是相同的,但内容有所不同。
二、编译程序。
以预编译的输出作为输入,利用C++运行库,通过词法分析和语法分析,
在确认所有的指令都符合语法规则时,将其翻译成等价的中间代码表示或者是汇编语言。
三、优化程序
优化阶段一部分是对中间代码的优化,这种优化不依赖具体的计算机,
同机器的硬件环境无关。另一种优化则主要针对目标代码的生成而进行的。
对于前一种优化,
主要的工作是删除公共表达式、循环优化(循环展开,自动向量化、循环不变量代码移动)以及无用赋值的删除等。
另一种优化同机器的硬件结构密切相关。最主要的是考虑如何充分利用机器的各个硬件寄存器存放有关的变量的值
,以减少对于内存的访问次数。
四、汇编程序
汇编阶段的主要工作是将经过编译、优化后的,
以汇编语言的形式存在的程序转化为机器可识别的二进制代码,从而得到相应的目标文件。
目标文件通常由数据段和代码段组成。代码段保存的是程序的指令,该段一般是可读和可执行的,
但一般是不可写的。数据段主要用来保存程序中所定义的或者需要用到的全局变量、
静态数据(局部变量是在运行阶段生成)。数据段一般是可读可写的。
五、链接程序
经历了汇编之后的程序是后缀为.obj形式的文件,仍然是不可执行的,只有经过链接阶段,
将程序所引用的外部文件关联起来之后,形成.exe后缀的文件之后,才是可执行的。
程序中可能引用了定义在其他外部文件中的变量或者函数,比如某些库函数,
而链接阶段所做的主要事情就是将这些相关联的文件链接起来,
使得所有这些目标文件成为一个能够被操作系统装入执行的统一的整体。
链接方式具体可分为动态链接与静态链接两种。
动态链接:采用该链接方式表明,需要链接的代码是存放在动态链接库或者某个共享对象的目标文件中,
链接程序(Link.exe)此时所做的只是在最终的可执行程序中记录下共享对象的名字和其他少量的登记信息,
不会想需要链接的代码拷贝到最终的可执行程序中,在此可执行文件被执行时,
动态链接库的全部内容将被映射到运行时相应进程的虚地址空间,
动态链接程序将根据可执行程序中登记的信息找到相应的函数代码。
采用动态链接方式最终生成的可执行程序较小,因为不会将动态库中的内容拷贝到可执行程序中。
但需要注意的是,可执行程序在运行时需要目标主机上存在相应的动态库和环境。
静态链接:采用该链接方式,需要链接的代码会被链接程序从相应的静态链接库中拷贝到可执行程序之中,
在可执行程序运行时,这些代码会装入到该进程相应的地址空间之中。因此,采用静态链接库的方式,
最终生成的可执行文件相对较大。