编译器学习之 (一) : 编译流程基本介绍

build流程

构建一次项目需要经历一些4个阶段

  • 预处理preprocess
    读入头文件,展开宏
  • 编译
    生成汇编语言,
  • 汇编
    由汇编器assembler转换为机器语言,生成.o的目标文件
  • 链接
    将目标文件生成可执行文件.

第二个步骤的编译一般称之为狭义的编译,下面我们讨论的都是狭义的编译.好了,开始对编译阶段解析详细解析.

编译过程

狭义的编译大致大致分为4个阶段

  • 语法分析
  • 语义分析
  • 生成中间代码
  • 代码生成

语法分析

将代码进行解析,将其转换为计算机易于理解的形式,这里的解析(parse)也成为语法分析(syntax analyzing),解析代码的程序模块成为解析器(parser)或语法分析器(syntax analyzer).
最终会将代码转换成语法树的形式.

语义分析

通过解析代码获得语法树后,就要解析语法树,除去多余内容,添加必要信息,生成AST抽象语法树.这个步骤成为语义分析.

语义分析包括一些处理

  • 区分变量为局部变量还是全局变量
  • 解析变量的声明和引用
  • 变量和表达式的类型检查
  • 检查在引用变量之前是否进行了初始化
  • 检查函数是否按照定义返回了结果

语法分析只是将代码的构造照搬了过来,语义分析生成的AST包含了语义信息.例如在变量引用和定义直接添加链接,适当增加类型转换等.

生成中间代码

生成AST之后,将AST转化为只在编译器内部使用的中间代码(IR, Intermediate Representation).
这样做是为了支持多种汇编语言或者机器语言.

代码生成

把中间代码转换成汇编语言,这个阶段称为代码生成(code generation),负责此程序的模块称为代码生成器(code generator).

优化

除了上述4个阶段外,现实编译器还包括优化(optimization).
优化可以在编译器的各个环节进行.可以对AST进行优化,可以对中间代码的代码进行优化,可以对转换后的机器语言进行优化.进一步来说,不仅是编译器,链接和运行时调用的程序库(library)的代码也可以进行优化.

你可能感兴趣的:(编译器学习之 (一) : 编译流程基本介绍)