编译(compilation , compile)
1、利用编译程序从源语言编写的源程序产生目标程序的过程。
2、用编译程序产生目标程序的动作。
编译就是把高级语言变成计算机可以识别的2进制语言,计算机只认识1和0,编译程序把人们熟悉的语言换成2进制的。
编译程序把一个源程序翻译成目标程序的工作过程分为五个阶段:词法分析;语法分析;语义检查和中间代码生成;代码优化;目标代码生成。
主要是进行词法分析和语法分析,又称为源程序分析,分析过程中发现有语法错误,给出提示信息。
(1)词法分析
词法分析的任务是对由 字符组成的单词进行处理,从左至右逐个字符地对源 程序进行扫描,产生一个个的单词符号,把作为字符串的 源程序改造成为单词符号串的中间程序。执行词法分析的 程序称为词法 分析程序或扫描器。
源程序
[1] 中的单词符号经扫描器分析,一般产生二元式:单词种别;单词自身的值。单词种别通常用整数编码,如果一个种别只含一个单词符号,那么对这个单词符号,种别编码就完全代表它自身的值了。若一个种别含有许多个单词符号,那么,对于它的每个单词符号,除了给出种别编码以外,还应给出自身的值。
词法分析器一般来说有两种方法构造:手工构造和自动生成。手工构造可使用 状态图进行工作,自动生成使用确定的有限 自动机来实现。
编辑本段(2) 语法分析
编译程序的 语法分析器以单词符号作为输入,分析单词符号串是否形成符合 语法规则的语法单位,如 表达式、赋值、循环等,最后看是否构成一个符合要求的程序,按该语言使用的语法规则分析检查每条语句是否有正确的 逻辑结构,程序是最终的一个语法单位。 编译程序的 语法规则可用 上下文无关文法来刻画。
语法分析的方法分为两种:自上而下分析法和自下而上分析法。自上而下就是从文法的开始符号出发,向下推导,推出句子。而自下而上分析法采用的是移进 归约法,基本思想是:用一个寄存符号的先进后 出栈,把输入符号一个一个地移 进栈里,当栈顶形成某个产生式的一个候选式时,即把栈顶的这一部分归约成该产生式的左邻符号。
编辑本段(3)中间代码生成
中间代码是 源程序的一种内部表示,或称 中间语言。中间代码的作用是可使 编译程序的结构在逻辑上更为简单明确,特别是可使 目标代码的优化比较容易实现中间代码,即为 中间语言程序,中间语言的复杂性介于 源程序语言和 机器语言之间。 中间语言有多种形式,常见的有逆 波兰记号、四元式、三元式和树。
编辑本段(4) 代码优化
代码优化是指对 程序进行多种等价变换,使得从变换后的程序出发,能生成更有效的 目标代码。所谓等价,是指不改变 程序的运行结果。所谓有效,主要指 目标代码运行时间较短,以及占用的 存储空间较小。这种变换称为优化。
有两类优化:一类是对 语法分析后的 中间代码进行优化,它不依赖于具体的计算机;另一类是在生成 目标代码时进行的,它在很大程度上依赖于具体的计算机。对于前一类优化,根据它所涉及的 程序范围可分为局部优化、循环优化和全局优化三个不同的级别。
编辑本段(5) 目标代码生成
目标代码生成是编译的最后一个阶段。 目标代码生成器把 语法分析后或优化后的 中间代码变换成目标代码。 目标代码有三种形式:
① 可以立即执行的 机器语言代码,所有地址都 重定位;
② 待装配的 机器语言模块,当需要执行时,由连接装入 程序把它们和某些运行 程序连接起来,转换成能执行的机器语言代码;
③ 汇编语言代码,须经过 汇编程序汇编后,成为可执行的 机器语言代码。
目标代码生成阶段应考虑直接影响到目标代码速度的三个问题:一是如何生成较短的目标代码;二是如何充分利用计算机中的寄存器,减少目标代码访问 存储单元的次数;三是如何充分利用计算机 指令系统的特点,以提高目标代码的质量。
编辑本段(6)表格管理程序
编译过程中 源程序的各种信息被保留在种种不同的表格,编译各阶段的工作都涉及到构造、查找、或更新有关的表格。
编辑本段(7)出错处理程序
如果编译过程中发现 源程序有错误, 编译程序应报告错误的性质和错误的发生的地点,并且将错误所造成的影响限制在尽可能小的范围内,使得源程序的其余部分能继续被编译下去,有些编译程序还能自动纠正错误,这些工作由错误处理程序完成。
需要注意的是,一般上 编译器只做 语法检查和最简单的语义检查,而不检查 程序的逻辑。
编辑本段(8)编译和反编译
如果说编译是利用编译程序从源语言编写的源程序产生目标程序的过程;反编译
[2] 就是指机器码(汇编语言)向高级编程语言转换的过程,但是通常不能把可执行文件变成高级语言源代码,只能转换成汇编程序。
另一种反编译还可理解为对swf文件的反编译,是指用SWF反编译
[3] 软件把Adobe Flash,Flex或第三方工具生成的SWF文件,重新生成对应(或等效)的源文件的过程。