第一、二章 引论、高级语言及其描述
1、用汇编语言或高级语言编写的程序,必须先送入计算机,经过转换成用机器语言表示的目标程序(这个过程叫做编译),才能由计算机执行。执行转换过程的程序叫做编译程序。汇编程序是指没有编译过的汇编语言源文件。编译程序转换过的叫做目标程序,也就是机器语言。
2、编译程序是一种翻译程序
3、通常一个编译程序中,不仅包含词法分析、语法分析、中间代码生成、代码优化、目标代码生成等五个部分,还应包括表格处理和出错处理,其中中间代码生成和代码优化不是每个编译程序都必须的。
4、产生式是用于定义语法成分的一种书写规则。
5、四种类型的文法的主要特点:
6、解释程序和编译程序的区别在于是否生成目标程序。
7、中间代码有:逆波兰记号、树形表示、三元式、四元式等形式
8、语法制导翻译即可用来产生中间代码,也可以用来产生目标指令,甚至可用来对输入串进行解释执行。
第三章 词法分析
3.1 确定的有限自动机DFA M是一个五元组M =(S,∑,δ ,S0 ,F )
(1) S 是一个非空有限集,它的每个元素称为一个状态
(2)∑是一个有穷字母表,它的每个元素称为一个输入符号,所以也称为输入符号字母表
(3)δ是状态转换函数,是在S×å→S上的单值映射
(4) s0 s0∈S,是唯一的一个初态
(5) F F含于S,可空,是一个终态集,终态也称可接受状态或结束状态
3.2 一个NFA M是五元式 M=(S,S,δ,S0,F)
(1)S 有穷非空状态集合
(2)∑ 有穷的输入字母表集合
(3)δ 从S´∑*到S的子集的映射
(4)S0Í 是S的非空子集,称为初始状态集合
(5)F Í 是S的子集(可空),称为终止状态集合
3.3 DFA与NFA特点比较
DFA特点:
1. 初态唯一
2. 输入字符不包括空符号串
3. 有向边上只有一个字符
4. 一个状态对某个字符最多只有一条出边
NFA特点:
1. 初态不唯一
2. 输入字符包括空符号串
3. 有向边上可以为字符串
4. 一个状态对某个字符可能有多条输出边,即状态的后继不唯一
3.4 词法分析是基于正则文法进行,即识别的单词是该文法的句子;语法分析基于上下文无关文法进行,即识别的是该类文法的句子。语法分析的有效工具是语法树。
第四章 语法分析——自上而下分析
4.1 自上而下分析法:从文法的开始符号出发,反复使用文法的产生式,寻找与输入符号串匹配的推导,又分为:递归下降分析、预测分析(LL),又称为带有回溯的自顶向下分析法。
4.2 自下而上分析法:从输入符号串开始,逐步进行归约,直至归约到文法的开始符号。又分为算符优先分析、LR分析。
4.3 回溯:分析任务要部分或全部的退回去重做叫做回溯。回溯条件:文法中,对于某个非终结符号的规则其右部有多个选择,并根据所面临的输入符号不能准确的确定所要选择时,就可能出现回溯。
4.4 左递归:一个文法是含有左递归的,
第五章 语法分析——自下而上分析
5.1利用语法树虚招句型的短语、句柄等
寻找方法
句型的语法树有:
n个内部节点——n棵子树(包括根节点)
n棵子树——n个短语
每棵子树的叶节点从左至右排列组成一个短语
m棵直接子树——m个直接短语(只有父子两代)
最左直接子树——句柄
素短语:
(1)是一个短语
(2)至少包含一个终结符
(3)且除自身外不再包含其他素短语
5.2分析句型时,应用算符优先分析技术时,每步被直接归约的是最左素短语,而应用LR分析技术时,每步被直接归约的是句柄。
5.3 规范归约(最左归约):最有推导的逆过程;规范推导:最右推导
如果一个文法G无二义性,则规范归约的逆过程必定是规范推导