(2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记

第3章: 语法分析

  • 语法(syntax): 组合单词以形成词组、从句或句子的方法。
  • Lex 用一个符号代替某个正则表达式的缩写机制
  • 词法分析器Lex实现缩写形式的正则表达式:在将正则表达式翻译成有限自动机前,用digits右部的式子替代正则表达式出现的所有digits
  • 但这种方法不适用于sum-expr语言
  • 我们需要递归的续写形式
  • 提出上下文无关文法

3.1: 上下文无关文法

  1. 语言由文法描述,文法有产生式结合(production),产生式右部有0至多个符号
  2. 终结符:来自该语言字符串字母表中的单词
  3. 非终结符
  4. 开始符号(start symbol):区别对待的非终结符

3.1.1:推导

  1. 最左推导(leftmost derivation):总是扩展最左边非终结符的推导
  2. 最右推导(rightmost derivation)

3.1.2:语法分析树(parse tree)

  1. 与推导相结合

3.1.3:二义性文法(ambiguous)

  1. 二义性:一个文法能够推导出具有两棵不同语法树的句子
  2. 编译器利用语法分析树来推导语义
  3. 二义性会给编译带来问题,所以文法需要是无二义性的
  4. 表达式(expression),项(term),因子(factor)
  5. 所以语言需要找到无二义性的文法表示,否则此语言不能作为程序设计语言

3.1.4:文件结束符

  1. 用$符号来表示文件结束
  2. 设S是一文法的开始符号
  3. 为了指明 >S

3.2:预测分析

  1. 用递归下降(recursive descent)算法对文法进行分析
  2. 算法实质:将每一个文法产生式转变成递归函数的一个字句
  3. 递归下降分析也称为预测(predictive)分析
  4. 预测分析只适合于每个子表达式的第一个终结符号能够为产生式的选择提供足够信息的那种文法 

3.2.1:FIRST集合和FOLLOW集合

  1. 给定一个由终结符和非终结符组成的字符串y,FIRST(y)是从y可以推导出的任意字符串中的开头终结符组成的集合
  2. 如果两个不同的产生式X->y1和X->y2具有相同的左部符号,并且它们的右部有重叠的FIRST集合,则这个文法不能用预测分析法分析
  3. 因为如果存在某个终结符I,它既在FIRST(y1)中,又在FIRST(y2)中,则当输入单词为I时,递归下降分析器中与X对应的函数将不知道该怎么做
  4. 如果X-> ,Y-> ;那FIRST(XYZ)一定包含FIRST(Z)
  5. 所以,在计算FIRST集合时,我们必须跟踪能产生空串的符号,这种符号称为可为空的nullable符号,同时还必须跟踪有可能跟随在可为空符号之后的其他符号
  6. FOLLOW(X)可直接跟随于X之后的终结符集合
  7. nullable概念
  8. 算法:FIRST、FOLLOW和nullable的迭代计算
  9. 基于文法3-6使用算法,通过每一步迭代来理解运用算法
    • 文法:
    • (2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记_第1张图片
    • 初始:
    • (2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记_第2张图片
    • 第一次迭代:
    • (2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记_第3张图片 
    • 第二次迭代:
    • (2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记_第4张图片 
    • 第三次迭代没有发现新的信息,于是算法终止

3.2.2:构造一个预测分析器

  1. 考虑一个递归下降器。非终结符X的分析函数对X的每个产生式都有一个子句,因此该函数必须根据下一个输入单词T来选择其中的一个子句。如果能够为每一个(X,T)选择出正确的产生式,我们就能够写出这个递归下降分析器。我们需要的所有信息可以用一张关于产生式的二维表来表示,此表以文法的非终结符X和终结符T作为索引,这张表称为预测分析表
  2. 预测分析表多重定义项的出现可能会导致二义性,我们需要一个无二义性的文法
  3. 若一个文法的预测分析表不含多重定义的项,则称为LL(1)文法
  4. LL(1)代表从左至右分析、最左推导和超前查看一个符号(Left-to-right parse, Leftmost-derivation,1-symbol lookahead)
  5. LL(k)分析表:表的行是非终结符,列是k个终结符的每一种序列
  6. 递归下降分析器完成起工作只需查看下一个输入单词,从不需要超前查看多于一个以上的单词

3.2.3:消除左递归

  1. 左递归:E作为E的产生式的第一个左部符号出现
    (2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记_第5张图片
  2. 右递归(引入非终结符E’)
    (2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记_第6张图片
    1. 为了消除左递归,利用右递归来重写产生式

3.2.4:提取左因子

  1. 当一个非终结符的两个产生式以相同的符号开始时也会发生类似的问题
    (2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记_第7张图片
  2. 对文法提取左因子,即取出非公共的尾部
    (2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记_第8张图片

3.2.5:错误恢复

  1. 有了预测分析表,便很容易写出递归下降分析器
  2. 错误恢复就是通过删除、替代或插入单词,来寻找一个与那个单词串相似的句子

未完待续

你可能感兴趣的:(编译原理)