编译器笔记13-语法分析-LR分析法概述

一.LR分析法简介

可以用LR分析法分析的文法可以称为LR分析法。LR文法(Knuth,1963)是最大的、可以构造出相应移入- 归约语法分析器的文法类。

  • L: 对输入进行从左到右的扫描
  • R: 反向构造出一个最右推导序列

LR(k)分析,需要向前查看k个输入符号的LR分析,k=0 和 k=1 这两种情况具有实践意义,当省略(k)时,表示k=1。而在LR(k)这样的名称中,k代表的是分析时所需前瞻符号(lookahead symbol)的数量,也就是除了当前处理到的输入符号之外,还得再向右引用几个符号之意;省略 (k)时即视为LR(1),而非LR(0)。

作为对比这里列出LL(1)文法的含义:

  • 第一个“L” 表示从左向右扫描输入
  • 第二个“L” 表示产生最左推导
  • “1” 表示在每一步中只需要向前看一个输入符号来决定语法分析动作

二.LR分析法的基本原理

问:自底向上分析的关键问题是什么?
答:如何正确地识别句柄,句柄是逐步形成的,用“状态”表示句柄识别的进展程度。例如在自底向上分析概述中所提及到句柄识别错误的例子,通过状态跟下一个输入符号就可以判断出应该做出哪一个动作,而状态相当于一种记忆功能记录当前句柄识别到什么程度。

编译器笔记13-语法分析-LR分析法概述_第1张图片
三个状态.png
编译器笔记13-语法分析-LR分析法概述_第2张图片
LR分析器(自动机)的总体结构.png

与移入分析器不同的是LR分析器多了一个与符号栈平行的状态栈。

三.分析表的作用

编译器笔记13-语法分析-LR分析法概述_第3张图片
LR分析表的结构.png
编译器笔记13-语法分析-LR分析法概述_第4张图片
分析过程1.png

之后的分析过程与上图类似,直至到如下状态,分析成功。可见分析时进行什么动作是由栈状态栈栈顶的状态和下一个输入符号决定。

编译器笔记13-语法分析-LR分析法概述_第5张图片
分析过程2.png

四.LR分析器的工作过程

编译器笔记13-语法分析-LR分析法概述_第6张图片
LR分析器的工作过程1.png
编译器笔记13-语法分析-LR分析法概述_第7张图片
LR分析器的工作过程2.png
LR分析器的工作过程3.png

输入:串w和LR语法分析表,该表描述了文法G的ACTION函数和GOTO函数。
输出:如果w在L(G)中,则输出w的自底向上语法分析过程中的归约步骤;否则给出一个错误指示。
方法:初始时,语法分析器栈中的内容为初始状态s0 ,输入缓冲区中的内容为w$。然后,语法分析器执行下面的程序:

编译器笔记13-语法分析-LR分析法概述_第8张图片
程序.png

五.LR(0)分析表构造

相关概念

先了解LR(0)项目和增广文法这两个概念

  • LR(0)项目

右部某位置标有圆点的产生式称为相应文法的一个LR(0)项目(简称为项目):A → α1·α2

文法开始符号S表示的是语言中的最大成分。如下图当b出现时可以将它移入到分析栈中。b移进栈后我们期待归约出B。当归约出B时我们还期待再归约一个B。

编译器笔记13-语法分析-LR分析法概述_第9张图片
LR(0) 项目.png
  • 增广文法 (Augmented Grammar)

如果G是一个以S为开始符号的文法,则G的增广文法G'就是在G中加上新开始符号S'和产生式S'→S而得到的文法

编译器笔记13-语法分析-LR分析法概述_第10张图片
增广文法.png

引入这个新的开始产生式的目的是使得文法开始符号仅出现在一个产生式的左边,从而使得分析器只有一个接受状态。

  • 文法中的项目

项目可以分为以下几类:

  1. 归约项目 - 圆点在生成式最右端,需要归约
  2. 接收项目 - 特殊的归约项目,是文法开始符号的归约项目
  3. 待约项目 - 圆点后面的第一个符号为非终结符
  4. 移进项目 - 圆点后面的第一个符号为终结符
编译器笔记13-语法分析-LR分析法概述_第11张图片
初始项目 归约项目 接收项目.png

上图中S'对应的第一个项目称为初始项目,而S'对应的最后一个项目称之为接收项目在此状态下文法的开始符号已经被归约出来,因此可以接收了故称为接收项目。红色方框中的项目则被称为归约项目。

编译器笔记13-语法分析-LR分析法概述_第12张图片
项目.png
  • 后继项目(Successive Item)
  1. 同属于一个产生式的项目,但圆点的位置只相差一个符号,则称后者是前者的后继项目。
  2. A→α·Xβ的后继项目是A→αX·β

项目集闭包(Closure of Item Sets)

可以把等价的项目组成一个项目集(I),称为项目集闭包,每个项目集闭包对应着自动机的一个状态。

LR(0)分析表构造算法
编译器笔记13-语法分析-LR分析法概述_第13张图片
LR(0)自动机.png

先了解CLOSURE和GOTO这两个函数

  • CLOSURE( )函数

项目集I的闭包的数学定义:

CLOSURE(I) = I ∪ {B → ·γ | A → α·Bβ ∈ CLOSURE(I), B→γ ∈ P}
编译器笔记13-语法分析-LR分析法概述_第14张图片
算法.png
  • GOTO( )函数

返回项目集I对应于文法符号X的后继项目集闭包

GOTO( I, X )=CLOSURE({A→αX·β | A→α·Xβ ∈I })
编译器笔记13-语法分析-LR分析法概述_第15张图片
算法.png
构造LR(0)自动机的状态集

规范LR(0)项集族(Canonical LR(0) Collection)

编译器笔记13-语法分析-LR分析法概述_第16张图片
算法.png
LR(0)分析表构造算法
编译器笔记13-语法分析-LR分析法概述_第17张图片
LR(0)分析表构造算法.png
LR(0) 自动机的形式化定义
编译器笔记13-语法分析-LR分析法概述_第18张图片
自动机的形式化定义.png

说明:该自动机的初始状态就是文法的初始项目的项目集闭包,其终止状态集合只有一个状态就是文法的接收项目的项目集闭包。

六 LR(0)分析的问题

LR(0) 分析过程中的冲突
编译器笔记13-语法分析-LR分析法概述_第19张图片
LR(0)分析过程中的冲突.png
表达式文法的LR(0)分析表含有移进/归约冲突
编译器笔记13-语法分析-LR分析法概述_第20张图片
分析表.png
移进/归约冲突和归约/归约冲突
编译器笔记13-语法分析-LR分析法概述_第21张图片
状态2混合了两种冲突.png

如果LR(0)分析表中没有语法分析动作冲突,那么给定的文法就称为LR(0)。不是所有CFG都能用LR(0)方法进行分析,也就是说,CFG不总是LR(0)文法。

为了解决移进/归约冲突和归约/归约冲突需要使用到SLR分析法和LR(1)分析法。

问: 为什么没有移进/移进冲突?
答: 首先只有在移进状态和待约状态下的项目才会有使用到移进操作。在0状态时所有项目都是移进状态根据LL文法显然不会产生移进/移进操作,因为每个产生式左部的SELECT集是没有交集的。而在其他具有待约状态项目的状态中,所有集合都是等价的。假若在某状态下输入终结符y时发生移进/移进冲突,即存在两个这样的项目A0→α0·yβ0,A1→α1·yβ1,但显然这两个项目是不等价的显然与同一状态下所有项目等价相矛盾,因此这种移进/移进冲突是不存在的。假若在某状态下输入非终结符X时发生移进/移进冲突,即存在两个这样的项目A0→α0·Xβ0,A1→α1·Xβ1,而A0与A1在同一状态下是等价的则两项目要么是A0→α0·Xβ0与X→.Xβ1(原项目A1变为X,α1变为ε)要么是A1→α1·Xβ1与X→.Xβ0(原项目A0变为X,α0变为ε)。显然X→Xβ0|Xβ1(左递归)是不符合LL文法的因此这种情况也是不可能出现。

综上移进/移进冲突在LR分析下是不存在的。

你可能感兴趣的:(编译器笔记13-语法分析-LR分析法概述)