首先知道 归约–是指根据文法的产生式规则,把产生式的右部替换成左部符号。
第一种规约的方式是 移进规约,即用一个寄存符号的栈,把输入符号一个一个地移进到栈里,当栈顶形成某个产生式的候选式时,即把栈顶的这一部分替换成(归约为)该产生式的左部符号。这里的问题是怎样识别可规约串
第二种是规范规约,首先定义的几个概念:
短语 定义:令G是一个文法,S是文法的开始符号,假定abc是文法G的一个句型
其中α,b,∈(VN∪VT)*,A∈VN ,如果有 “S*A 且A+ ”
则称b是abc句型相对于非终结符A的短语
注意:
因为句型是由开始符号推出来的,而短语是由非终结符号推出来的。所以,短语是句型的一部份或全部符号串。
直接短语 如果有A-》b,则称b是句型abc相对于规则A-》b 的直接短语。
句柄 一个句型的最左直接短语称为该句型的句柄。
通过下面的一个例子可以理解:
然后在使用栈进行规约的过程中有两点:
1.’#’的使用
(1)在分析开始时,将’#’预先进栈,作为栈底符号
(2)将’#’作为输入串的结束符
2、自左向右对输入串ω不断向栈中进行移进——归约,规约到开始符号
算符优先分析法是通过定义算符之间优先关系,借助这种关系来寻找“可归约串”和进行归约
定义两个终结符‘a’与‘b’的优先关系
a =.b 表示a的优先性等于b
a >.b 表示a的优先性大于b
a <.b 表示a的优先性小于b
注意:
=. >. <. 不同于数学上的 = < >
a =.b 不一定对应着 b =. a
a >.b 不一定对应着 b <. a
a <.b 不一定对应着 b >. a
关于算符优先问法的定义:
(1)算符文法
一个文法,如果它的任一产生式的右部都不含两个相继(并列)的非终结符,即不含如下形式的产生式右部:
…QR…
则我们称该文法为算符文法,也称OG文法 (Operater Grammar) 。
约定:
a、b代表任意终结符;
P、Q、非终结符;
‘…’代表由终结R代表任意符和非终结符组成的任意序列,包括空字
(2)定义终结符之间的优先关系
假定G是一个不含产生式的算符文法。对于任何一对终结符a、b,我们说:
1. a =. b 当且仅当文法G中含有形如P→…ab…或P→…aQb…的产生式;
2. a <. b 当且仅当G中含有形如P→…aR…的产生式, 而R b…或R Qb…;
3. a>.b 当且仅当G中含有形如P→…Rb…的产生式,而 R …a或R …aQ。
(3)如果一个算符文法G中的任何终结符对(a,b)至多只满足下述三关系之一:
a=.b
a>.b
a<.b
则称G是一个算符优先文法(OPG文法)。
接下来是构造算符优先关系表
(1)通过检查产生式的每一个候选式可以找出满足a=.b
(即P→…ab…或P→…aQb…的产生式)
(2)为了满足<.和>.,需对G中每个非终结符P构造两个集合FIRSTVT(P)和LASTVT(P):
(3)构造集合FIRSTVT(P)的算法
按其定义,可用下面两条规则来构造集合FIRSTVT(P):
① 若有产生式P→a…或P→Qa…,
则aFIRSTVT(P);
② 若aFIRSTVT(Q),且有产生式P→Q…,
则aFIRSTVT(P)。
(4)同理构造构造集合LASTVT(P)的算法
按其定义,可用下面两条规则来构造集合LASTVT(P):
① 若有产生式P→… a或P→… aQ ,
则a LASTVT(P);
② 若a LASTVT(Q),且有产生式P→… Q ,
则a LASTVT(P)。
(5)有了这两个集合之后,就可以通过检查每个产生式的候选式确定满足关系<.和>.的所有终结符对。
(1)假定有个产生式的一个候选形为
…aP…
那么,对任何bFIRSTVT(P),有a <. b。
(2)假定有个产生式的一个候选形为
…Pb…
那么,对任何aLASTVT(P),有a >. b。
(参考课件的几个例题再去理解)
LR分析方法是一种自下而上的分析方法
LR分析法的归约过程是规范推导的逆过程,所以LR分析过程是一种规范归约过程
LR分析方法是一种适用于一大类上下文无关文法的分析方法
比较复杂,不适于用手工实现,可借助于YACC/bison实现
根据归约过程中向前看输入符号串中字符的个数,定义不同的LR(k)分析方法,通常,k=0,1
关于LR分析法和LL分析方法的比较如下:
对于它的结构的几部分的说明:
1.LR分析器栈的结构_分析栈
(1)把历史和展望材料抽象成某些状态。分析栈用来存放这些状态。栈顶的状态都代表了整个历史和已经推测出的展望。
(2)为了有助于明确归约手续,将已归约出的文法符号串也同时放到栈里。
2.LR分析器栈的结构_动作表和状态转换表
动作表:
ACTION[s,a]:
当状态s面临输入符号a时,应采取什么动作
每一项ACTION[s,a]所规定的四种动作:
<1>. 移进
<2>. 归约
<3>. 接受
<4>. 报错
状态转换表:
GOTO[s,X]:
状态s面对文法符号X时,下一状态是什么
<1>. 移进
把(s,a)的下一状态s’=GOTO[s,a] 和输入符号a推进栈,下一输入符号变成现行输入符号.
<2>. 归约
指用某产生式A进行归约. 假若的长度为r, 归约动作是A, 去除栈顶r个项,使状态sm-r变成栈顶状态,然后把(sm-r, A)的下一状态s’=GOTO[sm-r, A]和文法符号A推进栈.
<3>. 接受 宣布分析成功,停止分析器工作。
<4>. 报错 发现源程序含有错误,调用出错处理程序
关于LR(1)的具体分析过程:
(课件例题参考理解)
活前缀
活前缀:文法G的活前缀是他的规范句型的前缀,该前缀不超过句柄的右端。
活前缀特点:
该前缀加上被分析串中未被分析的终结符,就可以构成一个规范句型
只要输入串的已扫描部分可归约成一个活前缀,意味着扫描过的部分没有错误
活前缀与句柄间的关系
(1)活前缀中已含有句柄的全部符号(句柄的符号即为其最右符号)。
这表明:此时某一产生式A→β的右部符号串β已出现在栈顶,因此相应的分析动作应当是用此产生式进行归约。
(2)活前缀中含句柄的一部分符号(句柄开头的 若干符号与活前缀最右的若干个符号一致)。
这表明形如A→β1β2的产生式的右部子串β1已出现在栈顶,正期待着从余留输入串中看到能由β2推出的符号串。
(3)活前缀中全然不包含句柄的任何符号 。
第三种情况则意味着,期望从余留输入串中能看到由某一产生式A→α右部,即A所推出的符号串。
LR分析表的构造需要构造识别活前缀的有限自动机,
用有限自动机中的状态表示分析表中的状态,
用状态图中的状态之间的转换关系对分析表中的action goto函数等进行定义。
关于识别活前缀的有限自动机课件的例题看理解
LR(0)分析表相当于识别活前缀的有限自动机DFA的状态转换矩阵。
LR(0)分析表的构造算法。