语法分析设计文档
LR分析法分LR(0),SLR(1),LALR,LR(1)好几种,具体是SLR(1)分析法,对于LR分析法来说,语法分析过程都由一个称为“总控程序”来完成的
总控程序是LR分析法的核心处理模块,而LR分析表又是总控程序的核心部分,所以整个LR分析法的核心部分就是求出LR分析表,下面就首先说明LR分析表的构造
给定文法(注意这里的标号表示的是第几条归约式,后面会用到!):
1. E -> E+T
2. E -> E-T
3. E -> T
4. T -> T*F
5. T -> T/F
6. T -> F
7. F -> (E)
8. F -> i
文法的项目集:
E’ -> E (注意这个E’,其实目的就是说推导从这里开始)
E -> E+T
E -> E-T
E -> T
T -> T*F
T -> T/F
T -> F
F -> (E)
F -> i
项目集规范族(这个跟书本上的是一样的,最好是自己先推一下):
I0:
E’ -> .E I1(下一步接收E)
E -> .E+T I1
E -> .E-T I1
E -> .T I2(下一步接收T)
T -> .T*F I2
T -> .T/F I2
T -> .F I3(下一步接收F)
F -> .(E) I4(下一步接收左括号)
F -> .i I5(下一步接收i)
I1:
E’ -> E.
E -> E.+T I6(下一步接收+)
E -> E.-T I7(下一步接收-)
I2:
E -> T.
T -> T.*F I8(下一步接收*)
T -> T./F I9(下一步接收/)
I3:
T -> F.
I4:
F -> (.E) I10(下一步接收E)
E -> .E+T I10
E -> .E-T I10
E -> .T I2(这个状态以前出现过)
T -> .T*F I2
T -> .T/F I2
T -> .F I3
F -> .(E) I4
F -> .i I5
I5:
F -> i.
I6:
E -> E+.T I11(下一步接收T)
T -> .T*F I11
T -> .T/F I11
T -> .F I3
F -> .(E) I3
F -> .i I5
I7:
E -> E-.T I12(下一步接收T)
T -> .T*F I12
T -> .T/F I12
T -> .F I3
F -> .(E) I4
F -> .i I5
I8:
T -> T*.F I13(下一步接收F)
F -> .(E) I4
F -> .i I5
I9:
T -> T/.F I14(下一步接收F)
F -> .(E) I4
F -> .i I5
I10:
F -> (E.) I15(下一步接收右括号)
E -> E.+T I6
E -> E.-T I7
I11:
E -> E+T.
T -> T.*F I8
T -> T./F I9
I12:
E -> E-T.
T -> T.*F I8
T -> T./F I9
I13:
T -> T*F .
I14:
T -> T/F .
I15:
F -> (E) .
这个推导过程应该没问题吧?如果有问题,仔细再检查一下!好,这个推导过程其实对于LR(0),SLR(1),LALR,LR(1)都是必经的一步,而且都是一样的,真正不一样的地方就体现在最终的分析表上
问题:这个文法是LR(0)文法吗?如果不是,那么它是SLR(1)文法吗?(请务必先自己认真思考一下,再看解答,因为这个问题很关键!)
解答:
从上述的项目集规范族观察I2,I11,I12:
I2:
E -> T.
T -> T.*F I8(下一步接收*)
T -> T./F I9(下一步接收/)
I11:
E -> E+T.
T -> T.*F I8
T -> T./F I9
I12:
E -> E-T.
T -> T.*F I8
T -> T./F I9
注意到没有?对于I2,从I2状态出发,接收了T后,可以到达I8和I9状态,那么到底应该前往哪一个状态呢?
于是这个文法不是LR(0)文法!(I11和I12的分析同理)
要证明是不是SLR(1)文法,先求Follow集
Follow(E) = {+,-,),#}(# 是终结符)
因为E -> E+T
所以Follow(E)是Follow(T)的子集(就是E有的T里也要有)
Follow(T) = {+,-,),*,/,#}(# 是终结符)
因为T -> T*F
所以Follow(T)是Follow(F)的子集
Follow(F) = {+,-,),*,/,#}(# 是终结符)
好了,现在可以构造SLR(1)分析表了,先给出这个表
回顾项目集规范族,一步步填表:
1. 从I0出发,接收E到达I1,于是在状态栏0列,GOTO表E列填入1;接收T到达I2,同理填入2;接收F到达I3,同理填入3;接收左括号到达I4,在ACTION表(列填入S4;接收i到达I5,在ACTION表i列填入S5
2. 从I1出发,因为这里第一条“E’-> E.”意味着文法被接受(Accept),所以(1,#)填入ACC,表示到达此状态文法被接受,对应的(1,+)填入S6,(1,-)填入S7
3. 从I2出发,因为这个状态会导致冲突,因此要使用SLR(1)分析法消除冲突
对于“E -> T.”,还记得Follow(E)吧,现在就在(2,#)和(2,Follow(E))的所有元素,即(2,+),(2,-),(2,))上填入R3(R3表示将其归约为第三条归约式,还记得前面的标号吧)
对于:
T -> T.*F I8(下一步接收*)
T -> T./F I9(下一步接收/)
直接在(2,*)上填入S8,(2,/)上填入S9
我想到这里,你应该自己推出整个表了吧!不信?自己推一次!上述有错漏之处,望指正!
既然有了分析表,现在就要使用总控程序对输入串进行语法分析了,分析表中有Si和rj大家都知道的。S是shift的缩写,也就是移进,R是reduce的缩写,也就是规约。规约是推导的逆操作。
先来看看在进行分析的时候S和R操作的规则
Si:移进,把i移入到状态栈,把a移入到符号栈。其中i,j表示状态号。
Ri:归约,用第i个产生式归约,同时状态栈与符号栈退出相应个符号,并把GOTO表相应状态和第i个产生式的左部非终结符入栈。
分析输入串“((i+i))”进行语法分析(我手写的分析过程和LemonParser的一样,直接上图吧)
第一步,符号栈中是#,输入符号串就是给定的要分析的串,状态栈因为从0开始,所以状态栈直接填0,应该知道,LR分析是从左到右扫描的。所以心里想着一根指针p,p首先指向输入串的‘(’,然后我们查ACTION表的(0,‘(’),0就是状态0,‘(’就是指针的当前字符。分析表中的(0,‘(’)是S4,填入第一步的ACTION,并且动作列填入移进,根据规则,将4入状态栈,‘(’入符号栈
进入第二步,指针p肯定要前进一步了,所以输入符号串就进入b了,此步同上一步,不多解释
关键是进入第四步后,此时,符号栈中为#((i,输入符号串是+i))#,状态栈是0445,此时去查ACTION表,查得(5,+),5是状态栈顶,+是p指针的当前位置。发现是R8,根据规则,用第8条产生式F -> i来规约。把动作栏GOTO先填了,同时状态栈与符号栈退出相应个符号,也即是说,把状态栏的栈顶5退出来,同时符号栈的i也退出,心里想着,不填表,并把GOTO表相应状态和第8个产生式的左部非终结符F入栈。GOTO表需要查的是(4,F)=3,8是R8的8,F是第8个产生式的左部。所以,就把3入状态栈,F入符号栈
后面的都是一样的,不解释了,想明白这个过程,多动手是必需的,你也手工试试吧
SLR(1)的语法分析器: