一个语法分析器的实现

语法分析设计文档

LR分析法分LR(0),SLR(1),LALR,LR(1)好几种,具体是SLR(1)分析法,对于LR分析法来说,语法分析过程都由一个称为“总控程序”来完成的

总控程序是LR分析法的核心处理模块,而LR分析表又是总控程序的核心部分,所以整个LR分析法的核心部分就是求出LR分析表,下面就首先说明LR分析表的构造

 

给定文法(注意这里的标号表示的是第几条归约式,后面会用到!):

	1.	E -> E+T
	2.	E -> E-T
	3.	E -> T
	4.	T -> T*F 
	5.	T -> T/F 
	6.	T -> F
	7.	F -> (E) 
	8.	F -> i

文法的项目集:

	E’ -> E			(注意这个E’,其实目的就是说推导从这里开始)
	E -> E+T
	E -> E-T
	E -> T
	T -> T*F 
	T -> T/F 
	T -> F
	F -> (E) 
	F -> i

项目集规范族(这个跟书本上的是一样的,最好是自己先推一下):

	I0:
	E’ -> .E		    I1(下一步接收E)
	E -> .E+T		I1
	E -> .E-T		I1
	E -> .T			I2(下一步接收T)
	T -> .T*F 		I2
	T -> .T/F 		I2
	T -> .F			I3(下一步接收F)
	F -> .(E) 		I4(下一步接收左括号)
	F -> .i			I5(下一步接收i)

	I1:
	E’ -> E.
	E -> E.+T		I6(下一步接收+)
	E -> E.-T		I7(下一步接收-)

	I2:
	E -> T.
	T -> T.*F 		I8(下一步接收*)
	T -> T./F 		I9(下一步接收/)

	I3:
	T -> F.			

	I4:
	F -> (.E) 		I10(下一步接收E)
	E -> .E+T		I10
	E -> .E-T		I10
	E -> .T			I2(这个状态以前出现过)
	T -> .T*F 		I2
	T -> .T/F 		I2
	T -> .F			I3
	F -> .(E) 		I4
	F -> .i			I5

	I5:
	F -> i.

	I6:
	E -> E+.T		I11(下一步接收T)
	T -> .T*F 		I11
	T -> .T/F 		I11
	T -> .F			I3
	F -> .(E) 		I3
	F -> .i			I5

	I7:
	E -> E-.T		I12(下一步接收T)
	T -> .T*F 		I12
	T -> .T/F 		I12
	T -> .F			I3
	F -> .(E) 		I4
	F -> .i			I5

	I8:
	T -> T*.F 		I13(下一步接收F)
	F -> .(E) 		I4
	F -> .i			I5

	I9:
	T -> T/.F 		I14(下一步接收F)
	F -> .(E) 		I4
	F -> .i			I5

	I10:
	F -> (E.) 		I15(下一步接收右括号)
	E -> E.+T		I6
	E -> E.-T		I7

	I11:
	E -> E+T.		
	T -> T.*F 		I8
	T -> T./F 		I9

	I12:
	E -> E-T.
	T -> T.*F 		I8
	T -> T./F 		I9

	I13:
	T -> T*F .

	I14:
	T -> T/F .

	I15:
	F -> (E) .

 

这个推导过程应该没问题吧?如果有问题,仔细再检查一下!好,这个推导过程其实对于LR(0),SLR(1),LALR,LR(1)都是必经的一步,而且都是一样的,真正不一样的地方就体现在最终的分析表上

 

问题:这个文法是LR(0)文法吗?如果不是,那么它是SLR(1)文法吗?(请务必先自己认真思考一下,再看解答,因为这个问题很关键!)

 

解答:

从上述的项目集规范族观察I2,I11,I12:

	I2:
	E -> T.
	T -> T.*F 		I8(下一步接收*)
	T -> T./F 		I9(下一步接收/)

	I11:
	E -> E+T.		
	T -> T.*F 		I8
	T -> T./F 		I9

	I12:
	E -> E-T.
	T -> T.*F 		I8
	T -> T./F 		I9


注意到没有?对于I2,从I2状态出发,接收了T后,可以到达I8和I9状态,那么到底应该前往哪一个状态呢?

于是这个文法不是LR(0)文法!(I11和I12的分析同理)


要证明是不是SLR(1)文法,先求Follow集

Follow(E) = {+,-,),#}(# 是终结符)


因为E -> E+T

所以Follow(E)是Follow(T)的子集(就是E有的T里也要有)

Follow(T) = {+,-,),*,/,#}(# 是终结符)


因为T -> T*F

所以Follow(T)是Follow(F)的子集

Follow(F) = {+,-,),*,/,#}(# 是终结符)


好了,现在可以构造SLR(1)分析表了,先给出这个表

一个语法分析器的实现_第1张图片

回顾项目集规范族,一步步填表:

1. 从I0出发,接收E到达I1,于是在状态栏0列,GOTO表E列填入1;接收T到达I2,同理填入2;接收F到达I3,同理填入3;接收左括号到达I4,在ACTION表(列填入S4;接收i到达I5,在ACTION表i列填入S5

2. 从I1出发,因为这里第一条“E’-> E.”意味着文法被接受(Accept),所以(1,#)填入ACC,表示到达此状态文法被接受,对应的(1,+)填入S6,(1,-)填入S7

3. 从I2出发,因为这个状态会导致冲突,因此要使用SLR(1)分析法消除冲突

对于“E -> T.”,还记得Follow(E)吧,现在就在(2,#)和(2,Follow(E))的所有元素,即(2,+),(2,-),(2,))上填入R3(R3表示将其归约为第三条归约式,还记得前面的标号吧)

对于:

T -> T.*F       I8(下一步接收*)

T -> T./F       I9(下一步接收/)

直接在(2,*)上填入S8,(2,/)上填入S9


我想到这里,你应该自己推出整个表了吧!不信?自己推一次!上述有错漏之处,望指正!


既然有了分析表,现在就要使用总控程序对输入串进行语法分析了,分析表中有Si和rj大家都知道的。S是shift的缩写,也就是移进,R是reduce的缩写,也就是规约。规约是推导的逆操作。

先来看看在进行分析的时候S和R操作的规则

Si:移进,把i移入到状态栈,把a移入到符号栈。其中i,j表示状态号。
Ri:归约,用第i个产生式归约,同时状态栈与符号栈退出相应个符号,并把GOTO表相应状态和第i个产生式的左部非终结符入栈。


分析输入串“((i+i))”进行语法分析(我手写的分析过程和LemonParser的一样,直接上图吧)

一个语法分析器的实现_第2张图片

一个语法分析器的实现_第3张图片

 

第一步,符号栈中是#,输入符号串就是给定的要分析的串,状态栈因为从0开始,所以状态栈直接填0,应该知道,LR分析是从左到右扫描的。所以心里想着一根指针p,p首先指向输入串的‘(’,然后我们查ACTION表的(0,‘(’),0就是状态0,‘(’就是指针的当前字符。分析表中的(0,‘(’)是S4,填入第一步的ACTION,并且动作列填入移进,根据规则,将4入状态栈,‘(’入符号栈
    进入第二步,指针p肯定要前进一步了,所以输入符号串就进入b了,此步同上一步,不多解释
    关键是进入第四步后,此时,符号栈中为#((i,输入符号串是+i))#,状态栈是0445,此时去查ACTION表,查得(5,+),5是状态栈顶,+是p指针的当前位置。发现是R8,根据规则,用第8条产生式F -> i来规约。把动作栏GOTO先填了,同时状态栈与符号栈退出相应个符号,也即是说,把状态栏的栈顶5退出来,同时符号栈的i也退出,心里想着,不填表,并把GOTO表相应状态和第8个产生式的左部非终结符F入栈。GOTO表需要查的是(4,F)=3,8是R8的8,F是第8个产生式的左部。所以,就把3入状态栈,F入符号栈
  
    后面的都是一样的,不解释了,想明白这个过程,多动手是必需的,你也手工试试吧


SLR(1)的语法分析器:

一个语法分析器的实现_第4张图片

一个语法分析器的实现_第5张图片

你可能感兴趣的:([编程语言]C/C++)