一、实验名称
自动生成LR(0)分析表
二、实验目的
1、实现计算闭包函数CLOSURE的算法。
2、实现转向函数GO(I,X)的算法。
3、实现ACTION子表和GOTO子表的构造算法。
4、输入任意的压缩了的上下文无关文法,输出相应的LR(0)分析表(以表格形式输出)。
三、实验原理
1、闭包closure(I)
若文法G已拓广为G’,而S为文法G的开始符号,拓广后增加产生式S’->S。如果I是文法G’的一个项目集,定义和构造I的闭包closure(I)如下:
a.I的项目在closure(I)中。
b.若A->α•Bβ属于closure(I),则每一形如B->•γ的项目也属于closure(I)。
c.重复b直到不出现新的项目为止。即closure(I)不再扩大。
2、转换函数GO(I,X)
GO(I,X)=closure(J)
其中:I为包含某一项目集的状态。
X为一文法符号,X∈Vn∪Vt
J={任何形如A->α•Xβ的项目|A->αX•β属于I}
3、ACTION子表和GOTO子表的构造
a.若项目A→α.aβ属于Ik且GO (Ik, a)= Ij, a为终结符,则置ACTION[k, a]为“把状态j和符号a移进栈”,简记为“sj”;
b.若项目A→α.属于Ik,那么,对任何终结符a,置ACTION[k,a]为“用产生式A→α进行规约”,简记为“rj”;其中,假定A→α为文法G'的第j个产生式
c.若项目S'→S.属于Ik, 则置ACTION[k, #]为“接受”,简记为“acc”;
d.若GO (Ik, A)= Ij, A为非终结符,则置GOTO[k, A]=j;
e.分析表中凡不能用上述1至4填入信息的空白格均置上“出错标志”。 按上述算法构造的含有ACTION和GOTO两部分的分析表,如果每个入口不含多重定义,则称它为文法G的一张LR(0)分析表。具有LR(0)表的文法G称为一个LR(0)文法,LR(0)文法是无二义的。
四、实验思路
本次实验采用python完成。
1、输入
构造一个LR类,输入非终结符,终结符,开始符以及产生式分别存于LR类的成员:Vn,Vt,start,production。
2、建立项目
构造函数Project,根据产生式建立项目,对每一条产生式的右部进行处理,依次在右部的每个终结符和非终结符前添加原点,并在最后添加原点。
3、closure算法
构造函数closure,求一个项目的闭包closure。分三种情况讨论,对于S->·和E->·a这两种情况,返回自身。对于E->b·B这种情况,对项目的右部进行处理,继续求B->·r闭包,因此这是一个递归函数。最终函数以列表的形式返回每个项目集。
4、转向函数GO(I,X)的算法
构造函数GO,求一个项目集的GO(I,X)。建立字典go存放最终结果,对不是S->a·形式的项目进行讨论,对项目的右部进行处理,将原点后移一位,利用closure函数得到圆点后移得到的项目的项目集,加入go中。直到处理完该项目集的所有项目。
5、建立状态及对应的项目集
构造函数createDFA,建立状态及对应的项目集。首先,从拓广文法的第一个项目开始,建立初态,定义number存放状态编号,初始值为0。设立字典status存放状态编号及对应的项目集。将初态加入一个队列qu中。每次从qu中取出一个状态,求该状态的项目集的Go(I,x),再对得到的项目集进行判断,若该项目集是已知的状态,则不做处理,若该项目集是新的状态,则将其加入队列qu中,number加1。每次从qu中取出一个状态重复上述操作,直到队列为空,说明已求得所有状态。
6、ACTION子表的构造
分两种情况讨论:项目集只有一个项目和项目集不止一个项目。对于第一种情况,再分两种情况,看该项目是否对应了初态,若是,则将#对应为acc,其余终结符对应为error,若不是,则求得该项目去掉圆点之后的产生式的编号i,终结符合#对应为ri。对于项目集不止一个项目的情况,依次对终结符和#寻找在该状态的的GO(I,X)下是否有所对应,有则求得编号对应为Si,没有则对于error。
7、GOTO子表的构造
对于每个状态的GO(I,X)函数进行遍历,寻找是否有对应的终结符,若有则返回对应的项目集的编号,若没有则返回error。
五、实验小结
通过本次实验,了解了LR(0)分析表的构造,对于构造过程所需要的一些算法有了深入的了解,通过实际的编写程序代码完成LR(0)分析表的构造,对于程序的编写能力有了一定的提升。在实验过程中,主要对于closure闭包函数的构造以及状态的设置有问题。Closure闭包函数用了递归的结构,因此对于递归的结束条件需要标注清楚。对于状态的建立,需要注意每次通过GO(I,X)得到的新的项目集是否是已经存在的状态,若是则不做处理。对于状态的遍历使用队列来完成,每次新的状态都加入队列中,队列为空说明状态遍历完毕。有一点问题值得注意,由于状态编号的项目集的存储结构使用了字典,字典是无序的结构,因此每次遍历得到的状态编号都不同,程序的每次运行得到的最终LR(0)分析表不唯一。
六、附件
1、源代码
import copy
import queue
class LR:
def __init__(self):
self.Vn = []
self.Vt = []
self.start = None # 开始符号
self.production = [] # 产生式
self.project = [] # 项目
self.status = {} # 存放状态编号及对应的项目集
self.goto = {} # 存放goto表 {0:{E:'1',A:'error',B:'error'}}
self.action = {} # 存放action表 {0:{a:'S2',b:'S3'}}
def setVn(self):
Vn = input('输入非终结符(以空格区分, 回车结束):')
self.Vn = Vn.split(' ')
def setVt(self):
Vt = input('输入终结符(以空格区分, 回车结束):')
self.Vt = Vt.split(' ')
def setS(self):
S = input('输入开始符号(以回车结束):')
self.start = S
def setf(self): # 生成产生式
n = int(input('输入产生式数目:'))
print('输入产生式(以回车区分):')
for i in range(n):
f = input()
self.production.append(f)
def Project(self): # 建立项目
for f in self.production:
temporary = copy.deepcopy(f) # temporary与f相同
temporary = temporary.split('->')
l = temporary[0] # 产生式左部
r = list(temporary[1]) # 产生式右部
for i in range(len(r)+1): # 对产生式右部处理
temporary1 = copy.deepcopy(r)
temporary1.insert(i,'·')
newf = l+'->'+''.join(temporary1)
self.project.append(newf)
def closure(self, pro): # 求一个项目pro的闭包 E->· E->·b E->b·B 返回列表
temporary = [] # 最终返回的结果
temporary.append(pro) # 将pro自身加入
l1 = pro.split('->')[0] # 左部
r1 = pro.split('->')[1] # 右部
x = list(r1) # 存放右部的列表
index = x.index('·') # 得到圆点位置
if len(x) == 1: # S->·
return temporary
else:
if index == len(r1)-1 or x[index+1] in self.Vt: #E->·a
return temporary
else: # E->b·B
for elem in range(len(self.project)):
l = self.project[elem].split('->')[0] # 左部
r = self.project[elem].split('->')[1] # 右部
if l == x[index+1] and r.startswith('·'): # 继续求B->·r闭包
conlist = self.closure(self.project[elem])
if len(conlist) == 0:
pass
else:
temporary.extend(conlist)
return temporary
def GO(self, project): # 计算一个项目集的GO(I,x),返回字典形式
go = {} # 存放Go(I,x)结果,形式为{a:[],b:[]}
for elem in project:
l = elem.split('->')[0] # 项目左部
r = elem.split('->')[1] # 项目右部
index = list(r).index('·') # 返回·的位置
if not r.endswith('·'): # 不是S->a·形式
if go.get(list(r)[index+1]) == None: # 说明x所对应的go中没有项目
temporary = list(r)
temporary.insert(index+2, '·')
temporary.remove('·') # 将·后移一位
x = l+'->'+''.join(temporary) # 产生一个完整的项目
go[list(r)[index+1]] = self.closure(x) # 将该项目对应的项目集加入x的go中
else: # 说明x所对应的go中已有项目
temporary = list(r)
temporary.insert(index+2,'·')
temporary.remove('·') # 将·后移一位
x = l+'->'+''.join(temporary) # 产生一个完整的项目
go[list(r)[index+1]].extend(self.closure(x))
return go
def createDFA(self): # 建立识别活前缀的DFA
number = 0 # 初始状态编号为0
first = 'S->·'+self.start # 初态
x = self.closure(first) # 初态闭包
self.status[number] = x
qu = queue.Queue() # 构造队列,用于存放得到的状态
qu.put({number:self.status[number]}) # 把初始状态加入队列中
number = number+1
while not qu.empty(): # 队列不为空,说明状态没有遍历完毕
temporary = qu.get() # 队列中取出一个状态
for k, v in temporary.items():
y = self.GO(v) # 求项目集的Go(I,x)
for key, value in y.items():
flag = -1 # 标志位,判断value是否是新的状态
for ke, va in self.status.items():
if set(va) == set(value):
flag = ke # 状态已存在,返回状态编号
break
if flag == -1: # 新的状态,加入状态集中
self.status[number] = value
qu.put({number:self.status[number]})
else: # 已有状态
pass # 不作处理
def GOTO(self): # goto表
for i in range(len(self.status)):
self.goto[i] = {}
temp = self.GO(self.status[i]) # 每个状态的GO
for vn in self.Vn: # 对非终结符遍历
if vn in temp.keys(): # 非终结符存在于状态的Go中
for key, value in self.status.items():
if set(value) == set(temp[vn]):
number = key # 记录编号
break
self.goto[i][vn] = number
else:
self.goto[i][vn] = 'error'
def ACTION(self):
vtx = copy.deepcopy(self.Vt)
vtx.append('#') # 终结符加‘#’
for i in range(len(self.status)):
self.action[i] = {}
if len(self.status[i]) == 1: # 项目集只有一个项目
if self.status[i][0].startswith('S'): # S->E·
for vt in self.Vt:
self.action[i][vt] = 'error'
self.action[i]['#'] = 'acc'
else: # 填写rj的项目 E->aA·
temp = self.status[i][0].rstrip('·') # 删去项目的· E->aA
for n in range(len(self.production)):
if self.production[n] == temp:
m = n+1 # 产生式在G'中下标从1开始
break
for vt in vtx:
self.action[i][vt] = 'r'+str(m)
else: # 填写Sj的项目
temp = self.GO(self.status[i]) # 字典形式{a:[],b:[]}
for vt in vtx:
if vt in temp.keys():
for key, value in self.status.items(): # 确定到哪一个状态
if set(value) == set(temp[vt]):
number = key # 返回状态编号
break
self.action[i][vt] = 'S'+str(number)
else:
self.action[i][vt] = 'error'
def output(self): # 输出LR(0)分析表 表格形式
print('LR(0)分析表'.center(85))
print('状态'.center(5), 'ACTION'.center(50), 'GOTO'.center(30))
print(' '.center(10),end='')
for vt in self.Vt: # action
print(vt.center(10),end='')
print('#'.center(10),end='')
for vn in self.Vn: # goto
print(vn.center(10),end='')
print() # 换行
vtx = copy.deepcopy(self.Vt)
vtx.append('#')
for i in range(len(self.status)): # 输出每一行
print(str(i).center(10),end='')
for vt in vtx:
for key in self.action[i]: # {0:{'b':'S1'}}
if vt == key:
print(self.action[i][key].center(10),end='')
break
for vn in self.Vn:
for key in self.goto[i]:
if vn == key:
print(str(self.goto[i][key]).center(10),end='')
break
print() # 换行
def show(self): # 显示各个状态及对应的项目集
print('所有状态及对应的项目集:')
for key, value in self.status.items():
print(key, value)
if __name__ == '__main__':
a = LR()
a.setVn()
a.setVt()
a.setS()
a.setf()
a.Project()
a.createDFA()
a.ACTION()
a.GOTO()
a.show()
a.output()
2、程序运行结果
语法分析表/1.png)
语法分析表/2.png)