Treetop——基于Ruby的PEG解析器生成器

Ruby已经有了一个叫做RACC的解析器生成器,是一个YACC的移植版本(被用来 编写ruby_parser,第一个用Ruby写成的Ruby解析器)。

当谈到解析器生成器的时候, 解析表达式语法(PEG)最近因为一篇 Bryan Ford介绍的一种叫做“Packrat解析”优化的论文而 变得很流行。Packrat解析解决了诸如指数级解析时间的问题。这是由于解析器使用回溯来解析代码,例如,它们会尝试诸多结果的组合直到找到正确的那一 个。Packrat解析的解决方法是使用记忆化,例如将解析的中间结果保存下来,而不是一遍一遍的重新计算。这决定了Packrat解析的时间复杂度是线 性的,但是缺点是需要很大的内存,通常是源代码大小的几倍。注意,其他的解析器生成器也是采用类似的方法,比如 ANTLR。

基于这个前提, Treetop网站上如此解释PEG的优点:
解析表达式语法(PEGs)编写简单、易于维护。它 们是简单但功能强大的 泛化正则表达式,比起传统的LALR或者LR-1语法的解析器生成器来说更易于使用。没有必要再进行符号化解析,或者用于有限度上下文敏感的前向断言。
Treetop会自动生成解析树,而且还允许用户添加方法来定制所生成的节点:
grammar Arithmetic
 rule additive
 multitive '+' additive {
 def value
 multitive.value + additive.value
 end
  }
 /
 multitive
end
# other rules below ...
end
这段代码的意思是通过additive节点生成的节点有一个叫做value的方法。另外,可以为每条规则指定一个要生成的节点类。(注意:这个斜杠是选择操作符,意思是,additive规则要么是两个操作数和之间的加号,要么是multitive规则的结果)。

在开始使用Treetop之前,你需要先安装它。可以 从Rubyforge下载Treetop的源代码,或者通过gem安装,命令为:
gem install treetop 
想要开始使用它的话,可以去 查看Treetop的文档或者看看上文中的 示例。 Treetop需要一个简单的算术表达式解析器、一个非常基本的语言解析器以及运行时间。

Treetop可以 通过 tt工具将语法定义文件转换成Ruby代码:
tt foo.treetop  
另一种选择是 通过Ruby代码来进行解析器生成:
Treetop.load "arithmetic"
parser = ArithmeticParser.new
parser.parse('1+1')
Treeop创始人的现场演示,参见 Nathan Sobo在RubyConf 2007上关于Treetop的报告。

查看英文原文:Treetop - PEG parser generator for Ruby

你可能感兴趣的:(Treetop——基于Ruby的PEG解析器生成器)