作者:江南白衣
ANTLR(ANother Tool for Language Recognition)风头正盛,经常可以看到用它做语法解释器的项目,比如Hibernate就在3.0换上它来解释HQL,加强了HQL的语法。
因为Antlr是EBNF-AST语法解释系的代表,而自己总是心思思想搞一下DSL(领域语言),所以从Hibernate来学习一下Antlr的应用。
Hibernate HQL translator作者Joshua Davis的两个Blog
Hibernate3 Query Translator Design - Part One : The Basics
Hibernate3 Query Translator Design - Part Two : Parsing HQL
Antlr最好的介绍文章是那篇,在《程序员》2004年3月有中文的版本。 不过,那个计算器的例子太简单了。深刻一点的有<ashley j very="" thorough="" tutorial=""></ashley>。
另外,SlickEdit 支持Antlr的语法,是一定要用的编辑器,在 ttdown.com上有破解。
一,Antlr引擎的工作过程大概是这样的:
1.Lexer类--词法分析器。
定义语言中的各种Token(单词),如 From 、Where、=、<>.......
Lexer负责把读入的普通文本流识别成Token串。
2.Parser类--语法分析器。
使用BNF语法,递归定义句子的Pattern,如whereStatement、FromStatement、SelectStatement。
Parser负责把读入的Token串匹配成句子,翻译出AST(抽象语法树)。
有些简单的应用,也可以在本层现炒现卖,完成所有动作,属于Single Pass Builder。
3.TreeParser类--抽象语法树遍历器。
根据Parser类分析出来的AST(抽象语法树)进行动作。
用Parser把AST抽取出来,再用TreeParser进行动作的Double Pass Builder模式,解耦了Parser和Generation,再配合Template 生成代码,是Antlr推荐的最佳模式。
二,开发人员的实际步骤
1.按照Antlr的简单语法定义前面讲的3个类,文件的后缀名为g。
2.使用java antlr.Tool xxx.g命令,把grammar文件编译成java文件。
3.编写应用程序,如:
看过Antlr对HQL的解释,觉得EBNF系的方法要解释Java这样的编程语言还好些,如果要解释类自然语言的DSL就比较痛苦,所以情绪不是很高涨,挑一条最容易的"Delete from goods where ....." 匆匆走过场
Joel的一句话对我的影响比较大:"如果为了证明一个微不足道的问题需要花三个小时写下几黑板的证明步骤,那么这种机制不可能用来证明任何有趣的东西" 。对于我这个层次的程序员,antlr在我手中造不出有趣的DSL来。
三,Hibernate对Antlr的应用
Hibernate的HQL Grammar文件一共有三个,在/grammar目录下:
1.hql.g 定义Token类和Parser类,将HQL解释成hql的抽象语法树(AST)
2.hql-sql.g 定义Tree Walker ,将HQL AST转化为SQL AST,将生成模块与Hibernate解耦。
3.sql-gen.g 定义Tree Walker,从SQL AST生成sql
下面看 DELETE FROM GOODS的翻译过程
1.HqlBaseLexer extends Lexer
定义EQ: '=';LT: '<'; GT: '>';PLUS: '+';等符号
及IDENT: ( 'a' .. 'z' | '_' ) ( 'a' .. 'z' | '0' .. '9' | '_' | '$' )*
2.HqlBaseParser extends Parser
先定义DELETE="delete"; FROM="from"; MIN="min"; 等字符串
再定义:
3. HqlSqlBaseWalker extends TreeParser
hql与sql的delete语句基本上是一样的,没什么转换。
4.SqlGeneratorBase extends TreeParser
根据SQL AST, 生成SQL语句