【系列1—文法和词法】

读自:The Definitive ANTLR 4 Reference, 2nd Edition.pdf

1、文法一

Hello.g4

grammar Hello;// Define a grammar called Hello
r : 'hello' ID ; // match keyword hello followed by an identifier
ID : [a-z]+ ;// match lower-case identifiers
WS : [ \t\r\n]+ -> skip ; // skip spaces, tabs, newlines, \r (Windows)

2、词法解析一

解析语句一:hello parrt ctrl+D

[@0,0:4='hello',<1>,1:0]
[@1,6:10='parrt',<2>,1:6]
[@2,12:11='',<-1>,2:0]

含义:
"@0" : 表示第1个token(词)
"0:4":表示[0,4]位置上内容
"<1>": 表示token类型——类型1
"1:0": 表示第1行,第0个位置开始

"@1" : 表示第2个token(词)
"6:10": 表示[6,10]位置上的内容
"<2>": 表示token类型——类型2 : ID
"1:6": 表示第1行,第6个位置开始

3、文法二

ArrayInit.g4

grammar ArrayInit;
init : '{' value (',' value)* '}' ;    //{ + value + 后面跟着多个 ",value" + }
value : init | INT ;
INT :[0-9]+ ; 
WS : [\t\r\n]+ -> skip ; 

规则表达式:小写的
标识符:大写的

4、词法解析二

解析词二: {99, 3, 451}

[@0,0:0='{',<1>,1:0] 
[@1,1:2='99',<4>,1:1]
[@2,3:3=',',<2>,1:3]
[@3,5:5='3',<4>,1:5] 
[@4,6:6=',',<2>,1:6] 
[@5,8:10='451',<4>,1:8] 
[@6,11:11='}',<3>,1:11]

总共有7个词,分别是:
"{" //第1个词,[0,0]位置上内容,第1种类型,第1行:第index=0开始
"99" //第2个词,[1,2]位置上内容,第4种类型,第1行:第index=1开始
","//第3个词,[3,3]位置上内容,第2种类型,第1行:第index=3开始
"3"
","
"451"
"}"

解析结果成语法树:(init { (value 99) , (value 3) , (value 451) })

待思考:

问题:第X种类型是怎么出来的呢?

你可能感兴趣的:(【系列1—文法和词法】)