迷路剑客

Antlr4学习1-基本概念和入门示例

Antlr4学习1-基本概念和入门示例

0x00 系列文章目录

Antlr4学习1-基本概念和入门示例
Antlr4学习2-Java开发

0x01 摘要

ANTLR (ANother Tool for Language Recognition) 是一个强大的解析器的生成器，可以用来读取、处理、执行或翻译结构化文本或二进制文件。他被广泛用来构建语言，工具和框架。ANTLR可以从语法上来生成一个可以构建和遍历解析树的解析器。

Hive和Spark中使用antlr来生成词法和语法的解析器。
Antlr官网

0x02 安装ANTLR

ANTLR由两部分组成：

一个将用户自定义语法翻译成Java中的解析器/词法分析器的工具
一个用于生成解析器/词法分析器的runtime
所以，就算你是使用ANTLR的idea插件或者是ANTLRWorks来运行ANTLR工具，生成的代码依然需要运行时库。

2.1 插件安装

首先我们需要下载安装一个ANTLR开发工具的插件。
访问下载界面
所有用户都应该下载ANTLR工具本身，然后选择一个语言运行时目标，除非您使用的是工具jar中内置的Java。
这里我选择的是java，所以我是直接在IntelliJ IDEA里面安装的ANTLR v4 grammar plugin。

IntelliJ Idea Plugin for ANTLR v4

2.2 运行环境安装

我是mac系统，所以这里用的以下命令安装：

2.2.1 下载

cd /System/Library/Frameworks
curl -O http://www.antlr.org/download/antlr-4.7.1-complete.jar

2.2.2 设置CLASSPATH和ALIAS

将以下语句加入.bash_profile:

export CLASSPATH=".:/System/Library/Frameworks/antlr-4.7.1-complete.jar:$CLASSPATH"
alias antlr4='java -jar /System/Library/Frameworks/antlr-4.7.1-complete.jar'
alias grun='java org.antlr.v4.runtime.misc.TestRig'

2.2.3 安装成果检验

现在我们试试ANTLR安装成果，先来试试org.antlr.v4.Tool：

chengcdeMacBook-Pro:apps chengc$ java org.antlr.v4.Tool
ANTLR Parser Generator  Version 4.7.1
 -o ___              specify output directory where all output is generated
 -lib ___            specify location of grammars, tokens files
 -atn                generate rule augmented transition network diagrams
 -encoding ___       specify grammar file encoding; e.g., euc-jp
 -message-format ___ specify output style for messages in antlr, gnu, vs2005
 -long-messages      show exception details when available for errors and warnings
 -listener           generate parse tree listener (default)
 -no-listener        don't generate parse tree listener -visitor generate parse tree visitor -no-visitor don't generate parse tree visitor (default)
 -package ___        specify a package/namespace for the generated code
 -depend             generate file dependencies
 -D<option>=value    set/override a grammar-level option
 -Werror             treat warnings as errors
 -XdbgST             launch StringTemplate visualizer on generated code
 -XdbgSTWait         wait for STViz to close before continuing
 -Xforce-atn         use the ATN simulator for all predictions
 -Xlog               dump lots of logging info to antlr-timestamp.log
 -Xexact-output-dir  all output goes into -o dir regardless of paths/package

也可以用java -jar /System/Library/Frameworks/antlr-4.7.1-complete.jar

0x03 示例

3.1 创建语法定义文件

创建一个语法定义文件：Hello.g4，内容如下：

// Define a grammar called Hello
grammar Hello;
r  : 'hello' ID ;         // 匹配关键字'hello'后面跟随一个ID
ID : [a-z]+ ;             // 匹配小写字符组成的ID
WS : [ \t\r\n]+ -> skip ; // 匹配时跳过空格、tabs、换行符

3.2 ANTLR处理语法文件

然后使用ANTLR工具进行处理：
antlr4 Hello.g4
生成了若干java文件如下：

-rw-r--r--   1 chengc  admin   238  9 17 00:31 Hello.g4
-rw-r--r--   1 chengc  admin   308  9 17 00:34 Hello.interp
-rw-r--r--   1 chengc  admin    27  9 17 00:34 Hello.tokens
-rw-r--r--   1 chengc  admin  1304  9 17 00:34 HelloBaseListener.java
-rw-r--r--   1 chengc  admin  1055  9 17 00:34 HelloLexer.interp
-rw-r--r--   1 chengc  admin  3287  9 17 00:34 HelloLexer.java
-rw-r--r--   1 chengc  admin    27  9 17 00:34 HelloLexer.tokens
-rw-r--r--   1 chengc  admin   536  9 17 00:34 HelloListener.java
-rw-r--r--   1 chengc  admin  3578  9 17 00:34 HelloParser.java

3.3 编译生成的java类

再用javac进行编译javac Hello*.java。

3.4 测试

最后，我们进行测试：

3.4.1 解析树打印

首先是-tree参数会以LISP表示法打印解析树：

chengcdeMacBook-Pro:antlr4 chengc$ grun Hello r -tree
Warning: TestRig moved to org.antlr.v4.gui.TestRig; calling automatically
hello world
(r hello world)

注意，在输入关键字后要按control+D，下面的方式也需要同样输入。

3.4.2 解析树图形化展示

再试试-gui方式：

chengcdeMacBook-Pro:antlr4 chengc$ grun Hello r -gui
Warning: TestRig moved to org.antlr.v4.gui.TestRig; calling automatically
hello world
^D

会弹出一个界面展示了规则r匹配到了关键字hello且跟随一个标识符world：

3.4.3 token流展示

chengcdeMacBook-Pro:antlr4 chengc$ grun Hello r -tokens
Warning: TestRig moved to org.antlr.v4.gui.TestRig; calling automatically
hello world
[@0,0:4='hello',<'hello'>,1:0]
[@1,6:10='world',<ID>,1:6]
[@2,12:11='',<EOF>,2:0]

0x04 Grammar-语法

4.1 语法

一个语法定义文件一般来说有一个通用的结构如下：

/** 可根据需要撰写 javadoc 风格的注释，可以是单行、多行*/
grammar Name;
//注意以下options imports tokens actions指定顺序可以任意调换

options {name1=value1; ... nameN=valueN;} 
import ... ;
 	
tokens { Token1, ..., TokenN }
channels {...} // 只能是词法分析时才能定义
@actionName {...}
 	 
rule1 // 语法和词法分析规则定义，也有可能是混合在一起的规则定义
...
ruleN

4.1.1 grammar

定义语法名称。需要注意的是文件名X.g4必须与grammar X相同。

4.1.2 options

用来在grammar级别指定Antlr通过grammar文件生成代码的规则，如语言选项，输出选项，回溯选项，记忆选项等：

options { output=AST;  language=Java; }

options { tokenVocab=MySqlLexer; }

4.1.3 import

可以用import将一个语法分割成多个逻辑上的、可复用的块。在antlr中，import语法很像面向对象编程语言中的超类的概念。一个grammar会继承用 import导入的grammar 的所有规则、tokens specifications以及actions。但是main grammar（也就是我们自己定义的grammar）内可以重写规则来覆盖继承的规则以实现继承。

下面是一个MyElang中import了Elang的示意图：

可以看到，MyElang中虽通过继承得到若干规则，但也重写了expr规则并增加了INT规则。

被import的grammar也可以import其他grammar，ANTLR采用深度优先的方式向上搜索。如多个grammar定义了同一个规则，ANTLR会选择第一个找到的规则。

下面是一个示例：

可以看到，规则r的确是基于搜读优先的原则选择了grammar G3中的值B。

还有一个例子，一个main grammar中定义了一个规则IF : 'if';，同时一个imported grammar定义了一个规则：ID : [a-z]+;。显然这个规则也会匹配到小写字符串if。那么这个imported的ID是不会将IF规则隐藏掉。

请记住import的原则：Lexer的只能import Lexer；Parser只能importParser;Combined grammar可以import 没有modes的 Parser或Lexer。

如果在main grammar或者importd 其他grammar中有modes，那么import过程中会引入他们然后合并而不是覆写。

如果指定了tokens，main grammar会将他们全部合并；

如果存在channel，那么main grammar会合并他们；

如果存在已命名的actions如@members会被合并。总的来说说，应该避免命名的actions或是存在于规则中的actions，以免重用性受限；

ANTLR会忽略所有在imported grammars中的options。

4.1.4 tokens

tokens块的目的是为那些没有关联词法规则的grammar来定义tokens的类型。许多时候，tokens被用来定义actions，下面是一个例子：

// explicitly define keyword token types to avoid implicit definition warnings
tokens { BEGIN, END, IF, THEN, WHILE }
 
@lexer::members { // keywords map used in lexer to assign token types
Map<String,Integer> keywords = new HashMap<String,Integer>() {{
	put("begin", KeywordsParser.BEGIN);
	put("end", KeywordsParser.END);
	...
}};
}

4.1.5 channels

只有词法分析器的grammar中才能包含自定义的channels，下面是一个例子：

channels {
  WHITESPACE_CHANNEL,
  COMMENTS_CHANNEL
}

上面定义的channels可以在词法分析规则中像枚举一样使用：

WS : [ \r\t\n]+ -> channel(WHITESPACE_CHANNEL) ;

4.1.6 @actionName

用来定义一些动作。目前只有两个为java 目标定义的已命名actions，可以在外部grammar规则中使用，分别是@header和@members。

@header：会在recognizer class定义之前将代码注入生成的recognizer class`文件中。
@members：将代码作为值域和方法注入到recognizer class定义中。

下面是个小例子：

grammar SelectExample1;

@header {
package demos.antlr;
}

@members {
private String name = "chengc";
}

select : 'select' WHAT 'from' WHAT;
WHAT : [a-z]+ ;
WHERE : [a-z]+ ;
WS : [ \t\r\n]+ -> skip ; // 匹配时跳过空格、tabs、换行符

然后执行antlr4 SelectExample1.g4，观察生成的java类，可以看到在类开头加入了一行：

package demos.antlr;

还有在类定义中加入了以下内容：

private String name = "chengc";

4.1.7 rule

这里的rule指的就是各种parser和lexer规则。

rule的书写规范是以 : 开头，以 ; 结尾。多行规则以"|"竖线符号分隔。

lexer
lexer定义时名字以大写字母开头。lexer用作词法分析。
parser
parser定义时名字以小写字母开头。parser用作句法分析，是字符串和lexer的组合，用来匹配分析一个句子。

下面是一个例子:

grammar Hello;
r  : 'hello' ID ;         // parser. 匹配关键字'hello'后面跟随一个ID
ID : [a-z]+ ;             // lexer. 匹配小写字符组成的ID
WS : [ \t\r\n]+ -> skip ; //lexer. 匹配时跳过空格、tabs、换行符

type		// parser
    : type ARRAY
    | ARRAY '<' type '>'
    | MAP '<' type ',' type '>'
    | ROW '(' identifier type (',' identifier type)* ')'
    | baseType ('(' typeParameter (',' typeParameter)* ')')?
    ;

0xFE 总结

本文主要介绍了antlr4的一些基本概念和安装运行方法，下一章继续讲java编程相关内容，请点击：Antlr4学习2-Java开发

0xFF 参考文献

Antlr官网
Antlr4-github
Antlr4-官方指南
IntelliJ Idea Plugin for ANTLR v4
语法例子
Antlr4 入门

你可能感兴趣的:(antlr)

网络编程经验总结 TCP拆包粘包常见解决方案 ShootHzj
从简单通信协议开始最近工作中又需要处理协议解析，我对协议解析和网络抓包其实还是小有研究，17年刚毕业的时候，就用Netty手写过SMPP协议的对接。（其实做协议解析是一个很枯燥的工作，如果协议解析可以像antlr那样子写grammar自动解析应该会很酷？）本文总结一下协议在tcp下编码拆包粘包的三种解决方案。网上有一些人对拆包粘包的说法不是很认可，但是我觉得这个术语还是挺形象的。首先，让我们来设计
ANTLR4规则解析生成器(一)：入门 luofengmacheng 安全 antlr4 rule
文章目录1什么是ANTLR42为什么需要ANTLR43环境搭建4官方示例4.1编写语法规则文件4.2生成语法解析器4.3基于SDK实现逻辑5总结1什么是ANTLR4ANTLR是ANotherToolforLanguageRecognition的缩写，它是一个强大的用于读取、处理、执行和翻译结构化文本或二进制文件的语法分析器生成器，广泛用于构建语言、工具和框架，通过语法描述规则，它能够生成一个可以遍
常见的词法分析和语法分析的开源库收集迈达量化开源软件 github 算法词法分析语法分析
文章目录一、词法及语法分析器汇总1.Flex2.Bison3.ANTLR3.Ply4.JFlex一、词法及语法分析器汇总1.FlexFlex是一个用于生成词法分析器的工具。它可以根据用户定义的正则表达式规则，将输入的字符流分割成一个个的词法单元。Flex是GNU项目的一部分，可以在多个平台上使用。特点：灵活性：Flex允许用户通过正则表达式来定义词法规则，从而灵活地处理不同类型的输入。高效性：Fl
Antlr v4入门教程和实践 yixianshijie antlr
一.ANTRL是什么当我们实现一种语言时，我们需要构建读取句子（sentence）的应用，并对输入中的元素做出反应。如果应用计算或执行句子，我们就叫它解释器（interpreter），包括计算器、配置文件读取器、Python解释器都属于解释器。如果我们将句子转换成另一种语言，我们就叫它翻译器（translator），像Java到C#的翻译器和编译器都属于翻译器。不管是解释器还是翻译器，应用首先都要
Antlr4介绍和Helloworld 离离原上草77 java antlr4 antlr4
摘要：本文将首先介绍Antlr4，以及如何通过Antlr4grammer生成对应的hello的AST1.Antlr4简单介绍Antlr4（AnotherToolforLanguageRecognition）是一款基于Java开发的开源的语法分析器生成工具，能够根据语法规则文件生成对应的语法分析器，广泛应用于DSL构建，语言词法语法解析等领域。现在在非常多的流行的框架中都用使用，例如，在构建特定语言
【Antlr】Antlr 错误处理入门九师兄语法分析-Antlr 数学建模 java python
1.概述出自：antlr权威指南并且补充同绝大多数软件一样，在我们开发一门语法的过程中，需要修复很多的错误。直到我们编写完(并调试完）语法之后，生成的语法分析器才能识别所有的有效输入语句。在这个过程中，ANTLR的错误消息含有丰富的信息，有助于我们调试语法中产生的问题。．一旦拥有了正确的语法，我们就必须处理不合语法的语句，这些语句可能来源手用户输入，甚至是其他程序在错误情况下自动生成的。在上述情况
【Antlr】Antlr属性和动作-使用带动作的语法编写一个计算器九师兄语法分析-Antlr java linux python
1.概述上一篇文章：【Antlr】修改Antlr的错误处理策略出自：antlr权威指南并且补充在之前的学习中，我们的程序逻辑代码都是与语法分析树遍历器分离的，这意味着我们的代码总是在语法分析完成之后执行。在接下来的几章中我们可以看到，一些语言类应用程序需要在语法分析的过程中执行自身的逻辑代码。为了达到这个目的，我们需要一种手段，将代码片段–称为动作-直接注入ANTLR生成的代码中。本章的的第一个目
【Antlr】Antlr must label all alternatives or none 九师兄语法分析-Antlr antlr
1.概述今天写G4文件的时候，发现报错这个error122mustlabelallalternativesornone错误信息如下：这个报错翻译为:必须标记所有的选择还是没有意思是要么都加动作，要么都不加动作，不能一部分加，一部分不加。改成如下就好了stat:exprNEWLINE{System.out.println($e.v);}
【Antlr】Antlr属性和动作-访问词法符号和规则的属性九师兄语法分析-Antlr 数学建模
1.概述上一篇文章：【Antlr】Antlr属性和动作-使用带动作的语法编写一个计算器出自：antlr权威指南并且补充让我们以6.1节中的CSV语法为基础，学习一些与动作相关的特性。我们会编写一个程序，解析并打印CSV文件中的数据，它会为每行生成一个从列名到字段值的Map。我们的目的是学习更多有关规则动作和属性的知识。先看看6.1节中的CSV语法文件如下grammarCSV_back;file:h
【Antlr】Antlr 自动错误恢复机制九师兄临时专栏-无用 antlr
1.概述上一篇文章：【Antlr】Antlr修改和转发Antlr的错误消息出自：antlr权威指南并且补充错误恢复指的是允许语法分析器在发现语法错误后还能继续的机制。原则上，最好的错误恢复来自人类在手工编写的递归下降的语法分析器中进行的干预。尽管如此，按照我的经验，手工编写一个优秀的错误恢复机制非常难，因为这个过程过于枯燥乏味，极易出错。在本书描述的ANTLR最新版中，我穷尽我毕生所学，基于多年的
ANTLR4(九) 修改错误信息 pourtheworld ANTLR4 ANTLR4
写在之前先来回顾一下ANTLR4是如何处理并分析输入流的。语法文件一个简单的类分析语法文件。grammarSimple;prog:classDef+;//matchoneormoreclassdefinitionsclassDef:'class'ID'{'member+'}'//aclasshasoneormoremembers{System.out.println("class"+$ID.tex
【Antlr】Antlr 修改和转发Antlr的错误消息九师兄语法分析-Antlr java jvm servlet
1.概述上一篇文章：【Antlr】Antlr错误处理入门出自：antlr权威指南并且补充默认情况下，ANTLR将所有的错误消息送至标准错误(standarderror)，不过我们可以通过实现接口ANTLRErrorListener改变这些消息的目标输出和内容。该接口有一个同时应用于词法分析器和语法分析器的syntaxError()方法。syntaxError()方法接收各式各样的信息，无论是错误的
ANTLR4权威指南 - 第6章尝试一些实际中的语法 weixin_30460489 json r语言 c/c++
第6章尝试一些实际中的语法在前一章，我们学习了通用词法结构和语法结构，并学习了如何用ANTLR的语法来表述这些结构。现在，是时候把我们学到的这些用来构建一些现实世界中的语法了。我们的主要目标是，怎样通过筛选引用手册，样例输入文件和现有的非ANTLR语法来构建一个完整语法。这一章，我们要实现五种语言，难度依次递增。现在，你不需要将它们全部都实现了，挑一个你最喜欢的实现，当你在实践过程中遇到问题了再回
【达梦数据库】如何使用ANTLR4 jar方式分析dm sql 气可鼓不可泄数据库 jar sql
环境准备dm8g4语法文件jdk11win11实战演示指定antlr4.bat脚本@ECHOOFF"C:\ProgramFiles\Java\jdk-11\bin\java.exe"-jar"antlr-4.11.1-complete.jar"%*指定grun.bat@ECHOOFF"C:\ProgramFiles\Java\jdk-11\bin\java.exe"-cp"./;C:\Progra
浅谈表达式解析 lixia0417mul2 数据结构数据结构
背景不论是写sql表达式还是使用各种计算公式，我们都需要对表达式进行解析，本文简单记录一下表达式是如何使用深度优先遍历的方式解析成一个分析树的使用深度遍历解析表达式很难想象，使用深度遍历可以完整解析出带各种优先级关系的表达式解析，这真实我学到的第一个使用深度遍历解决实际问题的例子，废话少说，例子如下所以包括Antlr解析器等都会首先把表达式通过深度遍历的方式解析成一个完整的分析树，才会再交给后续的
MySQL Shell 8.0.32 for GreatSQL编译二进制包老叶茶馆_ mysql 数据库
构建MySQLShell8.0.32forGreatSQL0.写在前面之前已经写过一篇前传MySQLShell8.0.32forGreatSQL编译安装，最近再次编译MySQLShell二进制包时，发现了一些新问题，因此重新整理更新本文档。1.几处新问题这次编译MySQLShell发现几个新问题，下面一一列举。MySQLShell要求配套的antlr4版本必须是4.10.0，配套的protobuf
第三章：上下文无关文法进阶猫步旅人 antlr4 cookbook c++开发语言
高级属性文法的说明和使用lexer和parse的options用法antlr4允许在生成的语法分析器中，通过一些namedactions的操作，以自定义的方式插入一些代码片段。这些action操作是与特定平台相关的，比如c++和java的就不一样。通用的几个操作如下@parser::header@parser::members@lexer::header@lexer::members@parser
【严重】Atlassian Confluence 模板注入代码执行漏洞墨菲安全 atlassian 安全网络安全网络 web安全
漏洞描述Confluence是由Atlassian公司开发的企业协作和文档管理工具。AtlassianConfluenceDataCenter/Server受影响版本中存在模版注入漏洞，攻击者通过构造恶意请求，可以在未登录的情况下在Confluence实例上触发远程代码执行漏洞。漏洞已在8.5.4版本中修复，可能与velocity引擎中对snakeyaml、antlr等组件的支持有关漏洞名称Atl
java.lang.NoSuchMethodError问题的解决自扯自旦 java
当看到异常信息里有NoSuchMethodError时，这种错误一般是因为jar包冲突引起的。如下面的异常信息。java.lang.NoSuchMethodError:org.hibernate.hql.antlr.HqlBaseParser.getTokenTypeToASTClassMap()Ljava/util/Hashtable;org.hibernate.hql.antlr.HqlBas
买家订单api controller 谢谢水果
买家类目service接口main--controller--BuyerProductController.javapackagecom.tkft.sell.controller;importantlr.StringUtils;importcom.tkft.sell.VO.ResultVO;importcom.tkft.sell.converter.OrderForm2OrderDTOConver
SpringBoot整合StringTemplate模板引擎十二同学啊 Java spring boot java 数据库
官方网站https://www.stringtemplate.org/概述：记一次使用stringtemplate模板构建数据查询sql1.先加入ST4依赖org.antlrST44.0.82.在resources目录下新建一个数据查询模板文件sqlTemplate.stgquerySql(limitFiled,groups,aggregators,filters,orders,table,not
ANTLR4 wyg_031113 后端
配置开发环境下载antlr4jar包https://github.com/antlr/antlr4/blob/master/doc/getting-started.md#安装jdk11和antlr4.13#wgethttps://github.com/antlr/antlr4/archive/refs/tags/4.13.1.tar.gz#wgethttps://repo.huaweicloud.
Antlr4 - 自定义SparkSQL解析大猪大猪
Antlr4是一个强大的解析器的生成器，可以用来读取、处理、执行或翻译结构化文本，ANTLR可以从语法上来生成一个可以构建和遍历解析树的解析器，最出名的Spark计算引擎2.x就是用它来解析SQL的，是一个牛到没朋友的家伙。IDEA测试IDEA语法分析插件下载antlr-v4-grammar-plugin插件安装antlr-v4-grammar分析插件g4语法文件使用的是sparkSQL的SqlB
【Spark精讲】SparkSQL的RBO与CBO 话数Science 大数据 Spark Spark精讲 spark 大数据
SparkSQL核心:CatalystSparkSQL的核心是Catalyst查询编译器，它将用户程序中的SQL/Dataset/DataFrame经过一系列操作，最终转化为Spark系统中执行的RDD。Catalyst组成部分Parser：用Antlr将SQL/Dataset/DataFrame转化成一棵未经解析的树，生成UnresolvedLogicalPlanAnalyzer：Analyze
Antlr4 语法存在错误但语法分析器不报错的问题杀毒的炼金术士 ANTLR antlr
最近使用Antlr4时，遇到了编写的语法存在错误，但生成语法树并不显示错误，只是将报错位置及之后的全部token丢弃的情况。在此对案例进行分享，并分享一下我的解决方案。一问题复现下边我用一个简化后的案例复现这个现象文法文件如下(ASSIGN.g4)：grammarASSIGN;pfile:assignStmt+//文件由一行或多行赋值语句组成;assignStmt:ID'='IDoperatorI
Antlr4 区分“减号”运算符和负号杀毒的炼金术士 ANTLR python antlr
最近用Antlr4开发解释器，在识别带减号“-”的表达式遭遇语法错误，例如a=2-1原因是将“2-1”识别为了2和-1两个token，而我的预期是2、-、1三个token当然，我也知道之所以这样识别，是因为我定义数字字面量的规则时，支持负号LiteralInt:'-'?[0-9]+;当然，我也可以通过如下语法规避此问题，即负号和1之间加个空格，但这样毕竟不易用a=2-1我在token规则层面上想了
通过SQL操作Excel(基于Python + Antlr实现) 杀毒的炼金术士 Python ANTLR sql python 数据库 antlr pandas
ANTLR工具本身是用JAVA语言编写的，想要在Python环境中使用，需要进行简单的环境准备，参考：Python中使用Antlr4的环境准备实现功能创建数据库：通过createdatabase语句创建一个excel文件创建表：通过createtable语句新增一个sheet删除表：通过droptable语句删除指定的sheet插入数据：通过insertintotable语句向sheet中插入数据
代码解析工具汇总 I still … 静态代码检测编程语言
代码解析工具一.针对多种语言ANTLRSonarQubetree-sitter二.针对C语言pycparserJoern三.针对JavaJavalangJavaParserEclipseAstParser四.针对pythonast库tokenize库代码解析工具的主要作用是输入源代码，可以输出其AST或者CFG（控制流图），DFG（数据流图）。一.针对多种语言ANTLRAntlr4是一款开源的语法
探究Presto SQL引擎(1)-巧用Antlr vivo互联网技术
一、背景自2014年大数据首次写入政府工作报告，大数据已经发展7年。大数据的类型也从交易数据延伸到交互数据与传感数据。数据规模也到达了PB级别。大数据的规模大到对数据的获取、存储、管理、分析超出了传统数据库软件工具能力范围。在这个背景下，各种大数据相关工具相继出现，用于应对各种业务场景需求。从Hadoop生态的Hive,Spark,Presto,Kylin,Druid到非Hadoop生态的Clic
最近怎么流量涨这么多？那我开始讲Hive特性了！ Joy T 大数据 hive hadoop 数据仓库
Hive架构原理a.用户接口：ClientCLI（Hiveshell）、JDBC/ODBC(java访问hive)、HiveWEBUI（浏览器访问hive）和Thrift服务器b.驱动器：Driver解析器（SQLParser）：将SQL字符串转换成抽象语法树AST，这一步一般都用第三方工具库完成，比如antlr；对AST进行语法分析，比如表是否存在、字段是否存在、SQL语义是否有误。编译器（Ph
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他