李宁的极客世界

打破国外垄断，开发中国人自己的编程语言（1）：实现可以解析表达式的计算器

阅读本系列文章将是“ 最残酷的头脑风暴，大家做好准备了吗”

本文是《打破国外垄断，开发中国人自己的编程语言》系列文章的第1篇。本系列文章的主要目的是教大家学会如何从零开始设计一种编程语言（marvel语言），并使用marvel语言开发一些真实的项目，如移动App、Web应用等。marvel语言可以通过下面3种方式运行：

1. 解释执行

2. 编译成Java Bytecode，利用JVM执行

3. 编译成二进制文件，本地执行（基于LLVM）

本系列文章实现的marvel语言并不像很多《自己动手》系列一样，做一个玩具。marvel语言是一个工业级的编程语言，与kotlin、Java等语言是同一个级别，设计之初是为了试验编程语言的新特性。我们团队开发的超平台开发系统UnityMarvel内嵌的Ori语言的部分特性也是来源于Marvel。关于UnityMarvel的细节后面会专门写文章介绍。这里先讨论编译器的问题。

1. 如果系统软件受到制约，有没有可能突出重围呢？

我们知道，现在中美贸易战如火如荼，可能以后使用国外很多软件，尤其是系统软件，都会有一些问题。这就需要我们在一些关键领域有自己可以控制的技术和软件，例如，操作系统、编程语言、数据库、科学计算软件等。其实这些种类的软件中，大多都属于基础软件，只有操作系统和编程语言（以及相关的IDE）可以称为是系统软件。

这里先说说基础软件和系统软件的区别。基础软件是指很多软件都依赖的软件，例如，流行的程序库（如tensorflow、pytorch等）、数据库（如MySQL、Oracle等）。但大多数基础软件的一个共同特点是只服务于特定领域，例如，你不可能用MySQL开发一款游戏，也不可能用tensorflow开发移动App。而在基础软件中有一小类，它们是通用的，几乎适合于各个领域，我们将这类软件称为系统软件。它们是整个IT领域的基础架构。没有它们，整个IT领域将不复存在。例如，目前，只有操作系统和编译器符合这两个特征。大家可以想想，没有了关系型数据库，还有其他类型的数据库可以使用，没有了tensorflow，IT领域也不会停止运转。但没有了Windows、macOS、Linux、C语言、Java语言这些技术，世界将会怎样，将会重新退回到工业文明时代。所以系统软件是基础软件的一个子集，而且必不可少。如果将基础软件和其他软件比作星球，那么系统软件就是星核。

在系统软件中，编译器是最容易突破的。因为编译器（编程语言）的生态相比操作系统来说，更容易建立。这是因为目前有很多虚拟机可以选择，例如，最常用的是JVM，当然，还有微软的.net core等技术。如果我们的编程语言可以基于JVM，那么就意味着可以利用Java语言的所有生态，如果我们的编程语言可以用更容易的方式调用其他语言（如C++、Go等），在某种程度上，也就可以直接使用这些编程语言的生态。当然，还有更先进的超生态技术（UnityMarvel的Ori语言正是基于超生态技术的），总之，作为一种新的编程语言，利用其他的生态是最廉价的方式，当然，在语言发展的过程中，也可以逐渐建立自己的生态（相当于骑驴找马），这也是一种策略。所以如果想突破，编译器（编程语言）是最容易的一个。当然，如果拥有自己可以控制的编程语言，可以为后期的操作系统提供支援，例如，利用超生态技术，在建立新操作系统之前，就为该操作系统提前建立生态（这一点以后专门撰文阐述）。

2. 开发编程语言需要哪些知识

现在进入到最关键的部分了，开发一种编程语言到底需要哪些知识呢？其实需要的知识还是蛮多的。最基础的要求是必须至少会一种编程语言。如C、C++、Java、C#、Go、Python等。当然，推荐会3种以上的编程语言，因为我们是在设计编程语言，不是在设计普通的软件。在设计编程语言时，需要进行横向比较，也就是需要参考其他的编程语言，因为任何新技术都不可能100%完全凭空产生，这些新技术都会或多或少地留下其他同类技术的影子，编程语言也不例外。例如，UnityMarvel内嵌的Ori语言就是参考了数十种编程语言，以及加入了自己的新技术而最终形成的。

除了要了解大量的编程语言外，还有很多与业务有关的知识需要掌握。主要的知识结构（不仅仅这些，后面用到了再详细讲）如下：

（1）了解大量的编程语言（推荐3种以上）

（2）编译原理的基础知识

（3）算法能力

（4）编译器前端生成器

（5）学习能力

（6）想象力

尽管开发编程语言并不会像大学学的编译原理一样从0开始构造一个编译器，但编译原理的基础知识还是要掌握的，不了解编译原理的同学，赶紧上B站、西瓜视频、油管去补课，后期我也会结合marvel语言做相关的视频课程，大家可以关注哦！

算法就不必说了，编译器里面充斥着各种算法，编译器的算法密度几乎超过了绝大多数应用。任何形式的算法都可能涉及到，最基础的数据结构必须掌握，其他的算法，能学多少就学多少，多多益善。这个没有固定的教程，也是需要不断在实践中学习。

开发编译器的基本步骤如下图所示。

首先说明一点，并不是所有的编译器都严格按照这些步骤进行，有可能会将多个步骤合成一个步骤（例如，语法分析和语义分析合成一步，最后输出AST），也有可能将一步分成多个步骤，或者再增加一些与业务相关的步骤。

对于工业级编译器来说，并不会从0开始实现词法和语法分析器，并不是这东西有多难，而是如果完全手工编写代码，要添加或修改一个新语法，那简直就是一场噩梦，因为要修改非常多的地方，而且一旦出错，非常不好找原因（因为代码过于复杂）。由于词法分析和语法分析有规律可循，所以出现了很多通过文法生成词法分析器和语法分析器的工具，由于词法分析与语法分析是编译器前端的重要组成部分，所以这类工具通常称为“编译器前端生成器”。比较著名的包括lex、yacc、javacc、antlr等。其中lex是专门用来生成词法分析器的，yacc用来生成语法分析器的，javacc可以同时生成词法和语法分析器、antlr也同样可以生成词法分析器和语法分析器。不过lex和yacc只支持C语言，javacc只支持Java语言。而antlr支持多种编程语言，例如Java、C++、JavaScript、Go、C#、Swift等。本系列文章也使用了antlr的最新版本antlr4来实现编译器的前端（词法分析器和语法分析器）。

这几种工具都是依赖于文法生成词法分析器和语法分析器的，例如，在antlr4中，如果要识别加减乘除四则运算，只需要编写下面的文法即可。

expr: expr op=('*'|'/') expr | expr op=('+'|'-') expr

文法是不是很简单呢？但如果要编写完善的代码，可能需要上百行才能实现（我们团队实现的Ori语言，利用antlr4生成的词法和语法分析器，总共6万行Go语言代码，我们自己编写了大概4万行Go代码，整个编译器有超过10万行代码，3/5是自动生成的，2/5是自己编写的）。而且文法还标识了优先级，antlr4规定，写在前面的文法的优先级高于写在后面的文法的优先级。我们知道，对于四则运算来说，是先乘除，后加减，所以expr op=('*'|'/') expr 应该在expr op=('+'|'-') expr 前面，倒过来是不行了。如果要加更复杂的运算，例如，平方、开方、幂等，只需要修改这个文法即可，是不是很简单呢？

前面说的前4点是硬知识，也有很多教程可以学习，但最后两点：学习能力和想象力，就要完全靠自己的天赋了。因为前面4点能让你做出一个看着还不错的编译器，但最后两点能决定你做的编译器有多强大。

实现一个编程语言，所涉及到的知识要比实现编译器难度更大。因为如果实现编译器，并且是已经存在的编程语言，由于语法已经确定，所以只需要实现出来即可。但编程语言不同，一切需要重新设计，尤其是在涉及到新语法时，非常困难，需要了解的知识相当多，所以需要拥有快速学习能力，可以在短时间内学会并掌握任何知识和技术。另外，想象力更重要，因为设计一款新的编程语言，有些东西可能不仅仅局限于IT领域，也不仅仅局限于自己所从事的技术领域，例如。在Ori语言中，拥有一些创新的语法，需要同时适应类似JavaScript的单线程模式和Java的多线程模式。因此，拥有多维度的想象力才是最终取得胜利的关键。

3. 自己设计的编程语言会流行吗

我经常在网上看到很多同学在问，为什么中国没有自己流行的编程语言（尽管有易语言，但由于是中文编程，所以注定不会全球流行，国内也并不算流行）呢？BAT等大厂为何不开发一个呢？然后有人回答，开发编程语言容易，关键是生态，还有人回答，BAT是因为没有必要，因为编程语言没有和KPI挂钩，也有些人回答，开发一款编程语言，火起来很难。其实这些都可能是原因，但主要原因其实就是需求没有与行动挂钩，或者说，现在的编程语言已经足够满足需求了，没有必要再开发一款新的编程语言，而且这些大厂的盈利压力都很大，当然，还有技术积累的问题。

其实编程语言有很多种，有一种就是像Java、C#、C++一样的通用编程语言，这类语言什么都能做，是一种图灵完备的编程语言。还有另外一种编程语言，如SQL、VBA、ABAP（SAP的内嵌语言），这类属于领域编程语言，他们也可能是图灵完备的，也可能不是图灵完备的。通常使用这类编程语言完成某些特定的工作，如SQL操作数据库，VBA操作Office、ABAP操作SAP数据等。其实在国内有很多公司内部已经提供了类似的领域语言，只是非常专业，功能单一，绝大多数人不清楚而已。

至于自己开发出来的编程语言是否会流行，其实你们想太多了。编程语言是为了解决实际问题而存在的，不是为了流行而存在的。就像衣服，最初的用途是为了保暖，而不是时尚，当大多数人都使用自己生产的衣服保暖，那他就是流行款了！所以让编程语言解决实际问题才是优先要考虑，至于以后是否会流行，自己说了不算！

像我们团队开发的UM系统，其实原来压根就没打算自己开发编程语言，想直接使用JavaScript，不过后来发现，JavaScript太动态了，使用JavaScript根本没有办法做一款完美的IDE，而且功能有限，并且混乱。还有就是JS是动态语言，如果将其转换为静态语言，会以牺牲性能为代价，而且无法有效融合单线程和多线程的特性，并且还无法与UM IDE融为一体，所以没办法，才开发一款自己的编程语言Ori，并且融合了数十种编程语言的优秀特性，而且加入了更先进的特性（如内嵌SQL、虚拟组件、虚拟数据库、支持跨平台的语法、客户端服务端一体化、柔性热更新等），当然，这些特性需要与UM IDE配合才能使用。

4. 开发编程语言，从这里起航：配置Antlr4环境

如果一上来就开发编程语言，估计大家就开始晕了，所以我们先从最简单的开始，就是先来编写一个可以解析加减乘除表达式的编译器。我们使用了antlr4来生成词法分析器和语法分析器，所以先要配置一下antlr4的开发环境。

由于antlr4使用Java开发，所以不管用什么编程语言设计编译器，JDK必须安装，并且还需要一款强大的Java IDE，这里推荐Intellij IDEA。我们只使用Intellij IDEA的最基础功能，所以CE（社区版）版足够了，这个版本是免费的。

在安装完Intellij IDEA CE后，到下面的页面下载antlr4工具相关的库。

https://www.antlr.org/download.html

进入页面，找到下面的部分，点击第1个链接下载即可。

下载完antlr4的工具包后，找到其中的Java运行时库，并用Intellij IDEA CE创建一个Java工程，然后直接将Antlr4 Java运行时库复制到工程的lib目录中（没有lib目录可以建立一个），如下图所示。

然后在lib目录的右键菜单中点击“Mark Directory as”>“Sources Root”菜单项，将lib编程源代码目录，这样Intellij IDEA CE就会搜索lib目录中的所有库。当然，可以直接在模块中引用antlr4的库，不过将antlr4 运行时库与工程放到一起，这样如果将工程复制到其他机器上，就不会由于antlr4的运行库没有复制而导致无法运行了。

然后需要安装Intellij IDEA CE的Antlr插件。进入插件安装页面，如果没有安装antlr插件，选择Marketplace标签页，输入antlr搜索插件，通常第一个就是。点击右侧的install按钮即可安装。如果已经安装，Antlr插件会出现在Installed页面中，如下图所示。

安装完Antlr插件后，新创建一个文件，将文件扩展名设置为g4，就会看到文件前面的图标变成了红色，里面有一个A字母，这就是Antlr4的标识，如下图所示。

5. Antlr4的Hello World

现在我们开始进入激动人心的时刻了，用Antlr4亲手做我们的第一个编译器：解析四则运算表达式的计算器。不过在完成这个编译器之前，一定要了解一下Antlr4。

下面先给出一个可以识别以hello开头的词组的识别程序的文法。首先创建一个名为Hello.g4的文件，并输入下面的代码：

grammar Hello;
r  : 'hello' ID ;
ID : [a-z]+ ;
WS : [ \t\r\n]+ -> skip ;

大家先不需要管这些代码是什么意思，只需要照猫画虎输入即可。

然后在Hello.g4右键菜单点击“Configure ANTLR”菜单项，会弹出如下图的对话框，设置第一个文本输入框，指定生成目录，这里指定与Hello.g4相同的目录。Hello.g4生成的文件都会放在这个目录中。

然后点击Hello.g4右键菜单的“Generate ANTLR Recognizer”菜单项，会自动生成一堆文件，如下图所示。注意：Java文件都隐藏了扩展名。

Hello.java和MyHelloVisitor.java是后来创建的，其他文件都是自动生成的。其中HelloLexer.java是词法分析器、HelloParser.java是语法分析器，其他文件后面再说。

大家可以打开这两个文件，看到每一个文件的内容都有上百行，这要是人工编写，会累死人，而使用Antlr4，只需要4行文法就搞定。如果要添加或修改原来的语法，只需要修改Hello.g4文件，然后再重新生成一遍即可。

现在有一个问题，怎么用Hello.g4生成的一堆文件呢？或者换种问法，生成的这些文件有什么用呢？

Hello.g4生成的这些文件的主要目的就是进行词法分析和语法分析，那么如何用呢？使用有如下两种方式：

1. 用grun工具测试

2. 用Java代码调用词法分析器和语法分析器，编写完整的编译器

现在先来说说grun工具。其实并没有grun这个东西，grun是一个别名，真实的工具在是antlr-4.8-complete.jar中的 org.antlr.v4.gui.TestRig类，在macOS或Linux下，可以使用alias命令起一个别名，官方叫grun，所以这里就沿用了官方的叫法。如果在windows下，可以创建一个grun.cmd文件。

起别名的完整命令如下：

alias grun='java -classpath .:/System/Volumes/Data/sdk/compilers/antlr4-4.8/antlr-4.8-complete.jar org.antlr.v4.gui.TestRig'

现在就可以使用grun测试我们的程序了。

首先要说明一点，grun测试的是.class文件，不是.java文件，所以在测试之前，要在终端中切换到.class文件所在的目录。Intellij IDEA CE默认的.class目录是out/production目录，如下图所示。在一开始，前面生成的.java文件并没有编译，读者可以随便找个Java程序运行下，这时Intellij IDEA CE会编译所有还没有编译的.java文件，我们会发现，刚才生成的所有.java文件都生成了同名的.class文件。

读者可以直接在操作系统的终端进入.class所在的目录，或者通过Intellij IDEA CE下方的Terminal也可以输入命令行，如下图所示。

现在来做我们的第一个测试：

首先输入下面的命令（先不需要管命令是什么意思）：

grun Hello r -tokens

然后输入下面的内容：

hello world

如果读者在macOS或Linux下，按Ctrl+D，如果在Windows下，按Ctrl+Z输入结束符号，会输出如下图的内容：

现在来解释一下grun Hello r -tokens是什么意思。Hello表示Hello.g4中grammar后面的部分，也就是Hello。r是文法产生式等号左侧的符号（非终结符），也就是r : 'hello' ID ;中的r。 -tokens表示列出所有的tokens。

那么什么是token呢？其实token是词法分析器的输出，同时，token将作为语法分析器的输入，而AST（抽象语法树）则是语法分析器的输出。

token就是编程语言中不可再分的单元，相当于编程语言的原子。看下面的程序：

if(i == 10)
{ }

这是一个非常简单的条件语句，那么在这两行代码中，有多少个token呢？根据token不可分割的原则，包含如下的token：

if,(,i,==,10,),{,}

上面用逗号（,）分隔的符号都是token，例如，if是关键字，将作为一个整体对待，在解析代码时，肯定不会将if拆开，10是一个整数，也将作为一个整体对待，肯定不会将其拆成1和0。

那么Hello的输出结果意味着什么呢？我们输入了hello world，根据语法规则。任何字符串都需要以hello开头，所以hello将作为一个token（相当于前面条件语句的if关键字，这里hello是一个关键字）。而后面可以是任意字符串，但与hello之间至少要有一个空格。所以hello world符合Hello的语法规则，hello abc也同样符合，而helloabc就不符合了，因为hello和abc之间没有任何分隔符，根据最长匹配原则，Antlr4会选择最长的字符串进行匹配，所以匹配的是helloabc，而不是hello。

现在我们的实验也做完了，可能很多读者还是一头雾水，不过不要紧，我们再详细讲一下Antlr4到底是怎么分析的。

Antlr4采用了自顶向下递归的分析方式。自顶向下就是先将整个编程语言源文件看成一个整体，这就是入口点，也就是Hello.g4中的r。这个入口点起任何名字都可以，只要不和其他的文法标识重名即可。然后从这个入口点开始，就可以用递归的方式写文法了。文法用于从上到下推导，左侧是文法标识，右侧是文法的产生式。例如，要识别下面一组字符串：

hello world
hello abc
hello Bill
hello 李宁

很明显，这4行文本都是以hello开头，后面跟着任意的字符串，中间用空格分隔。所以我们的文法应该是以hello开头，后面跟一个标识，用ID表示。文法如下：

r : 'hello' ID;

在Antlr4中，每一个文法都要用分号（;）结尾，如果是固定的字符串，如关键字，用单引号括起来。如'hello'。

ID表示任意的标识符，也是终结符。所谓终结符，是指不能再继续往下推导的符号（相当于树的叶子节点）。在Antlr4中，终结符标识用由首字母大写的字符串表示，如ID。而非终结符（可以继续往下推导）用首字母小写的字符串表示，如r。

现在是自顶向下分析的第1步，第2步是处理ID。文法如下：

ID : [a-z]+ ;

ID的产生式不包含任何的非终结符，也就是再也无法继续推导了。[a-z]是一种简写，也就是a到z共26个小写字母中的任何一个，后面的加号（+）表示至少要有一个小写字母。

到现在为止，自顶向下分析的过程已经完成了，分为两步，第一步将整个字符串看做一个整体，并且将其分解为hello和后面的任意字符串。第二部来处理这个任意字符串。这里规定，这个任意字符串只能由小写字母组成。

不过现在还有一个问题，Antlr4怎么知道hello和world之间需要有空格或其他空白符分隔呢？其实这就涉及到Hello.g4的最后一行代码了：WS : [ \t\r\n]+ -> skip ; 这行代码设置了一个skip通道（通道会在后面的文章中详细讲解），用于忽略指定的字符，这些被忽略的字符，将作为token的分隔符，这里面指定了4个分隔符：空格、制表符（\t）、回车符（\r）、换行符（\n）。也就是说，下面的形式也是可以的：

hello
world

ok，现在Hello.g4的语法规则已经讲的差不多了，里面涉及到了一些概念，在后面的文章中会详细讲解。现在来总结一下：

Antlr4的文法文件是以g4作为扩展名，第一行代码必须以grammar开头，后面跟着语法名，如Hello，该名字必须与g4文件名一致。每一行代码都必须用分号（;）分隔。然后就是若干文法产生式了。例如，Ori语言的最顶端文法是这样的。

grammar Ori;
program : sourceElements? EOF
sourceElement   : statement
statement
:
    importStatement
    | sqlStatement
    | dollarMemberStatement        
    |  classDeclarationStatement
    |  interfaceDeclarationStatement
    | functionDeclarationStatement
    | variableStatement     
    | ifStatement                
    | iterationStatement         
    | continueStatement           
    | breakStatement       
    | returnStatement             
    | withStatement             
    | switchStatement           
    | throwStatement           
    | tryStatement                 
    | blockStatement  
    | expressionStatement
    | commentStatement
    ;

program是Ori语言的入口点，然后Ori语言将整个语言分成若干源代码元素（sourceElements?），后面的问号表示可选，也就是说，Ori语言的源代码文件可以是空文件。EOF是文件结束符。这里讲每一个源代码元素对应一条statement（语句），这里之所以不直接使用statement，而是使用sourceElement，是因为以后可能会进行扩展，这时只需要修改sourceElement即可（目前sourceElement等于statement），而一条语句包括多种，如ImportStatement、sqlStatement（内嵌SQL）、classDeclarationStatement（类声明）等。然后就继续往下分，如sqlStatement还会包含sqlInsert、sqlUpdate等。以此类推，直到不可再分为止。这就是自顶向下分析的基本方法，其实这就是分治法的一种表现，尽管编程语言看着很复杂，一个大型系统可能会有上百万甚至更多行代码，但如果将编程语言从顶向下分析，涉及到的语句种类也不过几十种而已。Ori语言的文法文件也就1000多行，包括词法文件部分，也就2000行出头。用2000行代码，就可以完全描述一种图灵完备的编程语言，真是perfect。而这2000行代码，生成的Go语言代码超过了60000行。

现在再回到grun工具上来。其实grun的功能很强大，除了可以作为测试工具外，还可以显示Antlr4生成的AST，看一下自顶向下分析的流程。

首先准备一个hello.txt文件，并输入hello world。然后在终端输入下面的命令（读者要将hello.txt文件的路径改成自己机器上的路径）：

grun Hello r -gui < /MyStudio/java/java_knowledge/antlr/test/hello.txt

然后就会弹出如下图的窗口，右侧显示了AST的树状结构。Antlr4制作编译器的过程就是先根据源代码生成AST，然后对AST进行遍历（根据语言的特性，会遍历1到n遍），遍历完后，就会生成中间代码、以及最终的二进制文件。所以AST起到了承前启后的作用。

6. 如何用程序进行词法和语法分析

尽管已经了解了Antlr4的基本使用方法，但到现在为止，还没有用Java编写过一行代码呢？现在我就来演示如何用Java调用上一节生成的词法分析器和语法分析器。

下面先给出实现代码：

首先创建一个MyHelloVisitor.java文件，并输入下面的代码：

import org.antlr.v4.runtime.tree.AbstractParseTreeVisitor;

public class MyHelloVisitor extends AbstractParseTreeVisitor implements HelloVisitor {

    @Override public String visitR(HelloParser.RContext ctx) {
        System.out.println(ctx.getText());
        System.out.println(ctx.ID().getText());
        return visitChildren(ctx);
    }
}

然后再创建一个Hello.java文件，并输入下面的代码：

import org.antlr.v4.runtime.CharStream;
import org.antlr.v4.runtime.CharStreams;
import org.antlr.v4.runtime.CommonTokenStream;
import org.antlr.v4.runtime.tree.ParseTree;

public class Hello {
    public static void main(String[] args) throws Exception  {
         // 读取源代码文件，这里选择直接从字符串读取
         CharStream input = CharStreams.fromString("hello world");
        // 创建词法分析器对象 
        HelloLexer lexer = new HelloLexer(input);
        // 获取词法分析器输出的tokens
        CommonTokenStream tokens = new CommonTokenStream(lexer);
        // 创建语法分析器对象，并将词法分析器输出的tokens作为语法分析器的输入
        HelloParser parser = new HelloParser(tokens);
        // 开始分析程序，这也是生成AST的过程
        ParseTree tree = parser.r();    // 文法的入口点r会转换为一个方法，调用该方法，就会自顶向下递归分析源代码
        // 创建Visitor对象
        MyHelloVisitor hello = new MyHelloVisitor();
        // 开始遍历AST
        hello.visit(tree);
    }
}

现在运行Hello.java，如果在Run窗口输出如下图的内容，说明运行成功了。

现在来解释一下前面的代码。这里先要知道Antlr4是如何遍历AST的。Antlr4有如下两种方式遍历AST：

（1）listener

（2）visitor

第一种方式更灵活，但不容易使用。visitor不灵活，但容易使用。本例使用了第2种方式来遍历AST，但本系列文章的大多数代码主要使用listener来遍历AST。listener方式会在后面的文章中详细介绍，这里主要介绍visitor。其实这两种遍历AST的方式的原理类似，都是遇到了一个节点，就会调用相应的回调方法，然后将必要的信息作为参数传入回调方法，用户可以在回调方法中完成代码生成、数据处理、中间代码优化等工作。那么这些回调方法放在哪里呢？这就要说到前面创建的MyHelloVisitor类。该类实现了HelloVisitor接口，该接口是根据Hello.g4文件自动生成的，代码如下：

import org.antlr.v4.runtime.tree.ParseTreeVisitor;
public interface HelloVisitor extends ParseTreeVisitor {    
    T visitR(HelloParser.RContext ctx);
}

我们可以看到，该接口中只有一个方法，就是visitR，该方法是遍历到r节点调用的回调方法。

如果文法文件很大时，会生成相当多的回调方法，例如，Ori语言的文法就生成了数百个回调方法，这些回调方法并不一定都用到，在这种情况下，并不需要实现所有的回调方法，所以Antlr4在生成回调接口文件的同时，还生成了一个默认实现类，如本例的HelloBaseVisitor，默认实现类已经默认实现了所有的回调方法，我们的Visitor类只需要从该类继承，就只需要实现必要的回调方法即可。

import org.antlr.v4.runtime.tree.AbstractParseTreeVisitor;

public class HelloBaseVisitor extends AbstractParseTreeVisitor implements HelloVisitor {
    
    @Override public T visitR(HelloParser.RContext ctx) { return visitChildren(ctx); }
}

本例的MyHelloVisitor类继承了HelloBaseVisitor类，并覆盖了visitR方法，输出了r节点的文本和ID的文本。

对于Hello类来说，就是最终的调用代码了。通常一个用Antlr4实现的编译器，需要经过如下几步：

（1）读取源代码文件（或直接从字符串获取源代码）

（2）创建词法分析器（输入是单个字符、输出是tokens）

（3）创建语法分析器（输入是tokens、输出是AST）

（4）开始遍历AST

这4步已经在Hello类中做了详细的注释，大家可以自行查看。

7. 弄一个可以解析表达式的计算器

前面已经给出了一个完整的Antlr4案例，不过这个案例太简单了，没什么实际的用途，本节会利用Antlr4实现一个有实际价值的计算器程序。该程序可以解析过个表达式，表达式包含加减乘除运算，每一个表达式占一行，用分号（;）结尾。

先给出文法：Calc.g4

grammar Calc;
// 下面是语法
prog:   stat+ ;

stat:   expr ';'                # printExpr
    |   ID '=' expr ';'         # assign
    |   NEWLINE                 # blank
    ;

expr:   expr op=('*'|'/') expr      # MulDiv
    |   expr op=('+'|'-') expr      # AddSub
    |   INT                         # int
    |   ID                          # id
    |   '(' expr ')'                # parens
    ;
// 下面是词法
MUL :   '*' ;
DIV :   '/' ;
ADD :   '+' ;
SUB :   '-' ;
ID  :   [a-zA-Z]+ ;      // 匹配标识符
INT :   [0-9]+ ;         // 匹配整数
WS  :   [ \t]+ -> skip ; // 忽略空白符
NEWLINE:'\r'? '\n' ;     // 空行

现在生成Calc.g4 的相关文件。先看一下生成的CalcVisitor.java文件，代码如下：

import org.antlr.v4.runtime.tree.ParseTreeVisitor;
public interface CalcVisitor extends ParseTreeVisitor {
    T visitProg(CalcParser.ProgContext ctx);    
    T visitPrintExpr(CalcParser.PrintExprContext ctx);
    T visitAssign(CalcParser.AssignContext ctx);
    T visitBlank(CalcParser.BlankContext ctx);
    T visitParens(CalcParser.ParensContext ctx);
    T visitMulDiv(CalcParser.MulDivContext ctx);
    T visitAddSub(CalcParser.AddSubContext ctx);
    T visitId(CalcParser.IdContext ctx);
    T visitInt(CalcParser.IntContext ctx);
}

CalcVisitor有9个回调方法，从文法上看，有多少个文法，就应该有多少个回调方法。在Calc.g4中，除了第一个文法（prog:stat+;)外，其他的文法都起了别名，如printExpr，assign等。所以这些文法对应的回调方法都是以别名作为后缀的，然后前面加上visit。其实这9个方法，分别经过了AST的9个非叶子节点后（如果有的话），被分别调用。

例如，现在测试这个表达式（将表达式放置expr.calc文件中）：1+3 * 4 - 12 /5;

grun Calc prog -gui < /MyStudio/java/java_knowledge/antlr/Calc/expr.calc

执行上面的命令，会显示如下图的AST。

要计算上述表达式，就需要遍历这棵AST。例如，当遍历到prog节点时，就会调用visitProg方法，通过该方法的参数可以获取prog节点的直接子节点的信息（就是左右两个stat节点）。当遇到减法表达式时，就会调用visitAddSub方法，以此类推。

现在看一下EvalVisitor类的实现。该类的实现原理是当直接计算两个值时，如3 * 5、4 - 1，就分别由visitMulDivhe visitAddSub方法计算，并通过返回值返回计算结果。如果遇到变量（Calc支持变量），需要首先将变量放到一个Map中，然后在获取该变量时，会从Map读取。Map相当于一个符号表。

import java.util.HashMap;
import java.util.Map;

public class EvalVisitor extends CalcBaseVisitor {
    /** "memory" for our calculator; variable/value pairs go here */
    Map memory = new HashMap();
    boolean error = false;

    /** ID '=' expr NEWLINE */
    // 初始化变量的操作（赋值操作）
    @Override
    public Integer visitAssign(CalcParser.AssignContext ctx) {
        String id = ctx.ID().getText();  // id is left-hand side of '='
        int value = visit(ctx.expr());   // compute value of expression on right
        memory.put(id, value);           // store it in our memory
        return value;
    }

    /** expr NEWLINE */
    // 输出表达式的计算结果
    @Override
    public Integer visitPrintExpr(CalcParser.PrintExprContext ctx) {
        Integer value = visit(ctx.expr()); // evaluate the expr child
        System.out.println(value);         // print the result
        return 0;                          // return dummy value
    }

    /** INT */
    // 将字符串形式的整数转换为整数类型
    @Override
    public Integer visitInt(CalcParser.IntContext ctx) {
        return Integer.valueOf(ctx.INT().getText());
    }

    /** ID */
    @Override
    public Integer visitId(CalcParser.IdContext ctx) {
        String id = ctx.ID().getText();
        // 从Map中获取变量的值 
        if ( memory.containsKey(id) ) {
            return memory.get(id);
        } else {
            // 引用了不存在的变量，输出错误信息 
            System.err.println(String.format("变量<%s> 不存在！",id));
            error = true;

        }
        return 0;
    }

    /** expr op=('*'|'/') expr */
    // 计算乘法和除法
    @Override
    public Integer visitMulDiv(CalcParser.MulDivContext ctx) {

        int left = visit(ctx.expr(0));  // get value of left subexpression
        int right = visit(ctx.expr(1)); // get value of right subexpression

        if ( ctx.op.getType() == CalcParser.MUL ) return left * right;
        return left / right; // must be DIV
    }

    // 计算加法和减法
    /** expr op=('+'|'-') expr */
    @Override
    public Integer visitAddSub(CalcParser.AddSubContext ctx) {
        int left = visit(ctx.expr(0));  // get value of left subexpression
        int right = visit(ctx.expr(1)); // get value of right subexpression
        if ( ctx.op.getType() == CalcParser.ADD ) return left + right;
        return left - right; // must be SUB
    }

    /** '(' expr ')' */
    // 处理括号表达式
    @Override
    public Integer visitParens(CalcParser.ParensContext ctx) {
        return visit(ctx.expr()); // return child expr's value
    }
}

最后看一下主程序（MarvelCalc）的源代码。

import org.antlr.v4.runtime.ANTLRInputStream;
import org.antlr.v4.runtime.CharStream;
import org.antlr.v4.runtime.CharStreams;
import org.antlr.v4.runtime.CommonTokenStream;
import org.antlr.v4.runtime.tree.ParseTree;
import java.io.FileInputStream;
import java.io.InputStream;

public class MarvelCalc {
    public static void main(String[] args) throws Exception  {
        // 从文件读取源代码 
        String inputFile = null;
        if ( args.length>0 ) {
            inputFile = args[0];
        } else {
            System.out.println("语法格式：MarvelCalc inputfile");
            return;
        }
        InputStream is = System.in;
        if ( inputFile!=null ) is = new FileInputStream(inputFile);


        CharStream input = CharStreams.fromStream(is);

        CalcLexer lexer = new CalcLexer(input);
        CommonTokenStream tokens = new CommonTokenStream(lexer);
        CalcParser parser = new CalcParser(tokens);
        ParseTree tree = parser.prog(); // 分析源代码

        EvalVisitor eval = new EvalVisitor();


        eval.visit(tree);
    }
}

在expr.calc文件中输入下面的内容：

1+3 * 4 - 12 /6;
x = 40;
y = 13;
x * y + 20 - 42/6;
z = 12;
x + 5 * z - y;

并使用下面的命令行执行计算器程序，或在IDE中将expr.calc作为参数允许MarvelCalc。

java MarvelCalc expr.calc

会得到下面的结果：

11
533
87

我们可以看到，在expr.calc文件中，有3个可以计算的表达式，其中最后两个表达式使用了变量，而输出结果就是这3个表达式的计算结果。从Calc.g4中也可以看出。语句一共有如下3种：

(1) 输出表达式（包括运算、id和常量）

(2)赋值表达式（创建变量）

(3)空行

从EvalVisitor类的实现可以看出，只有输出表达式才会输出结果，其他的表达式只是在内部计算，生成内部结果，如向Map中存储变量和值。

OK，到现在为止，我们已经创建了一个非常实用的计算器程序，不过这个程序仍然很简单，在后面的文章中，将会不断利用新学到的知识完成更复杂的编译器程序，直到可以实现Marvel语言为止。

下载本文完整源代码，请关注微信公众号「极客起源」，更多精彩内容期待您的光临！

打破国外垄断，开发中国人自己的编程语言（1）：实现可以解析表达式的计算器_第1张图片

你可能感兴趣的:(打破国外垄断，开发中国人自己的编程语言（1）：实现可以解析表达式的计算器)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它