Mr_White_

tiny语言编译器前端实现

一．摘要

最近在学习编译原理，所用的书籍以《编译原理及实践》，《flex与bison》这两本书为主，另外辅有《编译原理》（江湖人称编译“龙书”）和《编译器工程》（英文版为Engineering a Compiler Second Edition）等。其中，《编译原理及实践》这本书里头介绍了一种文法简单，适合编译原理初学者实现的语言，书中称之为TINY语言，本文主要讨论以《编译原理及实践》书中所讲各种方法，用附录里所给出的代码，简单拼凑，实现一个简单的递归下降TINY语言编译器前端（词法，语法部分）。

输入：由TINY语言编写的程序

输出：输入TINY代码的线性语法树

二．写在前面的一些话：

这只是作为初学编译原理初学者的我所做的一次尝试，试图用一些现成的原料来实现一个简单的编译器前端，并没有关于词法分析，语法分析等理论技术的具体实现（我也不会详细讲这些理论技术），这些具体实现C代码均是由我采自于Kenneth C. Louden所著的《编译原理及实践》这本书，另外TINY语言的定义也是出自于这本书。

刚刚开始学习时，老师曾经要求我们写过一个简单的词法分析器，我花了几个小时就写出来了，但那只是按照我自己的思路写出来的“残次品”，输出的结果根本不能作为语法分析器的输入（事实上连最基本的词素补充都没做到，那时还没有token的概念），原因是我当时连词法分析都没看完就开始写，完全忽略了编译器工程的线性与整体性，前端与后端，前面的输出作为后面的输入，更没有抽象语法树这类的概念，所以，这是一次过急的尝试，虽然失败了，但经验很重要，这使我能静下心来好好看一看理论。

在连续一个多月的理论学习后，我已经基本掌握了一些必要的词法、语法的前端分析技术（至少我自己这么认为，不知道老师怎么想），但就这些理论知识而言，我还是虚得很，为何而虚，就是因为缺少实践。让我用这些理论真刀真枪地从零开始做一个编译器出来？还是算了吧，我压根不知道从何处下手。但经过数天的思考，我选定了这样一种方式：逆向工程，就是我们军工界的路，二十年前沈飞引进SU-27，成飞学习SAAB-37，逆向工程了二十多年，于是我们有了歼-11，歼-10，到现在歼-16，歼-20都快出来了，青出于蓝而胜于蓝。这就是为什么我前面说，要用现有的代码拼凑出一个简单编译器前端（别管有多么简陋，再简单的编译器对我这个“小白”来说都很难，先解决从无到有），这就是逆向工程的第一步：进口SU-27后，把它拆了，拆了之后再拼起来，看看能不能飞，内部结构搞不懂没关系，照猫画虎先让它飞起来，飞起来第一步就成功了！其他的事，还是等飞起来后再说吧。

所以，本文的主要目的是：工程实践，对，就是以熟悉为目的初学者入门实践。真正从零开始的实践。

身为初学者的我希望本文也能对初学者们有所帮助，也希望能多多交流。

另外，如果是大神路过，欢迎指正我的错误与不足（如果能如您法眼的话）。

三．背景知识介绍

编译器的各个阶段可以根据其用途分成两个大阶段：词法分析、语法分析和语义分析重点在处理编程语言的符号系统上，统称为编译器的前端（front-end），而中间代码生成、规范化、指令选择、控制流分析、数据流分析、寄存器分配、指令流出、汇编、连结等着重处理代码计算逻辑的阶段统称为编译的后端（back-end）。

在本文中，由于我是初学者，所以只讨论前端的两个部分：词法分析和语法分析。

词法分析程序扫描输入文件，将文件中的各个语句的组成单词分离出来，称之为词素(lexeme)，并为各个词素添加相关信息。将所生成的token信息作为语法分析器的输入。语法分析主要是从词法分析程序中获得token输入，对程序进行基本的语法分析，生成抽象语法树，作为下面语义分析的输入。语义分析及后端部分这里暂时不做介绍（主要是还没学到…）。

词法分析器所用的主要知识有：正则表达式，状态机等，实现方式可以手工实现，也可以用自动分析工具Flex来实现。

语法分析器所用的主要知识有：递归下降，LL(1)，LR(0)，SLR(1)，LR(1)，等分析方法。但是，LL，LR类的分析方法在实现时会用到及其复杂的方法，手工实现很麻烦（我觉得很麻烦），因此多采用自动工具如Bison来自动生成。而类似递归下降的方法就更适合手工实现，逻辑上也能更方便自己理解。

本文所采取的实现策略是：用Flex工具生成词法分析代码，然后用递归下降方法来手工构建语法分析器。一般Flex和Bison是成对使用的，但在此，我只用了Flex来构建词法分析器。

四．环境介绍与搭建

操作系统：Windows10

编程环境：Visual Studio 2013

所用工具：Flex&Bison

所用源代码：《编译原理及实践》--KennethC. Louden 附录带所带源码里的：

”globals.h” ,“parse.h”,“scan.h”,”util.h”,”parse.c”,”util.c “以及Flex的输入文件”TINY.L”

◎注：这些代码的作用已经在书本上讲的很详细了：

第2章词法分析P56-65（介绍用Lex构建词法分析程序）

第3章上下文无关文法及分析P97-101（介绍TINY语言的文法，语法树结构和一个TINY语言的示例程序）

第4章自顶向下的分析P136-137（介绍递归下降法构造的TINY语法分析器）

其中，由于自动工具 Flex和Bison本来是UNIX上的工具，虽然有win的版本，但还是得经过一系列的配置才能用，进一步的，如果想在 Visual Studio 2013 上使用的话，又得对VS进行一番配置，具体步骤如下：

1. 从网上下载flex&bison的windows版本，文件名为win_flex_bison-latest.zip。

2. 环境变量的配置：在环境变量Path后加上前面下载的win_flex_bison-latest.zip解压后的路径，这样可以直接从命令行中调用win_flex和win_Bison，添加好后记得用-V命令检测是否配置正确（在命令行下敲入：win_flex –V 以及win_bison –V，注意V是大写，显示出版本号就表示配置正确了）。

3. 在命令行下，可以自己弄几个简单文件，自行生成体会一下，具体怎么弄就看自己喜好去折腾了，在这里我建议大家还是要自行折腾一下，因为我后面讲到的一些东西需要你在命令行下使用过win_flex命令，不然在后面的过程中可能会遇到很多问题，而这个命令使用起来有一些需要注意的地方，还有词法.l文件的编写也会有一些地方得注意，否则会出差错，还有flex词法分析程序如何进行I/O操作等等，这些都是预备知识，在书《flex与bison》上都有比较详细的讲解，只不过那是linux下的操作，但是转换成windows命令行下的操作基本是一样的，是不懂的建议百度或必应。

◎注：前面三步可以自行百度或者参考此链接：

http://www.tuicool.com/articles/2aaAjy?plg_nld=1&plg_uin=1&plg_auth=1&plg_nld=1&plg_usr=1&plg_vkey=1&plg_dev=1

4. VisualStudio 2013上使用Flex&Bison的配置，具体教程可以查看下载后解压好的win_flex_bison-latest文件夹内custom_build_rules目录下的how_to_use.txt文件，里头记录了一个链接，是个sourceforge的链接，讲得很清楚，你的Flex&Bison也可以直接在sourceforge上下载（事实上这是官网），不过这个教程是Visual Studio 2012的配置教程，移植到Visual Studio 2013基本上大同小异。配置好后可以通过下面的例子自行感受下。

◎注：如果你的是更低版本的VS的话，比如VisualStudio 2010，可以参考下面的链接：

http://www.di-mgt.com.au/flex_and_bison_in_msvc.html

5. 这是一个例子，（前面的配置过程我想已经够烦人的了，但这仅仅只是一个开头，万事开头难，如果到这一步你还没搞定，我建议你善用百度和必应）。如果搞定了，那么接下来就让我们用一个例子来感受下Flex&Bison与Visual Studio 结合后产生的力量！这个例子也介绍了另一种配置的方法，不过两种方法我个人感觉基本上是一样的，都是自定义的生成方法（Custom Build Tool），不过我个人推荐第4步的方法。下面给出这个例子链接，我照着上面做了一遍，虽说有些代码基本看不懂，但最后能跑起来还是感觉很开心的。需要特别注意的是，一定得从头到尾仔细得看完！！！你会有很大的收获，否则的话你会被坑得很惨！切记！

例子链接为：http://www.codeproject.com/Articles/652229/VS-C-project-w-Flex-Bison

五．代码实现

前面我已经介绍过一些基本知识和环境的配置，相信如果做完前面的那个例子，我们会对Flex&Bison这个强有力的工具更加熟悉，这也是我们的一个基础。那么现在开始我们终于要进入正题了！TINY语言的简单编译器构造：

现在开始介绍怎么利用《编译原理及实践》附录B里头的源码来构建这个简单的TINY语言编译器。在书里的各个章节里头，对这些源码会有一些很好的介绍，前面我已经说过了，而且代码本身会有很好地注释，命名规范也很容易看懂，这里就不着重介绍了，我只介绍我的改动部分以及一些可能的错误分析。

在此之前我再次重申下：

本文所采取的实现策略是：用Flex生成词法分析代码，然后用递归下降方法来手工构建语法分析器。并不是用Flex与Bison结合起来实现词法语法分析！

下面介绍具体实现步骤（低版本的VS同样适用，只要能配置好）：

1. 在Visual Studio 2013上建立一个空的C++项目，在此我命名为Flex_test_TINY，然后添加以下文件（默认我们手上有第四部分所介绍的那些源代码）添加完成后如下图所示，你可以手动添加现有文件，也可以添加新建项，然后把代码直接copy过来

◎注意，其中“tiny.h”和“tiny.c”这两个文件在书的附录源码中是没有的，所以我们现在只是给其添加了两个空的文件，这两个文件里头任何东西都不用写，因为稍后我们将会用利用Flex和词法定义文件”TINY.L”来生成这两个文件的内容。

不过前提是，你得将这个项目按照我之前介绍的方法配置好，或者你可以不配置，只要你不嫌麻烦，每一次修改”TINY.L“的内容都得重新生成一次，然后把生成的的文件复制进来。

细心的人可能已经发现了，如果你不仅把我上面所说的那个例子做了，还另外折腾过Flex的使用的话，我会发现win_flex --wincompat 命令默认只能生成一个叫做”lex.yy.c”的文件文件，而此处我说建立两个文件，“tiny.h”和“tiny.c”，一个是词法分析器yylex()的实现的.c文件，另一个是.c文件中所包含的一些定义的.h头文件，这个头文件的作用是什么？是如何来的？还有如何改生成的文件名？请自行思考。

2. 好了，其实只要你按我前面说过的，自行折腾过Windows下Flex的使用，以及把那个例子认认真真地做了一遍并且成功运行了，那么这些问题你一定是知道的。

现在公布原因：如下图所示

这是文件”TINY.L”的属性页，这里我们设置好了两个输出的文件：一个词法分析主程序”Filename.c”文件和包含了相关定义的”Filename.h”头文件，至于这个头文件有什么用，其实在这个工程中并没有什么用，甚至你在配置的时候可以只让Flexs输出一个.c文件，但既然如此，那么我为什么还要提这一茬呢？原因我将会在后面讲到。

3. 如果你成功完成了上面的步骤，那么恭喜你，现在你一定以为大功告成可以运行了，当然我也是这么想的，于是我猜你应该是迫不及待地地按下了F5，然后天真地想象着它编译成功的样子（不要问我是怎么知道的，因为起初我也是这么做的）。但你要真这么做那就太天真了，我也就说说而已，可别真信了。

现在这样子是绝对不能运行的，原因其实很简单：没有main()函数！如果你直接编译，那么肯定会报一大堆错误，不信可以试试看。所以，接下来我们就添加main()函数使它能够运行。那么现在问题又来了，如何添加main函数来使它运行？你可以稍微思考下，然后自己动手写一下，试一试，而不是直接看我的方法，因为我也是初学者，这也是我自己的经验，经验仅仅只是证明我这种方法是可行的，并不能说明这种方法是最优的，所以获得最优解的唯一途径，往往就是无数人的无数次尝试，这些尝试所积累出来的经验，就是目前的最优解！

4. 按理说本文写到这里就应该打住了，因为前面的东西都算作是个客观框架，到现在，后面的东西才是我自己的改动，因此这不能算是教程，只能算作方法之一，而且还可能是很烂的方法，下面我要介绍的东西会有很多bug（事实上很多内部原理我也不求甚解，只知道个大概），所以特此声明：仅供参考！

5. 讲了那么多废话，现在请把目光回到本文开头部分，看看我一开始是如何定义此次程序设计的功能目标的：

输入：由TINY语言编写的程序

输出：输入TINY代码的线性语法树

那我就按照我设定的目标来改，现在的问题是，如何添加main()函数使其能够运行，还有就是，如何输出一个抽象语法树，其实仔细思考的话，这两个问题其实就是一个问题，因为在代码中，我们伟大的作者Kenneth C. Louden 已经帮我们把第二个问题解决了，在” util.c”中，已经写好了一个函数叫做printTree，所以，我们只需要在语法分析完成后调用这个函数，便可把抽象语法树打印出来。但问题又来了，到底怎么打印，输出到哪里，或者更基础的，如何读取数据流？想回答这些问题，又得看看代码了，在文件 ”global.h”中，作者已经声明好了一切我们需要的东西：

extern FILE* source; /* source code text file */
extern FILE* listing; /* listing output text file */
extern FILE* code; /* code text file for TM simulator */
extern int lineno; /* source line number for listing */

在这里我们只需要关注两个文件指针 source和listing，这两个就是我们的输入和输出，通过文件指针source来读取TINY语言所编写的程序，通过listing来输出错误信息（如果编译出错的话，代码里头有基本的错误分析）和语法树（如果编译成功的话）。所以现在，我们可以在”parse.c”这个文件中添加一个main函数，并且添加如下几行代码：

int main()
{
	char* inputname = "test.txt";
	char* outputname = "output.txt";
	source = fopen(inputname, "r");
	listing = fopen(outputname, "w");
	if (!source){
		perror(source);
		return 1;
	}
	if (!listing)
	{
		perror(listing);
		return 2;
	}
	parse();
	getchar();     //输出停顿用
	return 0;
}

并且为了打印语法树，我们应该把parse函数稍微改一下，在分析完成将要退出之前加上printTree，这样就可以打印出完整的抽象语法树了。

6. 好了现在mian函数也有了，这下应该可以运行了吧？如果你认认真真按照我的步骤来，走到这一步，按下F5，你依旧发现不能运行，那么别灰心，因为原则性的大错误已经没有了，虽然错误很多，但接下来只是来处理小错误了：

在众多的错误输出中应该会有这么一条：

IntelliSense: PCH 警告: 标头停止点不能位于宏或#if 块中。未生成 Intellisen

处理这个错误的方法就是在”global.h”的开头加上一句：#pragmaonce

此外还会有：

等等一系列令人眼花缭乱的错误，一看这些错误就很烦人，因为不是编译错误，而是链接错误，编译错误还好处理，但链接错误我们连定位都不能定。所以这个时候又得发挥百度和必应的强大作用了，通过一番努力后，我终于找出了这些错误的原因：这些出错的变量（lineno,listing,source等），并没有被真正定义就被其他函数使用了，extern仅仅只是声明了有这些变量，并没有定义，更别说初始化了，所以我们还得再加几行全局变量的定义语句，在mian函数的外部，并把这些变量能初始化的就初始化（这些错误归根到底就是我当初C语言没学好）。

7. 做完这些后，再按下F5，这时我才能真正恭喜你运行成功了（当然你得在根目录下建两个文件，一个作为TINY语言输入，一个作为输出）到此为止，整个过程基本上结束了。如果你还没运行成功的话，请继续努力调试，直到成功为止。

8. 貌似我还有一个坑没填，就是我之前说的那个”Filename.h”有什么用，这个坑我也不打算填了，其实整个过程折腾下来你就差不多能知道，提示一下，可以看看这个奇葩的头文件”Filename.h”里头包含了些什么东西，查一查那些东西是干嘛的，可以参照书本《flex与bison》第二章P29-34，以及第五章Flex参考规范。

六．总结

其实上述过程，就算按我的步骤一步步来，你还是有可能运行不成功，除了各种不可控因素外，原因我也说过了：我们都是初学者，哪那么容易就搞定呢？如果这些问题都解决了，我们早就进阶成大神了，所以我才在第四部分反复建议去亲自多折腾，这样才能更好地解决你遇到的问题。这种折腾出来的思考问题，解决问题的能力，也是我们逆向工程的基础之一。

自此为止，逆向工程的第一步就算完成了，这个东西说实话非常简单，稍微有点编程经验的人一下就搞定了，但对于我们这种及其缺乏实践经验的人来说，确实是一件不那么容易的事情，所以，后续我将会更加深入地学习探索。

七．参考资料

第三部分-背景知识介绍部分引用自：

http://www.cnblogs.com/Ninputer/archive/2011/06/07/2074632.html

两本书：《编译原理及实践》--KennethC. Louden，《flex与bison》--John Levine

第四部分的引用已经在前面标出。

本书代码全权CopyRight @KennethC. Louden 本人作为教育用途只做部分改动。

八. 后记

这是本人第一次发表博客，目前作为学生，才疏学浅，见识浅薄，有诸多幼稚错误的观点望请大神指正，吾将更加深入学习。

Python词法分析器：从概念到实践凡狗蛋
本文还有配套的精品资源，点击获取简介：Python词法分析器是编程语言处理的关键环节，负责将源代码解析为有意义的标记或符号序列。本简介详细介绍了词法分析、正则表达式、分词、词法规则、词法分析器生成器以及编译原理等核心概念，并展示了如何使用Python内置的re模块和第三方库ply实现词法分析器，为进一步理解编程语言的工作原理和构建自定义编程语言打下基础。1.词法分析器的作用与目的词法分析器是编译器
南昌大学《编译原理》期末考试试卷（含答案）创创大帝(水印很浅-下载的文档) 编译器
南昌大学《编译原理》期末考试试卷1．简答题（15分）（1）简述编译程序的概念及构成。编译程序是现代计算机系统的基本组成部分.从功能上看，一个编译程序就是一个语言翻译程序，它把一种语言(称作源语言)书写的程序翻译成另一种语言(称作目标语言)的等价的程序.（2）什么是文法？一个文法G是一个四元组(VT,VN,S,P)，其中：VT是一个非空有穷终结符号集合；VN是一个非空有穷的非终结符号集合，且VT∩V
编译原理简答题
编译过程一般可以分为哪些阶段？各自的作用是什么？涉及到四元式，三地址码的阶段有哪些？一般可以划分为五个工作阶段：(1)词法分析，对构成源程序的字符串进行扫描和分解，识别出一个个的单词(2)语法分析，根据语言的语法规则，把单词符号串分解成各类语法单位(3)语义分析与中间代码生成，即对各类语法单位，分析其含义并进行初步翻译(4)代码优化，以期产生更高效的代码(5)目标代码生成，把中间代码变换成特定机器
编译原理复习题钻仰弥坚编译原理编译原理复习题期末
选择一套期末试卷作为编译原理的复习题，答案写的比较简单，仅供参考。一、选择题（20分）1、构造编译程序应掌握_______。A、源程序B、目标语言C、编译方法D、以上三项都是2、用高级语言编写的程序经编译后产生的程序叫_________。A、源程序B、目标程序C、连接程序D、解释程序3、文法G产生的_______的全体是该文法描述的语言。A、句型B、终结符集C、非终结符集D、句子4、文法分为四种类
编译原理期末考试概念简答复习有为肥宅复习资料学习
第一章1、编译器（编译程序）的组成部分及其任务：词法分析器（扫描器）：输入源程序，进行词法分析，输出单词符号；语法分析器（分析器）：对单词符号串进行语法分析（根据语法规则进行推导或归约），识别出各类语法单位，最终判断输入串是否构成语法上正确的“程序”；语义分析与中间代码产生器：按照语义规则对语法分析器归约（或推导）出的语法单位进行语义分析并将其翻译成一定形式的中间代码；优化器：对中间代码进行优化处
计算机编译原理ppt,编译原理课件.ppt 知知与终生计算机编译原理ppt
文档介绍：高级语言汇编语言SOURCEPROGRAMAssemblePROGRAM?翻译程序?TRANSLATER为什么要学****编译原理程序设计语言是计算机软件专业的重要核心学****编程的历程:C语言--汇编语言--数据结构Monday,July03,2017编译原理为什么要学****编译原理必修主干课程,操作系统和编译系统构成程序设计者与计算机之间的基本界面。通过学****该课程,掌握编译
编译原理7~9 CHARLIIE 编译原理
7。编译原理--03语法制导翻译和中间代码生成复习(清华大学出版社第3版)-X_Jun-博客园继承属性：从上往下in综合属性：从下往上val语法分析树和相应的带标注语法分析树这条产生式`S'→id:=E'`以及相应的语义动作`{S'.nextlist:="";emit(id.place':='E'.place)}`是用于描述赋值语句的翻译过程。这里，`id`表示一个标识符（即变量名），而`E'`是
燕山大学编译原理期末考试能运行就算成功经验分享
软件工程专业的首先，这一门课无法在三四天内速成（指零基础的）要是有考前才开始学到同学至少要提前一周开始学习（我觉得这都比较紧张，两周才算宽裕），b站上的速成课不全！不全！不全！不要想着完全看速成课，你要非这样我也没办法。考试范围如下：编译程序构成、编译程序与解释程序区别，词法分析、语法分折、语义分折及其任务，文法，语言，句型，句子，短语，推导，归约，句柄，文法、语言二义性，文法分类，有穷自动机、正
TensorFlow：深度学习基础设施的架构哲学与工程实践革新双囍菜菜 AI 深度学习 tensorflow 架构
TensorFlow：深度学习基础设施的架构哲学与工程实践革新文章目录TensorFlow：深度学习基础设施的架构哲学与工程实践革新一、计算范式革命：从静态图到动态执行的深度架构剖析1.1静态计算图的编译优化体系1.2动态图模式的实现原理1.3混合执行模式的编译原理二、张量计算引擎的深度架构解析2.1运行时核心组件2.2计算图优化技术2.3分布式训练架构三、可微分编程范式的实现奥秘3.1自动微分系
CUDA，NVCC和LLVM Yulong Huang #编译原理编辑器
名片：作者简介：乐于分享知识的大二在校生本系列专栏:(点击直达)编译原理致读者：欢迎评论与私信,对于博客内容的疑问都会尽量回复哒!!!本文序：⛰️本文介绍：本文是整个编译原理专栏的相关知识的补充（注：因编者时间有限，所以有一些图片来源于网络，为了尊重原作者，所以选择保留水印)⚓本文食用方法：本文介绍了CUDA，NVCC和LLVM。如果您对于该专栏有兴趣，可以查看主页，了解更多UWU❤️‍如果本文对
Linux内核编译饶了我吧，放了我吧操作系统实验 linux 服务器算法 ubuntu
一、实验题目·下载、编译内核源代码·启动测试所编译出来的内核·使用Clang编译内核·成功配置LinuxKernel静态分析工具二、相关原理与知识内核源代码下载和编译需要理解操作系统的文件结构和编译原理，以及如何使用编译工具链进行源代码的编译和链接。启动测试所编译的内核需要了解操作系统的启动过程、内存管理和进程调度原理。使用Clang编译内核需要深入理解Clang编译器的工作原理和与操作系统的兼容
深入理解编译器设计：PL0编译程序源代码分析与实现 Salton Z
本文还有配套的精品资源，点击获取简介：PL0是一种教学用的简单编程语言，由BrianW.Kernighan和P.J.Plauger设计，旨在教授编译器设计基础。该编译程序源代码提供了实现PL0语言编译器的详细代码，涵盖了编译过程的各个阶段，包括词法分析、语法分析、语义分析和代码生成。它对于学习和实践编译原理及编译器开发具有极大的价值。通过分析和理解PL0编译程序源代码，学生可以掌握构建编译器的关键
编译原理之词法分析（Pl/0语言文法）痛快最重要 c++语言编译原理词法分析
文法：Pl/0语言文法的BNF表示：〈程序〉→〈分程序〉.〈分程序〉→[][][]〈语句〉→CONST{,};→=→{}→VAR{,};→{|}→;{}→procedure;→|||||||→:=→begin{;}end→|odd→[+|-]{}→{}→||()→+|-→*|/→=|#||>=→ifthen→call→whiledo→read({,})→write({
IT专业高考假期预习指南 ak2111 程序人生高考程序人生
目录1.概述1.1.基础知识铺垫1.2.编程技能学习1.3.实际动手操作1.4.小结2.基础课程预习指南2.1.计算机组成原理2.2.C语言程序设计2.3.C++程序设计2.4.数据库原理2.5.计算机网络原理2.6.软件工程2.7.数据结构与算法2.8.编译原理3.技术学习路线图3.1.前端开发3.2.后端开发3.3.全栈开发3.4.数据科学3.5.人工智能1.概述对于有兴趣进入IT领域的新生，
jvm原理进击~ web开发
一.javac编译原理Javac编译器任务就是将Java语言规范转化成Java虚拟机语言规范，完成“翻译”工作(即将源码翻译成字节码)1.词法分析的结果就是从源代码中找出一些规范化的Token流(关键字之类的)2.语法分析的结果就是形成一个符合Java语言规范的抽象语法树(即将token流按照java语言规范组成语法树)3.语义分析的结果就是将复杂的语法转化成最简单的语法，解语法糖、添加默认构造函
golang编译原理初识 abcnull #Golang 编译原理 golang 编译原理编译器
文章目录关于编译器词法分析语法分析类型检查生成SSA中间代码生成机器代码总结关于编译器编译器本质就是一个翻译器，作用是将一个高级语言翻译成计算机可以识别的机器语言，如今的编译器都是分层架构，分层可以增加各层之间的独立性。golang编译器分为前端和后端编译器种类：本地编译器：可以编译生成所在计算机系统相同平台可执行的目标代码交叉编译器：可生成在其他平台上可执行的目标代码golang编译器主要编译阶
DataBinding深度解析：从编译原理到抖音级性能优化 Android洋芋性能优化 DataBinding 内存优化性能调优编译原理
一、APT编译机制：DataBinding代码生成黑科技1.1编译时代码生成全流程1.1.1布局文件解析XML扫描：编译器扫描所有使用标签的布局文件，例如：数据变量提取：解析标签中的变量定义（如user），并生成对应的字段ID（如BR.user）。表达式收集：提取所有@{...}表达式，包括属性绑定（如user.name）和方法调用（如@{ViewModel.getAgeLabel(user.ag
SZU 编译原理 DBWG 个人学习博客编译原理
总结自深圳大学《编译原理》课程所学相关知识。文章目录文法语法分析自顶向下的语法分析递归下降分析LL(1)预测分析法FIRST集合FOLLOW集合文法乔姆斯基形式语言理论：表达能力：0型文法>1型文法>2型文法>3型文法。0型文法（短语结构文法）定义：产生式规则为α→β，其中α是至少包含一个非终结符的符号串，β是任意符号串（终结符和非终结符的混合）。特点：限制最少，表达能力最强，能描述所有递归可枚举
数据结构与算法书籍推荐 wukunlsy 发展方向性数据结构算法 C C++C#
如果计算机系只开三门课，那么这三门课就一定是：离散数学，数据结构与算法，编译原理。如果只开一门课，那剩下的就一定是：数据结构与算法。NiklausWirth说：算法＋数据结构＝程序，不说废话了，下面列出一份数据结构算法书目，先从最著名的说起A原书名：TheArtofComputerProgramming中文名：计算机程序设计艺术作者：DonaldE.Knuth难度：*****个人评价：******
数据结构与算法方面的经典书籍专注_日拱一卒 00数据结构与算法数据结构与算法经典书籍推荐
如果计算机系只开三门课，那么这三门课就一定是：离散数学，数据结构与算法，编译原理。如果只开一门课，那剩下的就一定是：数据结构与算法。下面列出一份数据结构算法书目，先从最著名的说起A原书名：TheArtofComputerProgramming中文名：计算机程序设计艺术作者：DonaldE.Knuth难度：*****个人评价：*******推荐程度：****本书是算法分析的经典名作（用经典不太恰当，
C++设计模式-解释器模式：从基本介绍，内部原理、应用场景、使用方法，常见问题和解决方案进行深度解析牵牛老人 C++专栏 c++设计模式解释器模式
C++设计模式总结-汇总了全部23种设计模式的详细说明第23种：解释器模式一、解释器模式的基本介绍1.1模式定义与核心思想解释器模式（InterpreterPattern）是一种行为型设计模式，其核心思想是为特定领域语言（DSL）定义语法规则，并构建一个解释器来解析和执行该语言的句子。它是通过将复杂的语言结构分解为简单的表达式，并通过组合这些表达式来处理更复杂的逻辑。这种模式的灵感来源于编译原理中
JVM——即时编译器的中间表达形式黄雪超 JVM jvm 开发语言 java
中间表达形式（IR）：编译器的核心抽象层1.IR的本质与作用在编译原理的体系中，中间表达形式（IntermediateRepresentation,IR）是连接编译器前端与后端的桥梁。前端负责将源代码转换为IR，而后端则针对IR进行优化并生成目标代码。对于Java虚拟机的即时编译器（JIT）而言，其输入并非Java源代码，而是已经过静态编译的字节码。尽管字节码已剥离了高级语法糖并采用栈式计算模型，
yacc c语言语法分析,编译原理实践--语法分析程序的自动生成工具YACC.PPT 子清视界 yacc c语言语法分析
编译原理实践--语法分析程序的自动生成工具YACC.PPT例2:#union{SYMBOL*sym;ENODE*node;}YYSTYPE引用时候的方式%tokenid%typeexpr以%token开始的行定义的是终结符的类型以%type开始的行定义是非终结符的类型3.终结符定义在yacc源程序语法规则部分出现的所有终结符(正文字符“+”，“-”等除外)等必须用%token定义，定义形式：单一数
游戏开发的TypeScript(1)TypeScript 的作用域|TypeScript编译原理 wgc2k #typescript typescript javascript
笔者注：typescript在轻量级游戏开发中相当重要，cocoscreator,laya,egret的主要开发语言都是typescript。unity也可用typescript开发（用工具转lua），所以写这个专题复盘和游戏开发相关的ts基础知识，更多的是给自己记录便于查找。TypeScript的作用域在TypeScript里，作用域对变量、函数、类等标识符的可见性与生命周期起着关键的决定作用。
计算机经典算法汇总 shuimanting520 计算机视觉计算机算法
[-]《代码大全》史蒂夫·迈克康奈尔《程序员修炼之道》《计算机程序的构造和解释》《C程序设计语言》《算法导论》《重构：改善既有代码的设计》《设计模式》《人月神话》《计算机程序设计艺术》《编译原理》（龙书）《深入浅出设计模式》《哥德尔、艾舍尔、巴赫书：集异璧之大成》《代码整洁之道》《EffectiveC++》和《MoreEffectiveC++》《编程珠玑》《修改代码的艺术》byMichaelFea
编译原理实验二词法分析程序设计 Ruik@SZTU 编译原理 c语言开发语言 c++数据结构
1.实验内容●TINY语言的词法由TINYSyntax.ppt描述；●TINY语言的词法分析器由TINYScanner.rar的C语言代码实现；●TINY+语言的词法由TINY+Syntax.doc描述。任务：理解TINY语言的词法及词法分析器的实现，并基于该词法分析器，实现拓展语言TINY+的词法分析器。要求：（1）TINY+词法分析器以TINY+源代码为输入，输出为识别出的token序列；（2
编译原理实验之 Tiny C语言编译程序实验语法分析 JNU freshman 编译原理编译原理
文章目录具体的实现结果图首先回顾项目架构-MAIN.C主程序-GLOBALS.H全局类型及变量（如Token类属及语法树结点的组成）-UTIL.H、UTIL.C各步骤的实用函数。如输出Token，生成语法树结点等-SCAN.C、SCAN.H词法分析程序及其头文件-PARSE.C、PARSE.H语法分析程序及其头文件-ANALYZE.C、ANALYZE.H语义检查程序及其头文件-SYMTAB.C、S
【编译原理】LALR(1)语法分析方法（c++实现）倒过来是圈圈编译原理算法
前文回顾【编译原理】LR(0)分析方法（c++实现）【编译原理】SLR(1)分析方法（c++实现）【编译原理】LR(1)分析方法（c++实现）这几个程序的代码大部分是一样的，根据不同算法特点做了部分修改而已代码LALR(1)的代码就是在LR(1)的基础上合并了同心项Item类在LR(1)基础上搜索符由string改成了vector#include#include#include#include#i
一分钟教你用Scala写Helloworld 嗯.～ scala
首先我们要知道学习目标掌握Scala的编写、编译原理与运行一、编写：在C盘或D盘中新建文件Scala用于存储编写出的代码，在Scala文件中新建文本把后缀名改为.scala创建完成后用记事本或其他可以书写的方式打开Scala的程序入口有两种，通过任何一种方式都可以定义一个可执行的程序1、定义一个object对象，然后在object对象中实现一个main方法objectHelloWorld｛defm
大学里只教你C语言，不教你python，真不是为了害你飞哥知行录 python 中年人经验分享
最近我发现一个特别有意思的现象。现在Python那可是火得一塌糊涂，稳居编程语言热度榜首。但你再看看各大学校，居然还有80%在吭哧吭哧教学生C语言，这是为啥呢？难不成真像网上说的，是为了帮衬编程培训机构的生意？今天咱就好好唠唠这事儿。很多搞计算机的人，总觉得数据结构、C语言、汇编、编译原理这些东西特别重要，最好是全都学一遍。但有人就不乐意了，觉得这压根没必要。你想啊，当学生辛辛苦苦读完大学准备找工
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

tiny语言编译器前端实现

你可能感兴趣的:(编译原理)