《编译原理》学习心得

前言

    由于工作原因需要涉及到做一个代码翻译器 (ActionScript3转TypeScript),由此记录和分享一下工作中的一些心得。如果你恰巧也需要做一个Lua转JavaScript或者其它语言的转换,本文或许可以给你一些提示或帮助。

    翻译器涉及的核心技术是编译技术,这方面的书籍很多,有名的龙书、虎书、鲸书,我主要是参考了龙书《编译原理》这本。简单说说我读完前面几章(只包含编译器前端)的感受:概念比较多(重要的概念记住就行,没几个),算法不算很多(大概6个),算法部分不够详细(几行伪代码,有得算法实现起来几百行),一堆的理论。实用性很高,但是由于不够详细,实现的时候细节部分(比如可以推出空的非终结符如何处理)需要在理解算法原理的基础上再去写才能写正确。


干货

    要自己实现一个编译器有两种选择,第一种是自己实现所有的部分,包含编译器的生成工具、编译器的运行部分、语法规则表。第二种跟第一种的差别是编译器的生成工具是不需要自己写的,可以利用现有的项目,如gcc。我是选择了第一种,全部都自己搞,这样也可以理解的更深刻些。

   

    编译器的前端现在看来(被提炼之后)主要讲得就是几个概念和六个算法。

    概念: 词法分析器、语法分析器、正则表达式、NFA、DFA、词法单元、语法树

    算法:1)  正则表达式 转 NFA  (词法分析)

               2)  NFA 转 DFA (词法分析)

               3)  最小化DFA状态数 (词法分析)

               4)构造 LR0 语法 (语法分析)

               5)构造 LR1 语法  (这一步只需要看,可以不用实现)  (语法分析)

               6)构造 LALR1 语法  (语法分析)

    

    具体实施的话,大概需要如下步骤:

    1. 购入一本编译原理的书籍,首推《编译原理》第三版。(别的虎书,鲸书可以百度搜索下区别,我也没看过,没有发言权)

        以下以《编译原理》这本书为例,列出余下步骤。

    2. 跳过第一章,直接进入第二章(一个简单的语法制导翻译器),这一章不需要完全看懂,只要了解大概的过程和一些概念即可,至少要知道编译器的前端是由两个核心组成(词法分析器和语法分析器)即可。这一章也不需要手动练习什么。

    3. 进入第三章(词法分析),3.1 - 3.2节看看即可(了解有这么一回事),学习后面的部分,可以先在草稿上演算,然后再写成代码。

    4. 进入第四章(语法分析),4.1 - 4.6都只需要看一下,如果有时间可以在草稿上演算LL语法分析器,重点是4.7 - 4.9,这部分也需要在草稿上进行大量的演算,特别是写算法的时候,需要跟演算同时进行,有时候想不通就拿个实际的例子打打草稿,基本上都是边写算法边打草稿的节奏。

    5. 第五章可以不用怎么看,如果你知道语法分析的过程中怎么生成语法树和处理语法结构(其实就是写在YACC配置文件后面的补充代码),这一章可以不用看。

    6. 把源语言的语法结构理清楚,整理成一张图,比如AS3的语法结构图:(这个图并不完全)

    

     像这样把语法结构先理清楚后,词法分析中的正则表达式如何写,以及语法分析器的语法规则如何写已经一清二楚了。

     之后就是前端的其它部分了,没有统一的规则,大概就是把语法结构存起来之后逐步分析每一个表达式,分析出每一个表达式的类型,类型检查等等。最后就是打印了,生成想要的语言格式。


     最后附上我自制的《编译原理》PPT,没有弄完,弄了词法分析部分,语法分析没怎么弄。http://download.csdn.net/detail/jiexiaopei_2004/8927671

你可能感兴趣的:(编译原理)