松子茶

语法分析:自下而上分析

概述

介绍自下而上语法分析方法。所谓自下而上分析法就是从输入串开始，逐步进行“归约”，直至归约到文法的开始符号；或者说，从语法树的末端开始，步步向上“归约”，直到根结。

自下而上分析基本问题

归约

我们所讨论的自下而上分析法是一种“移进－归约”法。这种方法的大意是，用一个寄存符号的先进后出栈，把输入符号一个一个地移进到栈里，当栈顶形成某个产生式的一个候选式时，即把栈顶的这一部分替换成（归约为）该产生式的左部符号。

首先考虑下面的例子：
假定文法G为

   (1) S→aAcBe
   (2) A→b
   (3) A→Ab
   (4) B→d     <1>

我们希望把输入串abbcde归约到S。每实现一步归约都是把栈顶的一串符号用某个产生式的左部符号来代替。后面我们权且把栈顶上的这样一串符号称为“可归约串” ，存在种种不同的方法刻画“可归约串”。对这个概念的不同定义形成了不同的自下而上分析法。在算符优先分析中，用“最左素短语”来刻画“可归约串”，在“规范归约”分析中，则用“句柄”来刻画“可归约串”。

自下而上分析的中心问题是，怎样判断栈顶的符号串的可归约性，以及，如何归约。这是算符优先分析和LR分析将讨论的问题。各种不同的自下而上分析法的一个共同特点是，边输入单词符号（移进符号栈），边归约。也就是在从左到右移进输入串的过程中，一旦发现栈顶呈现可归约串就立即进行归约。这个过程对于编译实现来说是一个十分自然的过程。

规范归约简介

令G是一个文法，S是文法的开始符号，假定abd是文法G的一个句型，如果有

s⇒∗aAd 且

A⇒+b

则称b是句型abd相对于非终结符A的短语。特别是，如果有

AÞb
则称b是句型abd相对于规则A→b的直接短语，一个句型的最左直接短语称为该句型的句柄。

作为“短语”的两个条件均是不可缺少的。仅仅有Ab，未必意味着b就是句型abd的一个短语。因为，还需有SaAd这一条件。

稍为精确的一点说，假定a是文法G的一个句子，我们称序列

an,an−1,an−2,.....,a1,a0

是a的一个规范归约，如果此序列满足：

an=a
a0 为文法的开始符，即 a0=S
对任何i， 0<ifn , ai−1 是从 ai 经把句柄替换为相应产生式的左部符号而得到的。

容易看到，规范归约是关于a的一个最右推导的逆过程。因此，规范归约也称最左归约。

在形式语言中，最右推导常被称为规范推导。由规范推导所得的句型称为规范句型。如果文法G是无二义的，那么，规范推导（最右推导）的逆过程必是规范归约（最左归约）。

请注意句柄的“最左”特征，这一点对于移进－归约来说是重要的。因为，句柄的“最左”性和符号栈的栈顶两者是相关的。对于规范句型来说，句柄的后面不会出现非终结符号（即，句柄的后面只能出现终结符）。基于这一点，我们可用句柄来刻画移进－归约过程的“可归约串”。因此，规范归约的实质是，在移进过程中，当发现栈顶呈现句柄时就用相应产生式的左部符号进行替换。

符号栈的使用与语法树的表示

栈是语法分析的一种基本数据结构。在解释“移进－归约”的自下而上分析过程时我们就已经提到了符号栈。一个“移进－归约”分析器使用了这样的一个符号栈和一个输入缓冲区。今后我们将用一个不属于文法符号的特殊符号‘＃’作为栈底符，即在分析开始时预先把它推进栈；同时，也用这个符号作为输入串的“结束符”，即无条件地将它置在输入串之后，以示输入串的结束。

分析开始时，栈和输入串的初始情形为：

符号栈	输入串
＃	w＃

分析器的工作过程是：自左至右把输入串w的符号一一移进符号栈里，一旦发现栈顶形成一个可归约串时，就把这个串用相应的归约符号（在规范归约的情况下用相应产生规则的左部符号）代替。这种替换可能持续多次，直至栈顶不再呈现可归约串为止。然后，就继续移进符号，重复整个过程，直至最终形成如下格局：

符号栈	输入串
＃S	＃

此时，栈里只含＃与最终归约符S（在规范归约的情形下S为文法开始符号），而输入串w全被吸收，仅剩下结束符。这种格局表示分析成功。如果达不到这种格局，意味着输入串w（源程序）含有语法错误。

语法分析对符号栈的使用有四类操作：“移进”、“归约”、“接受”和“出错处理”。

“移进” 指把输入串的一个符号移进栈。
“归约”指发现栈顶呈可归约串，并用适当的相应符号去替换这个串（这两个问题都还没有解决）。
“接受”指宣布最终分析成功，这个操作可看作是“归约”的一种特殊形式。
“出错处理”指发现栈顶的内容与输入串相悖，分析工作无法正常进行，此时需调用出错处理程序进行诊察和校正，并对栈顶的内容和输入符号进行调整。

对于“归约”而言请留心一个非常重要的事实，任何可归约串的出现必在栈顶，不会在栈的内部。对于规范归约而言，这个事实是明显的。由于规范归约是最右推导的逆过程，因此这种归约具有“最左”性，故可归约串必在栈顶，而不会在栈的内部。正因如此，先进后出栈在归约分析中是一种非常有用的数据结构。

如果要实际表示一棵语法分析树的话，一般来说，使用穿线表是比较方便的。这只须对每个进栈符号配上一个指示器就可以了。

当要从输入串移进一个符号a入栈时，我们就开辟一项代表端末结a的数据结构，让这项数据结构的地址（指示器值）连同a本身一起进栈。端末结的数据结构应包括这样一些内容：(1) 儿子个数：0；(2) 关于a自身的信息（如单词内部值，现在暂且不管）。

当要把栈顶的n个符号，如 X1X2…Xn 归约为 A 时，我们就开辟一项代表新结A的数据结构。这项数据结构应包含这样一些内容：(1) 儿子个数：n；(2) 指向儿结的n个指示器值；(3) 关于A自身的其它信息。归约时，把这项数据结构的地址连同A本身一起进栈。

最终，当要执行“接受”操作时，我们将发现一棵用穿线表表示的语法树业已形成，代表根结的数据结构的地址和文法的开始符号（在规范归约情况下）一起留在栈中。

用这种方法表示语法树是最直截了当的。当然，也可以用别的或许是更加高效的表示方法。

算符优先分析

算符优先文法及其优先表构造

一个文法，如果它的任一产生式的右部都不含两个相继（并列）的非终结符，即不含如下形式的产生式右部：

…QR…
则我们称该文法为 算符文法。

在后面的定义中，a、b代表任意终结符；P、Q、R代表任意非终结符；‘…’代表由终结符和非终结符组成的任意序列，包括空字。

假定G是一个不含e-产生式的算符文法。对于任何一对终结符a、b，我们说：

a≖b 当且仅当文法G中含有形如 P→…ab… 或 P→…aQb… 的产生式；
a⋖b 当且仅当G中含有形如 P→…aR… 的产生式，而 Rb… 或 RQb… ；
a⋗b 当且仅当G中含有形如 P→…Rb… 的产生式，而 R…a 或 R…aQ 。

如果一个算符文法G中的任何终结符对（a，b）至多只满足下述三关系之一：

a≖b，a⋖b，a⋗b
则称G是一个算符优先文法。

现在来研究从算符优先文法G构造优先关系表的算法。

通过检查G的每个产生式的每个候选式，可找出所有满足 a≖b 的终结符对。为了找出所有满足关系 ⋖ 和 ⋗ 的终结符对，我们首先需要对G的每个非终结符P构造两个集合 FIRSTVT（P）和 LASTVT（P）：

FIRSTVT（P）＝a|Pa…或PQa…，aÎVT而QÎVN

LASTVT（P）＝a|P…a或P…aQ，aÎVT而QÎVN

算符优先分析算法

所谓素短语是指这样的一个短语，它至少含有一个终结符，并且，除它自身之外不再含任何更小的素短语。所谓最左素短语是指处于句型最左边的那个素短语。如上例，P*P和i是句型P*P+i的素短语，而P*P是它的最左素短语。

现在考虑算符优先文法，我们把句型（括在两个＃之间）的一般形式写成：

#N1a1N2a2…NnanNn+1# ……………. (4)
其中，每个

ai 都是终结符，

Ni 是可有可无的非终结符。换言之，句型中含有n个终结符，任何两个终结符之间顶多只有一个非终结符。必须记住，任何算符文法的句型都具有这种形式。我们可以证明如下定理：
一个算符优先文法G的任何句型（4）的最左素短语是满足如下条件的最左子串

Njaj…NiaiNi+1 ，

aj−1⋖aj
aj≖aj+1，…，ai−1≖ai
ai⋗ai+1
根据这个定理，下面我们讨论算符优先分析算法。为了和定理的叙述相适应，我们现在仅使用一个符号栈S，既用它寄存终结符，也用它寄存非终结符。下面的分析算法是直接根据这个定理构造出来的，其中k代表符号栈S的使用深度。

优先函数

在实际实现算符优先分析算法时，一般不用表5.1这样的优先表，而是用两个优先函数f和g。我们把每个终结符q与两个自然数 f（q）和 g（q）相对应，使得

若 q1⋖q2 则 f（q1）<g（q2）
若 q1≖q2 则 f（q1）=g（q2） …….. （5）
若 q1⋗q2 则 f（q1）>g（q2）

函数f称为入栈优先函数，g称为比较优先函数。使用优先函数有两方面的优点：便于作比较运算，并且节省存储空间，因为优先关系表占用的存储量比较大。其缺点是，原先不存在优先关系的两个终结符，由于与自然数相对应，变成可比较的了。因而，可能会掩盖输入串的某些错误。但是，我们可以通过检查栈顶符号q和输入符号a的具体内容来发现那些原先不可比较的情形。

如果优先函数存在，那么，从优先表构造优先函数的一个简单方法是：

对于每个终结符 a（包括＃）令其对应两个符号 fa 和 ga ，画一张以所有符号 fa 和 ga 为结点的方向图，如果 a⋗≖b ，那么，就从 fa 画一箭弧至 gb ；如果a⋖≖b，就画一条从 gb 到 fa 的箭弧。
对每个结点都赋予一个数，此数等于从该结点出发所能到达结点（包括出发结点自身在内）的个数。赋给fa的数作为f（a），赋给gb的数作为g（b）。
检查所构造出来的函数f和g，看它们同原来的关系表是否有矛盾。如果没有矛盾，则f和g就是所要的优先函数。如果有矛盾，那么，就不存在优先函数。

现在必须证明：若a≖b，则f（a）＝g（b）；若a⋖b，则f（a）< g（b）；若a⋗b，则f（a）> g（b）。第一个关系可从函数的构造直接获得。因为，若a≖b，则既有从fa到gb的弧，又有从gb到fa的弧。所以，fa和gb所能到达的结是全同的。至于a⋗b和a⋖b的情形，只须证明其一。如果a⋗b，则有从fa到gb的弧。也就是，gb能到达的任何结fa也能到达。因此，f（a）³ g（b）。我们所需证明的是，在这种情况下，f（a）＝g（b）不应成立。我们将指出，如果f（a）＝g（b），则根本不存在优先函数。假若f（a）＝g（b），那么必有

          a⋗b, a1⋖≖b, a1⋗≖b1,…am⋗≖bm, a⋖≖bm

因为对任何优先函数都必须满足(5.5) 所规定的条件，而上面的关系恰恰表明，对任何优先函数f和g来说，必定有

f（a）> g（b）³ f（a1）³ g（b1）³ … ³ f（am）³ g（bm）³ f（a）

从而导致f（a）> f（a），产生矛盾。因此，不存在优先函数f和g。

算符优先分析中的出错处理

使用算符优先分析法时，可在两种情况下，发现语法错误：

若在栈顶终结符号与下一输入符号之间不存在任何优先关系；
若找到某一“句柄”（此处“句柄”指素短语），但不存在任一产生式，其右部为此“句柄”。

针对上述情况，处理错误的子程序也可分成几类。首先，我们考虑处理类似第2种情况错误的子程序。当发现这种情况时，就应该打印错误信息。子程序要确定该“句柄”与哪个产生式的右部最相似。例如，假定从栈中确定的“句柄”是abc，可是，没有一个产生式，其右部包含a,b,c在一起。此时，可考虑是否删除a,b,c中的一个。例如，假若有一产生式，其右部为aAcB，则可给出错误信息：“非法b”；若另有一产生式，其右部为abdc，则可给出错误信息：“缺少d”。

LR分析法

LR分析器

规范归约（最左归约—最右推导的逆过程）的关键问题是寻找句柄。在一般的“移进－归约”过程中，当一串貌似句柄的符号串呈现于栈顶时，我们有什么方法可以确定它是否为相对于某一产生式的句柄呢？LR方法的基本思想是，在规范归约过程中，一方面记住已移进和归约出的整个符号串，即记住“历史”，另一方面根据所用的产生式推测未来可能碰到的输入符号，即对未来进行“展望”。当一串貌似句柄的符号串呈现于分析栈的顶端时，我们希望能够根据所记载的“历史”和“展望”以及“现实”的输入符号等三方面的材料，来确定栈顶的符号串是否构成相对某一产生式的句柄。

LR分析法的这种基本思想是很符合哲理的。因而可以想象，这种分析法也必定是非常通用的。正因如此，实现起来也就非常困难。作为归约过程的“历史”材料的积累虽不困难（实际上，这些材料都保存在分析栈中），但是，“展望”材料的汇集却是一件很不容易的事情。这种困难不是理论上的，而是实际实现上的。因为，根据历史推测未来，即使是推测未来的一个符号，也常常存在着非常多的不同可能性。因此，当把“历史”和“展望”材料综合在一起时，复杂性就大大增加。如果简化对“展望”资料的要求，我们就可能获得实际可行的分析算法。

后面所讨论的LR方法都是带有一定限制的。

一个LR分析器实质上是一个带先进后出存储器（栈）的确定有限状态自动机。我们将把“历史”和“展望”材料综合地抽象成某些“状态”。分析栈（先进后出存储器）用来存放状态。栈里的每个状态概括了从分析开始直到某一归约阶段的全部“历史”和“展望”资料。任何时候，栈顶的状态都代表了整个的历史和已推测出的展望。因此，在任何时候都可从栈顶状态得知你所想了解的一切，而绝对没有必要从底而上翻阅整个栈。LR分析器的每一步工作都是由栈顶状态和现行输入符号所唯一决定的。为了有助于明确归约手续，我们把已归约出的文法符号串也同时放在栈里（显然它们是多余的，因为它们已被概括在“状态”里了）。于是，我们可以把栈的结构看成是：

栈的每一项内容包括状态s和文法符号X两部分。（s0，#）为分析开始前预先放到栈里的初始状态和句子括号。栈顶状态为sm，符号串X1X2…Xm是至今已移进归约出的部分。

LR分析器的核心部分是一张分析表。这张分析表包括两部分，一是“动作”（ACTION）表，另一是“状态转换”（GOTO）表。它们都是二维数组。ACTION[s, a]规定了当状态s面临输入符号a时应采取什么动作。GOTO[s,X]规定了状态s面对文法符号X（终结符或非终结符）时下一状态是什么。显然，GOTO[s,X]定义了一个以文法符号为字母表的DFA。

每一项ACTION[s,a]所规定的动作不外是下述四种可能之一：

移进把（s,a）的下一状态s¢=GOTO[s,a]和输入符号a推进栈，下一输入符号变成现行输入符号。
归约指用某一产生式A→b进行归约。假若b的长度为r，归约的动作是A，去除栈顶的r个项，使状态sm-r变成栈顶状态，然后把（sm-r,A）的下一状态s¢=GOTO[sm-r,A]和文法符号A推进栈。归约动作不改变现行输入符号。执行归约动作意味着b（=Xm-r+1…Xm）已呈现于栈顶而且是一个相对于A的句柄。
接受宣布分析成功，停止分析器的工作。
报错发现源程序含有错误，调用出错处理程序。

LR分析器的总控程序本身的工作是非常简单的。它的任何一步只需按栈顶状态s和现行输入符号a执行ACTION[s,a]所规定的动作。不管什么分析表，总控程序都是一样地工作。

一个LR分析器的工作过程可看成是栈里的状态序列、已归约串和输入串所构成的三元式的变化过程。分析开始时的初始三元式为：

（

s0 , #,

a1a2…an #）
其中

s0 为分析器的初态；#为句子的左括号；

a1a2…an 为输入串，其后的#为结束符（句子右括号）。分析过程每步的结果可表示为：
（

s0s1…sm , #

X1X2…Xm,aiai+1…an #）
分析器的下一步动作是由栈顶状态

sm 和现行输入符号

ai 所唯一决定的。即，执行

ACTION[sm,ai] 所规定的动作。经执行每种可能的动作之后，三元式的变化情形是：
1. 若

ACTION[sm,ai] 为移进，且

s=GOTO[sm,ai] ，则三元式变成：
（

s0s1…sms , #

X1X2…Xmai,ai+1…an #）
2. 若

ACTION[sm,ai]=A→b ，则按产生式

A→b 进行归约。此时三元式变为：
（

s0s1…sm−rs , #

X1…Xm−rA,aiai+1…an #）
此处

s=GOTO[sm−r,A] ，

r 为

b 的长度，

b＝Xm−r+1…Xm 。
3. 若

ACTION[sm,ai] 为“接受”，则三元式不再变化，变化过程终止，宣布分析成功。
4. 若

ACTION[sm,ai] 为“报错”，则三元式的变化过程终止，报告错误。

一个 LR 分析器的工作过程就是一步一步地变换三元式，直至执行“接受”或“报错”为止。

对于一个 LR 分析器来说，栈顶状态提供了所需的一切“历史”和“展望”信息。请注意一个非常重要的事实：如果仅由栈的内容和现实的输入符号就可以识别一个句柄，那么，就可以用一个有限自动机自底向上扫描栈的内容和检查现行输入符号来确定呈现于栈顶的句柄是什么（如果形成一个句柄时）。实际上， LR 分析器就是这样的一个有限自动机。只是，因栈顶的状态已概括了整个栈的内容，因此，无需扫描整个栈。栈顶状态就好象已代替我们进行了这种扫描。

LR文法

我们主要关心的问题是，如何从文法构造LR分析表。对于一个文法，如果能够构造一张分析表，使得它的每个入口均是唯一确定的，则我们将把这个文法称为LR文法。并非所有上下文无关文法都是LR文法。但对于多数程序语言来说，一般都可用LR文法描述。直观上说，对于一个LR文法，当分析器对输入串进行自左至右扫描时，一旦句柄呈现于栈顶，就能及时对它实行归约。

一个LR分析器有时需要“展望”和实际检查未来的k个输入符号才能决定应采取什么样的“移进－归约”决策。一般而言，一个文法，如果能用一个每步顶多向前检查k个输入符号的LR分析器进行分析，则这个文法就称为LR（k）文法。但对多数的程序语言来说，k=0或1就足够了。因此，我们只考虑k£1的情形。

注意，LR方法关于识别产生式右部的条件远不象预测法那样严峻。预测法要求每个非终结符的所有候选的首符均不同，预测分析程序认为，一旦看到首符之后就看准了该用哪一个产生式进行推导。但LR分析程序只有在看到整个右部所推导的东西之后才认为是看准了归约方向。因此，LR方法比预测法应该更加一般化。

LR(0)项目集族和LR(0)分析表的构造

对于一个文法G，我们可以构造一个有限自动机，它能识别G的所有活前缀。在这个基础上，我们将讨论如何把这种自动机转变成LR分析表。

对于一个文法G，我们首先要构造一个 NFA ，它能识别G的所有活前缀。这个 NFA 的每个状态是下面定义的一个“项目”。文法G每一个产生式的右部添加一个圆点称为G的一个 LR（0）项目（简称项目）。例如，产生式 A→XYZ 对应有四个项目：
A→⋅XYZ
A→X⋅YZ
A→XY⋅Z
A→XYZ⋅

但是，产生式 A→e 只对应一个项目 A→⋅ 。在计算机中，每个项目可用一对整数表示，第一个整数代表产生式编号，第二个整数指出圆点的位置。

直观上说，一个项目指明了在分析过程的某时刻我们看到产生式多大一部分。例如，上面四项的第一个项目意味着，我们希望能从后面输入串中看到可以从XYZ推出的符号串。第二个项目意味着，我们已经从输入串中看到能从X推出的符号串，我们希望能进一步看到可以从YZ推出的符号串。

我们可以使用这些项目状态构造一个NFA，用来识别这个文法的所有活前缀。这个文法的开始符号S¢仅在第一个产生式的左部出现。使用这个事实，我们规定项目1为NFA的唯一初态。任何状态（项目）均认为是NFA的终态（活前缀识别态）。如果状态i和j出自同一产生式，而且状态j的圆点只落后于状态i的圆点一个位置，如状态i为

X→X1…Xi−1⋅Xi…Xn
而状态j为

X→X1…Xi⋅Xi+1…Xn

那么，就从状态i画一条标志为Xi的弧到状态j。假若状态i的圆点之后的那个符号为非终结符，如 i 为 X→a⋅Ab ， A 为非终结符，那么，就从状态i画e弧到所有 A→⋅g 状态（即，所有那些圆点出现在最左边的A的项目）。

子集方法，我们能够把识别活前缀的NFA确定化，使之成为一个以项目集合为状态的DFA，这个DFA就是建立LR分析算法的基础。

构成识别一个文法活前缀的DFA的项目集（状态）的全体称为这个文法的LR（0）项目集规范族。这个规范族提供了建立一类LR（0）和SLR（简单LR）分析器的基础。

为了便于叙述，我们用一些专门术语来称呼不同的项目。凡圆点在最右端的项目，如A→a·，称为一个“归约项目”。对文法的开始符号S¢的归约项目，如S¢→a·，称为“接受”项目。显然，“接受”项目是一种特殊的归约项目。形如A→a·ab的项目，其中a为终结符，称为“移进”项目。形如A→a·Bb的项目，其中B为非终结符，称为“待约”项目。

LR（0）项目集规范族的构造

下面所引进的 e−CLOSURE （闭包）的办法来构造一个文法G的LR（0）项目集规范族。

为了使“接受”状态易于识别，我们总把文法G进行拓广。假定文法G是一个以S为开始符号的文法，我们构造一个 G¢ ，它包含了整个G，但它引进了一个不出现在G中的非终结符S¢，并加进一个新产生式 S¢→S ，而这个 S¢ 是 G¢ 的开始符号。那么，我们称G¢是G的拓广文法。这样，便会有一个仅含项目S¢→S的状态，这就是唯一的“接受”态。

假定 I 是文法 G¢ 的任一项目集，定义和构造I的闭包 CLOSURE（I）的办法是：

I 的任何项目都属于 CLOSURE（I）；
若 A→a⋅Bb 属于 CLOSURE（I），那么，对任何关于 B 的产生式 B→g4，项目 B→·g 也属于 CLOSURE（I）$；
重复执行上述两步骤直至 CLOSURE（I）不再增大为止。

在构造 CLOSURE（I）时，请注意一个重要的事实，那就是，对任何非终结符B，若某个圆点在左边的项目B→·g进入到CLOSURE（I），则B的所有其它圆点在左边的项目B→·b也将进入同一个CLOSURE集。因此，在某种情况下，并不需要真正列出CLOSURE集里的所有项目B→·g，而只须列出非终结符B就可以了。

函数GO是一个状态转换函数。 GO（I，X）的第一个变元I是一个项目集，第二个变元X是一个文法符号。函数值 GO（I，X）定义为：

GO（I，X）＝CLOSURE（J）

其中: J＝任何形如A→aX⋅b的项目|A→aX⋅b属于I 。

直观上说，若I是对某个活前缀g有效的项目集，那么，GO（I，X）便是对gX有效的项目集。通过函数CLOSURE和GO很容易构造一个文法G的拓广文法G¢的LR（0）项目集规范族。构造算法是：

PROCEDURE  ITEMSETS（G¢）；
BEGIN
         C:={CLOSURE（{S¢®·S}）}；
         REPEAT
                   FOR  C中的每个项目集I和G¢的每个符号X  DO
                            IF GO（I，X）非空且不属于C   THEN
                               把GO（I，X）放入C族中
         UNTIL C   不再增大
END

这个算法的工作结果C就是文法G¢的LR（0）项目集规范族。

有效项目

我们希望从识别文法的活前缀的DFA建立LR分析器（带栈的确定有限状态自动机）。因此，需要研究这个DFA的每个项目集（状态）中的项目的不同作用。

我们说项目 A→b1⋅b2 对活前缀ab1是有效的，其条件是存在规范推导S¢aAwab1b2w。一般而言，同一项目可能对好几个活前缀都是有效的（当一个项目出现在好几个不同的集合中时便是这种情形）。若归约项目A→b1·对活前缀ab1是有效的，则它告诉我们应把符号串b1归约为A，即把活前缀ab1变成aA。若移进项目A→b1·b2对活前缀ab1是有效的，则它告诉我们，句柄尚未形成，因此，下一步动作应是移进。但是，可能存在这样的情形，对同一活前缀，存在若干项目对它都是有效的。而且它们告诉我们应做的事情各不相同，互相冲突。这种冲突通过向前多看几个输入符号，或许能够获得解决。我们在下一节将讨论这种情形，当然，对于非LR文法，这种冲突有些是绝对无法解决的，不论超前多看几个输入符号也无济于事。

对于每个活前缀，我们可以构造它的有效项目集。实际上，一个活前缀g的有效项目集正是从上述的DFA的初态出发，经读出g后而到达的那个项目集（状态）。换言之，在任何时候，分析栈中的活前缀X1X2…Xm的有效项目集正是栈顶状态Sm所代表的那个集合。这是LR分析理论的一条基本定理。实际上，栈顶的项目集（状态）体现了栈里的一切有用信息—历史。

LR（0）分析表的构造

假若一个文法G的拓广文法G¢的活前缀识别自动机中的每个状态（项目集）不存在下述情况：1) 既含移进项目又含归约项目，或者2) 含有多个归约项目，则称G是一个LR（0）文法。换言之，LR（0）文法规范族的每个项目集不包含任何冲突项目。

对于LR（0）文法，我们可直接从它的项目集规范族C和活前缀识别自动机的状态转换函数GO构造出LR分析表。下面是构造LR（0）分析表的算法。

假定 C＝I0,I1,…,In 。前面，我们已习惯用数码表示状态，因此，令每个项目集 Ik 的下标 k 作为分析器的状态。特别是，令那个包含项目 S¢→⋅S 的集合 Ik 的下标k为分析器的初态。分析表的 ACTION 子表和 GOTO 子表可按如下方法构造：

若项目 A→a⋅ab 属于 Ik 且 GO（Ik,a）＝Ij，a 为终结符，则置 ACTION[k,a] 为“把（ j,a ）移进栈”，简记为“ sj ”。
若项目 A→a⋅ 属于 Ik ，那么，对任何终结符 a （或结束符#），置 ACTION[k,a] 为“用产生式 A→a 进行归约”，简记为“ rj ”（假定产生式 A→a 是文法 G¢ 的第 j 个产生式）。
若项目 S¢→S⋅ 属于 Ik ，则置 ACTION[k ,# ] 为“接受”，简记为“ acc ”。
若 GO（Ik,A）＝Ij，A 为非终结符，则置 GOTO[k,A]=j 。
分析表中凡不能用规则1至4填入信息的空白格均置上“报错标志”。

由于假定 LR（0）文法规范族的每个项目集不含冲突项目，因此，按上法构造的分析表的每个入口都是唯一的（即，不含多重定义）。我们称如此构造的分析表是一张 LR（0）表。使用 LR（0）表的分析器叫做一个 LR（0）分析器。

SLR分析表的构造

上面所说的LR（0）文法是一类非常简单的文法。这种文法的活前缀识别自动机的每一个状态（项目集）都不含冲突性的项目。但是，即使是定义算术表达式这样的简单文法也不是LR（0）的。因此，本节我们将要研究一种有点简单“展望”材料的LR分析法，即SLR法。

我们将看到，许多冲突性的动作都可能通过考察有关非终结符的FOLLOW集而获解决。例如，假定一个LR（0）规范族中含有如下的一个项目集（状态）I，

I＝{X→a·bb，
 A→a·，
 B→a·}

其中，第一个项目是移进项目，第二、三项目是归约项目。这三个项目告诉我们应做的动作各不相同，互相冲突。第一个项目告诉我们应该把下一个输入符号b（如果是b）移进。第二个项目告诉我们应把栈顶的a归约为A；第三个项目则说应把a归约为B。解决冲突的一种简单办法是，分析所有含A或B的句型，考察句型中可能直接跟在A或B之后的终结符，也就是说，考察集合FOLLOW（A）和FOLLOW（B），如果这两个集合不相交，而且都不包含b，那么，当状态I面临任何输入符号a时，我们就可以采取如下的“移进－归约”决策：

若 a=b ，则移进；
若 aÎFOLLOW（A），则用产生式 A→a 进行归约；
若 aÎFOLLOW（B），则用产生式 B→a 进行归约；
此外，报错。

一般而言，假定 LR（0）规范族的一个项目集 I 中含有 m 个移进目；
A1→a⋅a1b1，A2→a⋅a2b2 ，…， Am→a⋅ambm ；
同时含有 n 个归约项目： B1→a⋅ ， B2→a⋅ ，…， Bn→a⋅ ，
如果集合 {a1，…，am}， FOLLOW（B1），…，FOLLOW（Bn）两两不相交（包括不得有两个 FOLLOW 集合有#），则隐含在I中的动作冲突可通过检查现行输入符号a属于上述 n+1 个集合中的哪个集合而获得解决。这就是：

若a是某个ai，i=1,2,…,m，则移进；
若aÎFOLLOW（Bi），i=1,2,…,n，则用产生式Bi→a进行归约；
此外，报错。
冲突性动作的这种解决办法叫做SLR（1）解决办法。

对任给的一个文法G，我们可用如下的办法构造它的SLR（1）分析表：首先把G拓广为G¢，对G¢构造LR（0）项目集规范族C和活前缀识别自动机的状态转换函数GO。使用C和GO，然后再按下面的算法构造G¢的SLR分析表。

假定C＝{I0,I1,…,In}，令每个项目集Ik的下标k为分析器的一个状态，因此，G¢的SLR分析表含有状态0，1，…，n。令那个含有项目S¢→·S的Ik的下标为初态。函数ACTION和GOTO可按如下方法构造：

若项目A→·aab属于Ik且GO（Ik,a）=Ij，a为终结符，则置ACTION[k,a]为“把状态j和符号a移进栈”，简记为“sj”；
若项目A→a·属于Ik，那么，对任何终结符a，aÎFOLLOW（A），置ACTION[k,a]为“用产生式A→a进行归约”，简记为“rj”；其中，假定A®a为文法G¢的第j个产生式；
若项目S¢→S·属于Ik，则置ACTION[k,#]为“接受”，简记为“acc”；
若GO（Ik,A）＝Ij，A为非终结符，则置GOTO[k,A]=j；
分析表中凡不能用规则1至4填入信息的空白格均置上“出错标志”。

按上述算法构造的含有ACTION和GOTO两部分的分析表，如果每个入口不含多重定义，则称它为文法G的一张SLR表。具有SLR表的文法G称为一个SLR（1）文法。数字1的意思是，在分析过程中顶多只要向前看一个符号。使用SLR表的分析器叫做一个SLR分析器。

若按上述算法构造的分析表存在多重定义的入口（即含有动作冲突），则说明文法G不是SLR（1）的。在这种情况下，不能用上述算法构造分析器。

每个SLR（1）文法都是无二义的。但也存在许多无二义文法不是SLR（1）的。

规范LR分析表的构造

在SLR方法中，若项目集Ik含有A→a·，那么，在状态k时，只要所面临的输入符号aÎFOLLOW（A），就确定采取“用A→a归约”的动作。但是，在某种情况下，当状态k呈现于栈顶时，栈里的符号串所构成的活前缀ba未必允许把a归约为A，因为可能没有一个规范句型含有前缀bAa。因此，在这种情况下，用A→a进行归约未必有效。

可以设想让每个状态含有更多的“展望”信息，这些信息将有助于克服动作冲突和排除那种用A→a所进行的无效归约。我们可以设想，必要时，对状态进行分裂，使得LR分析器的每个状态能够确切地指出，当a后跟哪些终结符时才容许把a归约为A。

我们需要重新定义项目，使得每个项目都附带有k个终结符。现在每个项目的一般形式是 [A→a⋅b,a1a2…ak] ，此处， A→a⋅b 是一个LR（0）项目，每一个a都是终结符。这样的一个项目称为一个LR（k）项目。项目中的 a1a2…ak 称为它的向前搜索符串（或展望串）。向前搜索符串仅对归约项目 [A→a⋅，a1a2…ak] 有意义。对于任何移进或待约项目 [A→a⋅b,a1a2…ak],b¹e ，搜索符串 a1a2…ak 没有作用。归约项目 [A→a⋅,a1a2…ak] 意味着：当它所属的状态呈现在栈顶且后续的k个输入符号为 a1a2…ak 时，才可以把栈顶上的a归约为A。我们只对k£1的情形感兴趣，因为，对多数程序语言的语法来说，向前搜索（展望）一个符号就多半可以确定“移进”或“归约”。

形式上我们说一个 LR（1）项目 [A→a⋅b,a] 对于活前缀g是有效的，如果存在规范推导

SdAwdabw
其中，

1)g＝da ；

2)a 是w的第一个符号，或者a为#而w为e。
构造有效的LR（1）项目集族的办法本质上和构造LR（0）项目集规范族的办法是一样的。类似地，我们也需要两个函数CLOSURE和GO。

假定I是一个项目集，它的闭包CLOSURE（I）可按如下方式构造：
1. I的任何项目都属于CLOSURE（I）。
2. 若项目[A→a·Bb, a]属于CLOSURE（I），B→x是一个产生式，那么，对于FIRST（ba）中的每个终结符b，如果[B→·x, b]原来不在CLOSURE（I）中，则把它加进去。
3. 重复执行步骤2，直至CLOSURE（I）不再增大为止。
因为，[A→a·Bb, a]属于对活前缀g＝da有效的项目集意味着存在一个规范推导

SdAacdaBbac

因此，若bac可推导出bw，则对于每个形如B®x的产生式，我们有SgBbwgxbw，也就是说，[B→·x, b]对g也是有效的。注意，b可能是从b推出的第一个符号，或者，若b推出e，则b就是a，把这两种可能性结合在一起，我们说bÎFIRST(ba)。
令I是一个项目集，X是一个文法符号，函数GO（I，X）定义为：

GO（I，X）＝CLOSURE（J）
其中

J＝任何形如[A→aX⋅b,a]的项目|[A→a⋅Xb,a]ÎI
关于文法G¢的LR（1）项目集族C的构造算法是：

BEGIN
       C:={CLOSURE({[S¢→·S，#]})};
       REPEAT
              FOR       C中的每个项目集I和G¢的每个符号X    DO
                     IF    GO（I，X）非空且不属于C，THEN 把GO（I，X）加入C中
       UNTIL    C不再增大
END

现在来讨论从文法的LR（1）项目集族C构造分析表的算法。

假定C＝{I0, I1,…, In}，令每个Ik的下标k为分析表的状态。令那个含有[S¢→·S, #]的Ik的k为分析器的初态。动作ACTION和状态转换GOTO可构造如下：

若项目[A→a·ab, b]属于Ik且GO（Ik, a）＝Ij， a为终结符，则置ACTION[k, a]为“把状态j和符号a移进栈”，简记为“sj”。
若项目[A→a·，a]属于Ik，则置ACTION[k, a]为“用产生式A→a归约”，简记为“rj”；其中假定A→a为文法G¢的第j个产生式。
若项目[S¢→S·, #]属于Ik，则置ACTION[k, #]为“接受”，简记为“acc”。
若GO（Ik，A）＝Ij，则置GOTO[k, A]=j。
分析表中凡不能用规则1至4填入信息的空白栏均填上“出错标志”。

按上述算法构造的分析表，若不存在多重定义的入口（即，动作冲突）的情形，则称它是文法G的一张规范的LR（1）分析表。使用这种分析表的分析器叫做一个规范的LR分析器。具有规范的LR（1）分析表的文法称为一个LR（1）文法。
每个SLR（1）文法都是LR（1）文法。一个SLR（1）文法规范的LR分析器比其SLR分析器含有更多的状态。

LALR分析表的构造

现在来讨论构造分析表的LALR 方法。这本质上是一种折衷方法。LALR 分析表比规范LR分析表要小得多，能力也差一点。但它却能对付一些SLR所不能对付的情形，例如，文法（5.9）的情形。

对于同一个文法，LALR 分析表和SLR分析表永远具有相同数目的状态。对于ALGOL一类语言来说，一般要用几百个状态，但若用规范LR分析表，同一类语言，却要用几千个状态。因此，用SLR或LALR要经济得多。

我们称两个LR（1）项目集具有相同的心，如果除去搜索符之后，这两个集合是相同的。我们将试图把所有同心的LR（1）项目集合并为一。我们还将看到一个心就是一个LR（0）项目集。

由于GO（I，X）的心仅仅依赖于I的心，因此，LR（1）项目集合并后的转换函数GO可通过GO（I，X）自身的合并而得到。即，在合并项目集时用不着同时考虑修改转换函数的问题。动作ACTION应进行修改，使得能够反映各被合并的集合的既定动作。

假定有一个LR（1）文法，即，它的LR（1）项目集不存在动作冲突，如果我们把同心集合并为一，就可能导致存在冲突。但是这种冲突不会是“移进—归约”冲突。因为，如存在这种冲突，则意味着，面对当前的输入符号a，有一个项目[A→a·, a]要求采取归约动作，同时又有另一项目[B→b·ag, b]要求把a移进。这两个项目既然同处在合并之后的一个集合中，则意味着，在合并前，必有某个c使得[A→a·, a]和[B→b·ag, b]同处于（合并前的）某一集合中。然而，这一点又意味着，原来的LR（1）项目集就已存在着“移进—归约”冲突。故同假设不符。因此，同心集的合并不会产生新的“移进－归约”冲突。

但是，同心集的合并有可能产生新的“归约—归约”冲突。例如，考虑文法
(0) S¢→S
(1) S→aAd | bBd | aBe | bAe
(2) A→c
(3) B→c

这个文法只产生四个符号串：acd、bcd、ace和bce。如果我们构造这个文法的LR（1）项目集族，那么，将发现不会存在冲突性动作。因而它是一个LR（1）文法。在它的集族中，对活前缀ac有效的项目集为{[A→c·, d], [B→c·, e]}，对bc有效的项目集为{[A→c·, e], [B→c·, d]}。这两个集合都不含冲突，它们是同心的。一经合并就变成：{[A→c·, d/e], [B→c·, d/e]。显然，这是一个含有“归约—归约”冲突的集合。因为，当面临e或d时，我们不知道该用A→c还是用B→c进行归约。

下面，我们将给出构造LALR分析表算法。基本思想是，首先构造LR（1）项目集族，如果它不存在冲突，就把同心集合并在一起。若合并后的集族不存在归约－归约冲突，就按这个集族构造分析表。这个算法的主要步骤是：

构造文法G的LR（1）项目集族C＝{I0, I1, …, In}。
把所有的同心集合并在一起，记C¢={J0, J1, …, Jm}为合并后的新族。那个含有项目[S¢®·S, #]的Jk为分析表的初态。
从C¢构造ACTION表：
(1) 若[A→a·ab, b]ÎIk且GO（Jk, a）＝Ji，a为终结符，则置ACTION[k, a]为“sj”。
(2) 若[A→a·，a] ÎJk，则置ACTION[k, a]为“使用A®a归约”，简记为“rj”；其中假定A→a为文法G¢的第j个产生式。
(3) 若[S¢→S·, #]ÎJk，则置ACTION[k, #]为“接受”，简记为“acc”。
GOTO表的构造：假定Jk是Ii1,Ii2,…,Iit合并后的新集。由于所有这些Ii同心，因此，GO（Ii1, X），GO（Ii2, X），…，GO（Iit, X）也具同心。记Ji为所有这些GO合并后的集。那么，就有GO（Jk, X）＝Ji。于是，若GO（Jk，A）＝Ji，则置GOTO[k，A]＝j。
分析表中凡不能用3、4填入信息的空白格均填上“出错标志”。

经上述步骤构造的分析表若不存在冲突，则称它为文法G的LALR分析表。存在这种分析表的文法称为一个LALR（1）文法。

这个算法的思想虽然简单明确，但实现起来甚费时间和空间。

二义文法的应用

任何二义文法决不是一个LR文法，因而也不是SLR或LALR文法。这是一条定理。但是，某些二义文法是非常有用的。例如，若用下面的文法来描述含有＋、*的算术表达式：

E→E＋E|E∗E|(E)|i .......<1>

那么，只要对算符＋、*赋予优先级和结合规则，这个文法是再简单不过了。这个文法与文法
E→E＋T|T
T→T∗F|F ......<2>
F→(E)|i

相比，有两个明显的好处：首先，如需要改变算符的优先级或结合规则无需去改变文法 <1> 自身。其次，文法 <1> 的分析表所包含的状态肯定比 <2> 所包含的状态要少得多。因为 <2> 中含有单非产生式（右部只含一个单一的非终结符） E→T 和 T→F ，这些旨在定义算符优先级和结合规则的产生式要占用不少状态和消耗不少时间。本节将讨论如何使用LR分析法的基本思想，凭借一些其它条件，来分析二义文法所定义的语言。

LR分析中的出错处理

在LR分析过程中，当我们处在这样一种状态下，即输入符号既不能移入栈顶，栈内元素又不能归约时，就意味着发现语法错误。发现错误后，便进入相应的出错处理子程序。处理的方法分为两类：第一类多半使用插入、删除或修改的办法。如在语句a[1,2:=3.14;中插入一个]。如果不可能使用这种办法，则采用第二类办法。第二类处理办法包括在检查到某一不合适的短语时，它不能与任一非终结符可能推导出的符号串相匹配。如语句

if x>k+2 then go 10 else k is 2;

由于把保留字goto误写成go，校正程序试图改成goto，但后面还有错误（将‘:=’误为‘is’），故放弃将go换为goto。校正子程序在此种情况下，将go 1跳过，作为非法语句看待。这种方法企图将含有语法错误的短语局部化。分析程序认定含有错误的符号串是由某一非终结符A所推导出的，此时该符号串的一部分已经处理，处理的结果反映在栈顶部一系列状态中，剩下的未处理符号仍在输入串中。分析程序跳过这些剩余符号，直至找到一个符号a，它能合法地跟在A的后面。同时，要把栈顶的内容逐个移去，直至找到某一状态s，该状态与A有一个对应的新状态GOTO[s,A]，并将该新状态下推入栈。这样，分析程序就认为它已找到A的某个匹配并已将它局部化，然后恢复正常的分析过程。

利用这种方法，可以以语句为单位进行处理，也可以把跳过的范围缩小。例如，若在‘if’后面的表达式中遇到某一错误，分析程序可跳至下一个输入符号‘then’而不是‘；’或‘end’。

与算符优先分析方法比较，用LR分析方法时，设计特定的出错处理子程序比较容易，因为不会发生不正确的归约。在分析表的每一空项内，可以填入一个指示器，指向特定的出错处理子程序。第一类错误的处理一般采用插入、删除或修改的办法，但要注意，不能从栈内移去任何那种状态，它代表已成功地分析了的程序中的某一成分。

前面讨论的只是很简单的情况。一个可投入实际运行的LR分析程序，需要考虑许多更为复杂的情形。例如，当处在某一状态下遇到各种不合法的符号时，错误诊察子程序需要向前查看几个符号，根据所查看的符号才能确定应采取哪一种处理办法。又如前已述及，分析表中有些状态在遇到不合法的输入符号时，不是立即转到错误诊察子程序，而是进行某些归约，这不仅推迟了发现错误的时间，而且往往会带来一些处理上的困难。试研究下面的一输入符号串：

a:=b?c];

这里以‘?’表示在b与c之间有某个错误。如果分析程序遇到‘a:=b’而不向前多看几个符号，则它就会把‘a:=b’先归约成语句，而后我们就再没有机会通过简单地插入符号‘[’进行修补了。但是，即使采用向前查看的办法，查看的符号也不能太多，否则会使分析表变得过分庞大。应该找出一种切实可行的办法，使得在确定处理出错办法时能够参考一些语义信息，以便在向前查看几个符号时，可以避免作出有时从语法上看是正确的，然而却是无意义的校正这一情况。例如，语句

a[1,2:=3.14;

中，标识符‘a’是一个数组标识符，这一语义信息将导致插入符号‘]’。

典型题解

例题什么叫句柄？什么叫素短语？(北京航空航天大学1999年硕士生入学考试)
解答：一个句型的最左直接短语称为该句型的句柄。所谓素短语是指这样的一个短语，它至少含有一个终结符，并且，除它自身之外不再含任何更小的素短语。
例题文法G(S)：
S→bTc
S→a
T→R
R→R/S
R→S
符号串bR/bTc/bSc/ac是不是该文法的一个句型，请证实。若是句型，写出该句型的所有短语、素短语以及句柄。(上海交大1997年试题)
解答：由于有推导：
SÞbTcÞbRcÞbR/Sc
ÞbR/S/ScÞbR/S/S/ScÞbR/bTc/S/ScÞbR/bTc/bTc/Sc
ÞbR/bTc/bRc/ScÞbR/bTc/bSc/ScÞbR/bTc/bSc/ac
所以， bR/bTc/bSc/ac 是 G 的一个句型。
句型 bR/bTc/bSc/ac 中：
短语： a，S，bSc，bTc，R/bTc，R/bTc/bSc，R/bTc/bSc/a，bR/bTc/bSc/ac
素短语： a，bSc，bTc
句柄： bTc
例题给出文法 G(S) ：
S→SaA|A
A→AbB|B
B→cSd|e
请证实 AacAbcBaAdbed 是文法G的一个句型；请写出该句型的所有短语、素短语以及句柄。(上海交大2000年试题)
解答：由于有推导：
SÞSaAÞAaAÞAaBÞAacSd
ÞAacAdÞAacAbBd
ÞAacAbBbBdÞAacAbcSdbBdÞAacAbcSaAdbBd
ÞAacAbcAaAdbBdÞAacAbcBaAdbBdÞAacAbcBaAdbed
所以， AacAbcBaAdbed 是 G 的一个句型。
句型 AacAbcBaAdbed 中：
短语：
e，B，A，BaA，cBaAd，AbcBaAd，AbcBaAdbe，cAbcBaAdbed，AacAbcBaAdbed
素短语： e，BaA
句柄： B

参考文献

陈火旺，钱家骅，孙永强.程序设计语言编译原理.北京：国防工业出版社，1984.
AlfredV.Aho,RaviSethi,JeffreyD.Ullman.Compilers:Principles,Techniques,andTools . Acldison−WesleyPublishingCompany,1986.
A.V.Aho,J.D.Ullman.PrinciplesofCompilerDescign,Addison=Wesley,1977.
王兵山，吴兵，形式语言. 国防科技大学出版社，1988.
A.Salomaa.FormalLanguages.AcademicPress,1975.
《lex与yacc（第二版）》，JohnR.Levine,TonyMason,DougBrown著杨作梅,张旭东,等译。
StephenC.Johnson.Yacc:YetAnotherCompiler−Compiler.http://dinosaur.compilertools.net/yacc/index.html

你可能感兴趣的:(【Compilers,Principles】)

【破解利器】编译工具（Compilers） + 编辑工具 onebody 小技巧&小工具工具破解汇编 api hex dll
编译工具（Compilers）编译器MASM32v8.2MASM32v9.0学习w32Asm编程就用masm32,因为99%的win32asm程序员使用MASM。官方网站：http://www.movsd.com/RadASM2.2.1.2汇编编辑器，需要MASM32.这个版本对中文支持的不错。汉化者：caocong英文版请到官方网站下载：http://www.radasm.com/辅助工具Api
DMSD1 2433A Principles of Marketing 后端
Course:DiplomainManagementStudies(DMSD12433A/2434A/2535A)ModuleTitle:PrinciplesofMarketingAssessment:IndividualAssignmentDate/DueDate:28February2025Weighting:30%(100marks)Note:SubmissionofSoftandHardc
The Devops Handbook 读书笔记01 Alice_HappyAlice ^_^ The Devops Handbook 读书笔记 devops
今天看了一下序，了解了一下Devops这本书是干啥的？ThepurposeoftheDevOpsHandbookistogiveyouthetheory,principles,andpracticesyouneedtosuccessfullystartyourDevOpsinitiativeandachieveyourdesiredoutcomes.Devops原则想要做到的事情，就是更快，更低风
《Semantic communications - Principles and challenges》语义通信文献阅读与分析总结 snow每天都要好好学习深度学习深度学习
《语义通信：原理与挑战》文献详细总结1.语义通信的概念语义通信是一种超越传统香农通信范式的全新通信模式，它关注的是信息意义的传递，而不仅仅是数据本身的准确传输。传统通信强调比特级别的准确性，而语义通信更强调信息对接收方执行特定任务的有效性。这种模式被认为是第六代（6G）无线网络的核心技术之一，能够支持包括智能交通、智能监控、视频会议、增强现实（AR）和虚拟现实（VR）在内的多种智能应用。在语义通信
《CPython Internals》阅读笔记：p97-p117 python
《CPythonInternals》学习第7天，p97-p117总结，总计21页。一、技术总结1.词法分析(lexicalanalysis)根据《Compilers-Principles,Techniques,andTools》(《编译原理》第2版)第5页：Thefirstphaseofacompileriscalledlexicalanalysisorscanning.Thelexcicalan
3.4 Principles of Reliable Data Transfer (Part 2) 找不到工作
上接Part1。3.4.2PipelinedReliableDataTransferProtocols如我们在Part1中指出的，rdt3.0虽然是一个正确的可靠数据传输协议，然而它的性能无法满足需求。因为它实质上是一个stop-and-wait的协议，即在收到上一个数据的ACK之前无法发送下一个数据。解决方法是，sender不需要等待ACK，可以连续发送多个数据包。每个inflight的包都应该
CUDA 问题解决 —— CUDA+MPI出错："mpi.h" No such file or directory __Sunny__ CUDA cuda c语言
在CUDA源文件里使用MPI时，编译出错Makefile文件：CUDA_INSTALL_PATH=/usr/local/cuda-8.0MPI_INSTALL_PATH=/opt/intel/compilers_and_libraries_2017.0.098/linux/mpi/intel64NVCC=$(CUDA_INSTALL_PATH)/bin/nvccMPICC=$(MPI_INSTAL
《PRINCIPLES》鹿女神奇
DaytwoIamconfidentthatwhateversuccessBridgewaterandIhavehadhasresultedfromouroperatingbycertainprinciples.Creatingagreatculture,findingtherightpeople,managingthemtodogreatthingsandsolvingproblemscreat
Visual design principles 小high球
视觉规范主要是3个方面：易读，易触，一致关于易读：字体（32dp&24dp），文本长度（120字符），对比度比率4.5：1,晚上易读性关于易触：合适的点击区域尺寸（最小76*76），点击区域间隔（23dp）一致性：一致的icon，术语和交互模板。清晰的可操作和不可操作翻译出自：https://designguidelines.withgoogle.com/automotive-os-apps/de
[大译] Apply Aristotle's first principles to businesses 亚里士多德第一原则用于企业苹果放阳台
informationsource问文章出处:https://www.inc.com/peter-economy/elon-musk-netflix-both-use-this-ancient-mental-strategy-to-succeed.htmlAristotle'sfirstprinciplessaysthemoreyouknowaboutsomething'sfundamentalp
Enterprise UX Design Principles and Best Practices weixin_40455124 UX ux principles practices design enterprise
EnterpriseUXDesign110EnterpriseUXDesignPrinciplesforOptimalUserExperience1.11.UnderstandtheUserandContext1.22.SimplifyComplexity1.33.ConsistencyandFamiliarity1.44.ClearInformationHierarchy1.55.Seamles
openmpi运行时出现error while loading shared libraries: libimf.so: cannot open shared object file: odin_linux
使用openmpi，通过intel编译器编译，使用mpirun时出现这个问题：errorwhileloadingsharedlibraries:libimf.so:cannotopensharedobjectfile:出现这个问题说明intel的库文件路径没有配置好，所以考虑在~/.bashrc文件中添加：exportLD_LIBRARY_PATH="/opt/intel/compilers_an
principles 语句合集时间很宝贵
WhenIdidn’twanttodosomething,Iwouldfightit,butwhenIwasexcitedaboutsomething,nothingcouldholdmeback.Forme,greatisbetterthanterrible,andterribleisbetterthanmediocre,becauseterribleatleastgiveslifeflavor
编译原理与技术（三）——语法分析（六）自底向上-SLR分析 MCQSLW 编译原理与技术语法分析文法 SLR
上一节介绍了LR分析，LR分析包含许多方法，本节介绍的简单的LR方法（SLR）就是其中之一。一、活前缀二、LR分析的特点三、简单的LR方法（SLR）（一）LR(0)项目（二）增广文法上述文法变换成增广文法。（三）构造识别活前缀的DFA（四）从DFA构造SLR分析表四、SLR(1)文法参考资料：[1]USTC编译原理和技术2023(ustc-compiler-principles.github.io
编译原理与技术（三）——语法分析（五）自底向上-LR分析 MCQSLW 算法
一、自顶向下的LL(1)与自底向上的LR（一）LL(1)非递归预测分析器及分析表（二）LR分析器及分析表二、LR分析举个例子。从上面不难看出，LR分析也是由分析表驱动的。那么关键在于构造LR分析表。参考资料：[1]USTC编译原理和技术2023(ustc-compiler-principles.github.io)
手机应用UX准则（Mobile App UX Principles） XxxxxuY
Google在2015年发布过一篇针对手机app的用户体验准则，内容很基础，其中的内容特别适用于电商app。我在此做了原文主要内容的中文梳理，想看具体内容可以去原文阅读：https://storage.googleapis.com/think-emea/docs/article/Mobile_App_UX_Principles.pdf文章里主要把使用流程分为四部分：适应（Adopt），使用（Use
用“定投”策略穿越人生的曲折和波浪，实现一生持续的精进丰竹
|01进化，是宇宙的第一法则“我相信进化是宇宙间最伟大的力量，我们都在以大致相同的方式进化。”———RayDalio《Principles》完善自我，塑造一个更加遵从内心、遵从真善美的自我，是我们一生孜孜以求的终极目标，人生本来就应该是一个进行时，绝不应该有完成式。孔子说“朝闻道，夕死可矣！”。一旦我们停止追求、停止思考、停止进步，那就是灵魂“死亡”的时刻。芸芸众生，能独立思考的人真的不多，追求自
每个开发人员都应该知道面向对象设计的原则 (SOLID Principles every Developer Should Know) leacoder
左耳听风第二周Review.png原文：SOLIDPrincipleseveryDeveloperShouldKnow原作者：ChidumeNnamdi第一次看到SOLID原则，是在http://www.runoob.com/学习设计模式时想了解设计模式（Designpattern）点击链接设计模式每个开发人员都应知道的SOLID原则。作者通过简单代码示例，介绍了SLOID原则。面向对象的编程并不
RT-Thread 25. 信号-按键发送 lljss2020 #RT-Thread mcu
1.设置include:..\rt-thread-v4.1.0\components\libc\compilers\common..\rt-thread-v4.1.0\components\libc\compilers\common\extension开启signal，保存并退出menuconfig，这样在rtconfig.h中自动添加RT_USING_SIGNALS宏定义//rtconfig.h
MATLAB2021a安装MinGW -w64 A1988_ Matlab java javascript 开发语言
https://ww2.mathworks.cn/support/requirements/supported-compilers.html选择"DownloadMinGWnow"myfunction.c#include"mex.h"voidmexFunction(intnlhs,mxArray*plhs[],intnrhs,constmxArray*prhs[]){doublea=mxGetSc
Principles of Software Engineering, Part 1 leeliang
这篇文章是读PrinciplesofSoftwareEngineering,Part1)，摘录了部分内容对抗软件中不确定的手段作者在原文中总结了以下手段最小化依赖让软件更加健壮的一种技术手段是尽量让软件的依赖少。出错的组件越少，那么软件也就更少的出错。相对于依赖系统X或Y，依赖包含的内容会更多，比如你使用系统的的特性也是一种依赖。Storm使用的zookeeper是一个很好的例子。集群中所有wor
On Writing Well -Day17 (Ch17) 胖头鸭鸭
Content:PartI|Principles1.TheTransaction2.Simplicity3.Clutter(WritingcleanEnglishSentence)4.Style(Preservingyouridentity)5.Theaudience(WhoamIwritingfor)6.Words(Theonlytoolsyou’vegot)7.Usage(Whatisgood
《原则》读书笔记Day1 鹿呦终南
在没有拿到《原则》这本书的时候，办公室的同事几乎人手一本。每次开会的时候，总有人拿出几分钟以崇拜的口吻论述几条Dalio大神的原则。其实一开始并不感冒，甚至觉得有些夸张了，直到有一天看到Dalio在TED的一篇演讲“howtobuildacompanywherethebestideaswin”,其中讲到了思维模型，我想，这个人是个哲学家。后来翻阅了Dalio的部分principles,竟从中看到了
cpt111 Principles of Programming _0206girl java
Datavisualizationinvolvestheuseofgraphicalelementsandstructurestorepresentandcommunicatedatapatterns,relationships,andinsights.Diagramsarevisualrepresentationsthatcansimplifycomplexdata,makingiteasier
与顾客在一起，每一次变化都是新机会（1.25）胡同学的读书笔记
1.新媒体创业，本身如何商业变现是难题，成功的探索往往意在画外，不靠媒体本身赚广告费的小钱，而是转型电商、自研产品、强化服务、布局新零售。2GH教条里这句「fakeituntilyoumakeit」本无甚大错。问题是当下太多人沉溺于「fake」，却忽略了付诸「make」。3近日重读《Principles》思考自己快速上手领域学习曲线最快的方法有哪些，发现其中一条是「观摩他人的失败集锦」。4天大的事
CS110Principles of Computer Science D285A3 空间计算
Hybrid:Aremotelecturemaybecombinedwithanin-personrecitation(bothforpracticalities,socialdistancing,andabalancebetweensafetyandmaintainingthetraditionalundergraduateexperience)LECTURES:Newmaterialispre
墨者学院13 Apache Struts2远程代码执行漏洞(S2-016)复现梅头脑_ #墨者学院 web安全 struts apache
问题描述题目链接：ApacheStruts2远程代码执行漏洞(S2-016)复现Don'ttalkaboutanyprograms,structures,algorithms,principles;Iwillcopy,paste,download,start,abuttononGetshelltoshowyou!啊我太喜欢这句话啦，又菜又叼，一会儿我要设置成自己的个性签名哈哈哈哈！解决方案：工具：
2018-10-01 泥巴叔叔
1.Senseofstyle2.Principles3.解忧杂货铺上个月没读完的完成4.Shoedog5.Nothingtoenvy6.Readyplayerone感觉有难度啊，加油！
60/100 Principles阅读记录边安
0504-《Principles》-1h-边安今天阅读的部分有关于“进化”。在作者看来，“Evolvingislife'sgreatestaccomplishmentanditsgreatestreward"。作者提到，很多事情只不过是曾经发生过的事情的重复。所以作者建议形成自己的Principles/machine，这样通过一次次的痛苦和反思形成自己的算法，从而取得进步。
彩色成像的基础和应用原理 Principles（一）学习！！！图形渲染
下面我将不定期尽可能出一系列（我觉的非常好）翻译的文章来解释颜色这们学科。【下图为此次翻译的书籍封面】Introduction:颜色是一种与光的物理学，物质的化学，物体的几何特性以及人类视觉感知和认知有关的现象。我们可以将阳光称为黄色，在这种情况下，我们称光为一种属性。汽车可以被涂成红色，在这种情况下，红色是汽车的一个属性。当光线进入眼睛时，一系列复杂的事件会导致颜色的感觉。最后，颜色可能会被记住
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts