首先是语义分析的任务:
(1)审查每一个语法结构的静态语义,即验证语法正确的结构是否有意义。
如:赋值语句:x:=x+y,左边变量类型与右边变量类型是否一致。
(2)在语义正确的基础上生成一种中间代码或目标代码。
语义分析的范围
1.确定类型:确定标识符所关联的数据类型。
2.类型检查:按语言的类型规则,检查运算的合法性与运算分量类型的一致性,必要时作类型转换。
3.识别含义:根据语言的语义定义(形式或非形式),识别程序中各构造成分组合到一起的含义,并作相应的语义处理(生成中间代码或目标代码)。
4.控制流检查:控制流语句必须转移到合法的地方。如C中,break语句规定跳出最内层的循环或switch语句。
5.一致性检查:在很多场合要求对象只能被说明一次。如:pascal语言规定同一个标识符在一个分程序中只能被说明一次等。
6.相关名字检查:如:Ada,循环或块可以有一个名字,它出现在这些结构的开头或结尾。编译程序必须检查这两个地方用的名字是否相同。
其它:如名字的作用域分析等也是语义分析的工作。
一、逆波兰表示法
波兰表示是一种既不须考虑优先关系、又不用括号的一种表示表达式的方法(前缀式)。
现在我们要介绍的刚好是另一种波兰表示形式,称为后缀式,即运算符在后。
例: a+b → ab+
a*(b+c) → abc+*
-a+b*c → a@bc*+
二、图表示法
抽象语法树。
无循环有向图(DAG)
DAG与抽象语法树基本上一样,对表达式中的每个子表达式,DAG中都有一个结点。一个内部结点表示一个操作符,它的孩子表示操作数。
两者所不同的是,在一个DAG中代表公共子表达式的结点具有多个父结点,而在一棵抽象语法树中公共子表达式被表示为重复的子树。如下例:
.间接三元式
在三元式的基础上附加一张指示器表─间接码表,按运算的先后顺序列出有关三元式在三元式表中的位置。这种表示方法称为间接三元式。
四、四元式
一个四元式是一个带有四个域的记录结构:op,arg1,arg2及result。它实际上就是一条三地址的指令。
一、说明语句的翻译
程序语言中的说明语句都是给编译程序提供信息的,诸如类型、维数、每维的界种类等,因此一般不生成目标,只是在编译时把有关信息填入相应表格即可。
*为局部名字建立符号表条目
为它分配存储单元
符号表中包含名字的类型和分配给它的存储单元的相对地址等信息*
1.简单说明句:用一个基本字来定义一串名字
二、赋值语句的翻译
1.简单算术表达式的赋值语句:
所谓简单指不考虑数组元素、记录、函数的引用等情况。
如何翻译?假如所有分量都是相同类型的情况,如都是整型。可用如下的 二义文法来进行描述:
S→id:=E
E→E1+E2∣E1*E2∣(E1)∣-E1∣id
三、控制流语句的翻译
可以仿照算术表达式的翻译来进行。
例如 A∨B∧C=D可翻译成如下四元式序列:
(=,C,D,T1)
(∧,B,T1,T2)
(∨,A,T2,T3)
但是对于控制语句中的条件表达式,我们还必须结合控制语句作进一步的分析。
—–1. 条件语句中布尔表达式的翻译
出现在条件语句if E then S1 else S2
中的布尔表达式E,它的作用仅在于控制对S1或S2的选择,亦即提供“真”“假”出口,所以其值无需一直保留。
——-2.标号和无条件转移的翻译
(1)对于说明性出现的标号,很容易处理:
L: S
当这种语句被处理之后,标号L被称为“定义了”的。也就是,在符号表中,标号L的“地址”栏将登记上语句S的第一个四元式的地址(编号)。
(2)对于先定义后应用的无条件转移(向后转移的goto L ),也很容易处理。对L查表得到它的定义地址p,就可生成goto L的四元式(j,–,–,p)。
——-3.循环与分情况语句的翻译
(1)循环语句
大多数程序语言中都有如下形式的循环句:
S→for i:=E1 step E2 until E3 do S1
其语义各语言可能有所不同,主要区别在先判断、后执行还是先执行、后判断
———(2)分情况语句
各种语言的分支语句不尽相同(case,switch等),这里我们假定其形式为左下所示:
四、过程调用的翻译
1. 过程调用主要解决两个问题:
(1)把程序控制转移到子程序(过程段),执行完毕再返回。这个问题很好解决。
(2)传递实在参数。我们前面谈到过几种不同的参数传递方式(传名、传值、传地址),它们的语义动作也就有所区别。