一、语义分析的任务
1.审查每一个语法结构的静态语义,即验证语法正确的结构是否有意义。
如:赋值语句:x:=x+y,左边变量类型与右边变量类型是否一致。
2.在语义正确的基础上生成一种中间代码或目标代码。
二、语义分析的范围
1.确定类型:确定标识符所关联的数据类型。
2.类型检查:按语言的类型规则,检查运算的合法性与运算分量类型的一致性,必要时作类型转换。
3.识别含义:根据语言的语义定义(形式或非形式),识别程序中各构造成分组合到一起的含义,并作相应的语义处理(生成中间代码或目标代码)。
4.控制流检查:控制流语句必须转移到合法的地方。如C中,break语句规定跳出最内层的循环或switch语句。
5.一致性检查:在很多场合要求对象只能被说明一次。如:pascal语言规定同一个标识符在一个分程序中只能被说明一次等。
6.相关名字检查:如:Ada,循环或块可以有一个名字,它出现在这些结构的开头或结尾。编译程序必须检查这两个地方用的名字是否相同。
其它:如名字的作用域分析等也是语义分析的工作。
三、语义描述工具和语义分析方法
1.语义描述工具
目前流行:用属性文法作为描述语义的工具。
2.语义分析方法
根据描述属性文法的语义规则的方式不同分为:
(1)语法制导定义
(2)翻译方案
3.语法制导翻译
所谓语法制导翻译是指:对文法中的每个产生式都附加上一个语义动作或语义子程序。伴随着语法分析,每当使用一条产生式进行推导或归约时,就执行相应产生式的语义动作(包括:查填表格,改变变量的求值,诊察与报告错误,生成中间代码等),从而完成预定的翻译工作。
四、几种常用的中间语言形式
1. 逆波兰表示法
波兰表示是一种既不须考虑优先关系、又不用括号的一种表示表达式的方法(前缀式)。
现在我们要介绍的刚好是另一种波兰表示形式,称为后缀式,即运算符在后。
2. 图表示法
抽象语法树。
无循环有向图(DAG)
DAG与抽象语法树基本上一样,对表达式中的每个子表达式,DAG中都有一个结点。一个内部结点表示一个操作符,它的孩子表示操作数。
两者所不同的是,在一个DAG中代表公共子表达式的结点具有多个父结点,而在一棵抽象语法树中公共子表达式被表示为重复的子树。
3.三元式
(1)三元式由三个部分组成:
算符:OP
第一运算分量:ARG1
第二运算分量:ARG2
(2)间接三元式
在三元式的基础上附加一张指示器表─间接码表,按运算的先后顺序列出有关三元式在三元式表中的位置。这种表示方法称为间接三元式。
4.四元式
一个四元式是一个带有四个域的记录结构:op,arg1,arg2及result。它实际上就是一条三地址的指令。
五、某些语句的四元式及翻译
1. 说明语句的翻译
程序语言中的说明语句都是给编译程序提供信息的,诸如类型、维数、每维的界种类等,因此一般不生成目标,只是在编译时把有关信息填入相应表格即可。
2. 赋值语句的翻译
1.简单算术表达式的赋值语句:
所谓简单指不考虑数组元素、记录、函数的引用等情况。
控制流语句的翻译
可以仿照算术表达式的翻译来进行。
例如 A∨B∧C=D可翻译成如下四元式序列:
(=,C,D,T1)
(∧,B,T1,T2)
(∨,A,T2,T3)
但是对于控制语句中的条件表达式,我们还必须结合控制语句作进一步的分析。
六、过程调用的翻译
1.过程调用主要解决两个问题:
(1)把程序控制转移到子程序(过程段),执行完毕再返回。这个问题很好解决。
(2)传递实在参数。我们前面谈到过几种不同的参数传递方式(传名、传值、传地址),它们的语义动作也就有所区别。
七、中间语言
• 语法树
• 后缀式
• 三地址代码表示
三地址语句的种类:
(1)赋值语句 x:=y op z,op为二目算术算符或逻辑算符;
(2)赋值语句 x:=op y ,op为一目算符,如一目减uminus、逻辑非not、移位算符及转换算符;
(3)无条件转移语句goto L;
(4)条件转移语句 if xrelop y goto L,关系运算符号relop(< ,=,>= 等等);
(5)复制语句 x:=y;
(6)过程调用语句 param x 和 call p, n ;
过程返回语句 return y;
(7)索引赋值 x:=y[i] 及 x[i] :=y ;
(8)地址和指针赋值 x=&y,x=* y 和 * x=y。
布尔表达式
用布尔运算符号(and,or,not)作用到布尔变量或关系表达式上而组成
布尔表达式的作用:
1. 用作计算逻辑值
2. 用作控制流语句如if-then,if-then-else和while-do等之中的条件表达式
控制流语句中的布尔表达式的翻译
回填
两遍扫描:
从给定的输入构造出一棵语法树;
对语法树按深度优先遍历,来进行语义分析。
一遍扫描:语法制导翻译技术是属于一遍扫描分析。
存在的问题: