手拉手教你实现一门编程语言 Enkel, 系列 18

本文系 Creating JVM language 翻译的第 18 篇。
原文中的代码和原文有不一致的地方均在新的代码仓库中更正过,建议参考新的代码仓库。

源码

Github

语法

语法规则和 Java 非常类似,但是更加简单,没有复杂的修饰符(比如 static, volatile, transient)。

Fields {

    int field

    start {
        field = 5
        print field
    }
}

语法规则更改

在本篇之前我们只能在类中定义方法,现在我们开启定义字段的大门吧:

classBody :  field* function* ;
field : type name;

赋值语句:

assignment : name EQUALS expression;

为何这么久都没实现赋值语句

字段用来赋值,但是这么久以来我们一直没有实现赋值语句来给声明的变量赋值,我这么做是因为有以下考量。

我希望变量是不可变的,赋值意味着改变状态,这会导致许多问题,比如同步,副作用,还有内存泄漏。

比如有如下的 Java 代码:

Stuff trustMeIWontModifyYourArg(SomeObject arg) {
    ... 999 lines of code 
    arg = null; //or some other nasty hidden stuff
    ...another 999 lines of code
}

通过方法签名,我们可能理所当然的想,方法会修改参数吗,他没有 final 修饰,但是大多数 Java 程序员会忽略。仅仅通过名字判断出来方法不会修改变量,那我们就用他吧。

过了两个小时后,出现了 NullPointerException,方法还是修改了参数。

如果方法没有副作用,那么可以很方便的实现并发而不用担心同步的问题,这种方法没有状态,也没有副作用,实现避免副作用方法最简单的办法就是尽可能的使用常量。

生成字节码

声明字段

使用 ASM 的 visitField 来声明字段。它添加字段到 fields[],fields_count 会自动增加计数器。

public class FieldGenerator {

    private final ClassWriter classWriter;

    public FieldGenerator(ClassWriter classWriter) {
        this.classWriter = classWriter;
    }

    public void generate(Field field) {
        String name = field.getName();
        String descriptor = field.getType().getDescriptor();
        FieldVisitor fieldVisitor = classWriter.visitField(Opcodes.ACC_PUBLIC, name,descriptor, null, null);
        fieldVisitor.visitEnd();
    }
}

读取字段

读取字段,你需要:

  • 字段名
  • 字段类型修饰符
  • 持有者的全限定名
public class ReferenceExpressionGenerator {

     //constructor and fields

    public void generate(FieldReference fieldReference) {
        String varName = fieldReference.geName();
        Type type = fieldReference.getType();
        String ownerInternalName = fieldReference.getOwnerInternalName();
        String descriptor = type.getDescriptor();
        methodVisitor.visitVarInsn(Opcodes.ALOAD,0);
        methodVisitor.visitFieldInsn(Opcodes.GETFIELD, ownerInternalName,varName,descriptor);
    }
}
  • ALOAD, 0 获得 this ,也就是局部变量索引值为 0 的值。在 非 static 语境中,this 默认都会在索引为 0 的位置。
  • GETFIELD 读取变量的指令

赋值

public class AssignmentStatementGenerator {

    //constructor and fields
    
    public void generate(Assignment assignment) {
        String varName = assignment.getVarName();
        Expression expression = assignment.getExpression();
        Type type = expression.getType();
        if(scope.isLocalVariableExists(varName)) {
            int index = scope.getLocalVariableIndex(varName);
            methodVisitor.visitVarInsn(type.getStoreVariableOpcode(), index);
            return;
        }
        Field field = scope.getField(varName);
        String descriptor = field.getType().getDescriptor();
        methodVisitor.visitVarInsn(Opcodes.ALOAD,0);
        expression.accept(expressionGenerator);
        methodVisitor.visitFieldInsn(Opcodes.PUTFIELD,field.getOwnerInternalName(),field.getName(),descriptor);
    }

如果局部变量和字段名字冲突了,那么局部变量有更高的优先级。

PUTFIELD 和 GETFIELD 相似,但是会出栈顶数据,表达式的值会被赋值到变量

示例

如下 Enkel 文件

Fields {

    int field

    start {
        field = 5
        print field
    }
}

生成字节码如下:

public class Fields {
  public int field;

  public void start();
    Code:           
       0: aload_0               //get "this"
       1: ldc           #9      // load constant "5" from constant pool 
       3: putfield      #11     // Field field:I - pop 5 off the stack and write to field
       6: getstatic     #17     // Field java/lang/System.out:Ljava/io/PrintStream; 
       9: aload_0               //get "this" reference
      10: getfield      #11     // Field field:I
      13: invokevirtual #22     // Method "Ljava/io/PrintStream;".println:(I)V
      16: return

 //autogenerated constructor and main method
}

你可能感兴趣的:(手拉手教你实现一门编程语言 Enkel, 系列 18)