java开发C语言编译器:把C实现的快速排序算法编译成jvm字节码

有了前面一系列的铺垫和准备后,我们终于能走到至关重要的一刻。在本节,我们将用C语言开发快速排序算法,然后利用我们的编译器把它编译成java字节码,让C语言编写的快速排序算法能在java虚拟机上顺利执行,完成本节内容后,编译器可以正确的将下列代码编译成java字节码:


void quicksort(int A[10], int p, int r) {
    int x;
    int i;
    i = p - 1;
    int j;
    int t;
    int v;
    v = r - 1;
    if (p < r) {
       x = A[r];

        for (j = p; j <= v; j++) {
            if (A[j] <= x) {  
                 i++;
                 t = A[i];
                 A[i] = A[j];
                 A[j] = t; 
            }
        }

        v = i + 1;
        t = A[v];
        A[v] = A[r];
        A[r] = t;

         t = v - 1;
         quicksort(A, p,  t);
         t = v + 1;
         quicksort(A, t,  r);
    } 

}


void main () {
    int a[10];
    int i;
    int t;
    printf("before quick sort:");
    for(i = 0; i < 10; i++) {
        t = (10 - i);
        a[i] = t;
        printf("value of a[%d] is %d", i, a[i]);
    }   


    quicksort(a, 0, 9);

    printf("after quick sort:");
    for (i = 0; i < 10; i++) {
        printf("value of a[%d] is %d", i, a[i]);
    }

}

上面的C代码是根据《算法导论》所编写的实现快速排序的算法,主函数先初始化一个乱序的数组,然后通过调用quicksort函数实现排序。我一直把编译器能够解释编译C语言快速排序的代码作为章节的终点,一来快速排序算法的实现包含了循环,ifelse分支判断,递归等编程语言的关键要素,能正确解释和编译它意味着编译器达到了一定的成熟度。而本节完成后,我们的编译器能正确编译快速排序的C语言实现后,整个编译器实现课程经历两年时光,也该画上句号了。

我们看看代码的实现,这次代码与前面代码的一大不同之处就是函数的递归调用。quicksort函数中会调用它自己,因此编译器在实现时,需要注意这个特点。原来我们实现函数的编译时,编译器会解读代码,直到函数第一次被调用时,才会把被调函数编译成字节码,但这里,被调函数在执行时会调用它自己,如果对原来的逻辑不加处理,那么编译器会反复的为quicksort函数生成代码,陷入到一种死循环的状态。负责函数调用的代码处于UnaryNodeExecutor中,代码修改如下:

case CGrammarInitializer.Unary_LP_RP_TO_Unary:
        case CGrammarInitializer.Unary_LP_ARGS_RP_TO_Unary:
            //先获得函数名
            boolean reEntry = false;
            String funcName = (String)root.getChildren().get(0).getAttribute(ICodeKey.TEXT);
            //change here
            /*
             * 如果函数名被记录过,那表明现在的函数调用其实是递归调用
             */
            if (funcName != "" && funcName.equals(BaseExecutor.funcName)) {
                reEntry = true;
            }


            ArrayList argList = null;
            ArrayList symList = null;

            if (production == CGrammarInitializer.Unary_LP_ARGS_RP_TO_Unary) {
                ICodeNode argsNode = root.getChildren().get(1);
                argList = (ArrayList)argsNode.getAttribute(ICodeKey.VALUE);
                symList = (ArrayList)argsNode.getAttribute(ICodeKey.SYMBOL);
                FunctionArgumentList.getFunctionArgumentList().setFuncArgList(argList); 
                FunctionArgumentList.getFunctionArgumentList().setFuncArgSymbolList(symList);
            }

            //找到函数执行树头节点
            ICodeNode func = CodeTreeBuilder.getCodeTreeBuilder().getFunctionNodeByName(funcName);
            if (func != null) {
                //change here push parameters before calling function 
                /*
                 * 函数调用时,把当前被调用的函数名记录下来,如果函数体内发送递归调用,那么编译器还会再次进入到
                 * 这里,如果进入时判断到函数名跟我们这里存储的函数名一致,那表明发生了递归调用。
                 */
                BaseExecutor.funcName = funcName;
                int count = 0;
                while (count < argList.size()) {
                    Object objVal = argList.get(count);
                    Object objSym = symList.get(count);
                    if (objSym != null) {
                        Symbol param = (Symbol)objSym;
                        int idx = generator.getLocalVariableIndex(param);
                        if (param.getDeclarator(Declarator.ARRAY) != null) {
                            generator.emit(Instruction.ALOAD, "" + idx);
                        } else {
                            generator.emit(Instruction.ILOAD, ""+idx);
                        }
                    } else {
                        int v = (int)objVal;
                        generator.emit(Instruction.SIPUSH, ""+v);
                    }

                    count++;
                }
                //problem here handle reentry
                if (BaseExecutor.isCompileMode == true && reEntry == false) {
                    /*
                     * 在编译状态下,遇到函数自我递归调用则不需要再次为函数生成代码,只需要生成invoke指令即可
                     */
                    Executor executor = ExecutorFactory.getExecutorFactory().getExecutor(func);
                    ProgramGenerator.getInstance().setInstructionBuffered(true);
                    executor.Execute(func);
                    symbol = (Symbol)root.getChildren().get(0).getAttribute(ICodeKey.SYMBOL);
                    emitReturnInstruction(symbol);
                    ProgramGenerator.getInstance().emitDirective(Directive.END_METHOD);
                    ProgramGenerator.getInstance().setInstructionBuffered(false);
                    ProgramGenerator.getInstance().popFuncName();
                }
                compileFunctionCall(funcName);


                Object returnVal = func.getAttribute(ICodeKey.VALUE);
                if (returnVal != null) {
                    System.out.println("function call with name " + funcName + " has return value that is " + returnVal.toString());
                    root.setAttribute(ICodeKey.VALUE, returnVal);
                }

            } else {
                ClibCall libCall = ClibCall.getInstance();
                if (libCall.isAPICall(funcName)) {
                    Object obj = libCall.invokeAPI(funcName);
                    root.setAttribute(ICodeKey.VALUE, obj);
                } 
            }


            break; 
  

当编译器解析到代码中发生函数调用时,它会把被调函数的名字记录下来,然后判断这个名字是否被记录过,如果前面有过记录,那么这次进入表明函数发生了递归调用,于是就不再执行函数对应的执行树,如果函数是第一次被调用,那么就执行函数对应的执行树,在执行过程中就可以把函数编译成字节码。

除了上面的改动之后,还有不少地方需要相应的修改,具体的调试演示过程请参看视频用java开发C语言编译器。上面代码完成后,运行编译器,给定的C语言代码编译出的java汇编代码如下:

.class public CSourceToJava
.super java/lang/Object

.method public static main([Ljava/lang/String;)V
    sipush  10
    newarray    int
    astore  1
    sipush  0
    istore  2
    sipush  0
    istore  0
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    ldc "before quick sort:"
    invokevirtual   java/io/PrintStream/print(Ljava/lang/String;)V
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    ldc "
"
    invokevirtual   java/io/PrintStream/print(Ljava/lang/String;)V
    sipush  0
    istore  2

loop0:
    iload   2
    sipush  10
if_icmpge branch0
    sipush  10
    iload   2
    isub
    istore  0
    aload   1
    iload   2
    iload   0
    iastore
    aload   1
    iload   2
    iaload
    istore  3
    iload   2
    istore  4
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    ldc "value of a["
    invokevirtual   java/io/PrintStream/print(Ljava/lang/String;)V
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    iload   4
    invokevirtual   java/io/PrintStream/print(I)V
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    ldc "] is "
    invokevirtual   java/io/PrintStream/print(Ljava/lang/String;)V
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    iload   3
    invokevirtual   java/io/PrintStream/print(I)V
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    ldc "
"
    invokevirtual   java/io/PrintStream/print(Ljava/lang/String;)V
    iload   2
    sipush  1
    iadd
    istore  2
goto loop0
branch0:
    aload   1
    sipush  0
    sipush  9
    invokestatic    CSourceToJava/quicksort([III)V
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    ldc "after quick sort:"
    invokevirtual   java/io/PrintStream/print(Ljava/lang/String;)V
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    ldc "
"
    invokevirtual   java/io/PrintStream/print(Ljava/lang/String;)V
    sipush  0
    istore  2

loop2:
    iload   2
    sipush  10
if_icmpge branch4
    aload   1
    iload   2
    iaload
    istore  3
    iload   2
    istore  4
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    ldc "value of a["
    invokevirtual   java/io/PrintStream/print(Ljava/lang/String;)V
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    iload   4
    invokevirtual   java/io/PrintStream/print(I)V
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    ldc "] is "
    invokevirtual   java/io/PrintStream/print(Ljava/lang/String;)V
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    iload   3
    invokevirtual   java/io/PrintStream/print(I)V
    getstatic   java/lang/System/out Ljava/io/PrintStream;
    ldc "
"
    invokevirtual   java/io/PrintStream/print(Ljava/lang/String;)V
    iload   2
    sipush  1
    iadd
    istore  2
goto loop2
branch4:
    return
.end method
.method public static quicksort([III)V
    sipush  0
    istore  7
    sipush  0
    istore  6
    iload   1
    sipush  1
    isub
    istore  6
    sipush  0
    istore  5
    sipush  0
    istore  4
    sipush  0
    istore  3
    iload   2
    sipush  1
    isub
    istore  3
    iload   1
    iload   2
if_icmpge branch1

    aload   0
    iload   2
    iaload
    istore  7
    iload   1
    istore  5

loop1:

    iload   5
    iload   3
if_icmpgt ibranch1

    aload   0
    iload   5
    iaload
    iload   7
if_icmpgt ibranch2

    iload   6
    sipush  1
    iadd
    istore  6
    aload   0
    iload   6
    iaload
    istore  4
    aload   0
    iload   6
    aload   0
    iload   5
    iaload
    iastore
    aload   0
    iload   5
    iload   4
    iastore
ibranch2:

    iload   5
    sipush  1
    iadd
    istore  5
goto loop1

ibranch1:

    iload   6
    sipush  1
    iadd
    istore  3
    aload   0
    iload   3
    iaload
    istore  4
    aload   0
    iload   3
    aload   0
    iload   2
    iaload
    iastore
    aload   0
    iload   2
    iload   4
    iastore
    iload   3
    sipush  1
    isub
    istore  4
    aload   0
    iload   1
    iload   4
    invokestatic    CSourceToJava/quicksort([III)V
    iload   3
    sipush  1
    iadd
    istore  4
    aload   0
    iload   4
    iload   2
    invokestatic    CSourceToJava/quicksort([III)V
branch1:

    return
.end method

.end class

上面的代码转换成jvm字节码运行后结果如下:
java开发C语言编译器:把C实现的快速排序算法编译成jvm字节码_第1张图片

编译原理几乎是计算机专业中最晦涩难懂的课程。很多学生学这门课只不过是为了通过考试,学完后对编译原理之精妙仍然是摸不着头脑。而很多教这门课的老师,也只不过是混口饭吃,他自己未必对编译原理有多少深入的了解和把握,于是与其昏昏,使人昭昭。毕业多年后,回过头来反省我所承受的教育,我发现我们的教育总是流于表面的肤浅,给学生展示的始终是冰山的一角,对冰山下的巨大形体去置若罔闻,于是整个系统虽然培养出大量的计算机专业人员,但有能力对计算机知识具备深入见解的人凤毛麟角,很多人其实是走上工作岗位后,通过大量的生产实践才开始对计算机知识有了一定程度的深入窥探的,我就是其中之一。

计算机始终是一门理论结合实践的科学。光有理论却不能实践,那么理论看起来晦涩难懂,听起来虚儿巴脑,于是美妙的智慧结晶在应试教育体制下变成了虚张声势的怪兽,让学习它的人惊恐不慌,以为自己要被这只巨大的怪兽所吞灭。我是过来人,知道这种关说不练假把式的巨大危害,那种理论讲起来头头是道,搞得我晕头转向,处处受挫的煎熬感真是不忍回忆,我真心希望通过动手实践,能够让那些有志于在科技行业大展身手的年轻人不要再走我的老路。

如果人类只会谈情说爱,那么早就灭绝了。因此爱的核心在做不在说,科学技术的理解和掌握更是如此,动手吧!Just Fuck It!

更多技术信息,包括操作系统,编译器,面试算法,机器学习,人工智能,请关照我的公众号:
这里写图片描述

你可能感兴趣的:(编译原理,算法)