scala java8_λ表达式之争:Scala vs Java8

最近几年Lambda表达式风靡于编程界。很多现代编程语言都把它作为函数式编程的基本组成部分。基于JVM的编程语言如Scala、Groovy及Clojure把它作为关键部分集成在语言中。而如今,(最终)Java 8也加入了这个有趣的行列。

Lambda表达式最有意思的地方在于,在JVM的角度来看它是完全不可见的。在JVM中没有匿名函数或Lambda表达式的概念。JVM唯一知道是字节码。字节码是一个严格的OO规范。由语言的创造者和编译者通过这些限制来创建新的、高级的语言元素。

我们第一次遇到Lambda表达式是需要在Takipi中增加对Scala的支持,所以不得不深入了解Scala的编译器。而这时Java 8也正处在关键时刻。我猜想Scala和Java编译器对Lambda表达式的实现肯定会非常有趣。结果让我极为惊讶。

为了演示这些内容,我写了一个简单的Lambda表达式,功能是将一个字符串列表转换为它们长度的列表。

Java:

List names = Arrays.asList("1", "2", "3");

Stream lengths = names.stream().map(name -> name.length());

Scala:

val names = List("1", "2", "3")

val lengths = names.map(name => name.length)

不要被它表面的简单所迷惑,后面执行了相当复杂的过程。

我们从Scala开始

0818b9ca8b590ca3270a3433284dd417.png

代码

我使用 javap 来查看通过Scala编译器生成的.class文件的字节码的内容。让我们看一下字节码的结果(这才是JVM真正执行的内容)。

//将变量名加载到栈中(JVM视为变量#2),先保存在这,之后会在map函数中用到

aload_2

接下来的事情就变得更有趣了,一个由编译器生成的synthetic的实例创建并初始化(译者注:Synthetic类是指由JVM运行时生成的类)。非常有意思的是,Lambda作为整个方法的一部分来定义的,但它实际上完全存在于我们类的外部。

new myLambdas/Lambda1$$anonfun$1 //实例化Lambda对象

dup //把它加入栈中

//最后,调用构造函数.记住,这是源自JVM的一个简单对象

invokespecial myLambdas/Lambda1$$anonfun$1/()V

//这个两行加载immutable.List CanBuildFrom工厂,该工厂能生成新的list。工厂模式是Scala的集合架构的一部分。

getstatic scala/collection/immutable/List$/MODULE$

Lscala/collection/immutable/List$;

invokevirtual scala/collection/immutable/List$/canBuildFrom()

Lscala/collection/generic/CanBuildFrom;

//现在,栈上已经有了Lambda对象及工厂,下一阶段就可以调用map函数。

//你应该还记得,我们在一开始的时候将名称变量加载到了栈中。我们现在可以用它来实现map方法的调用了。

//map方法接受一个Lambda对象和一个工厂,生成一个长度的list。

invokevirtual scala/collection/immutable/List/map(Lscala/Function1;

Lscala/collection/generic/CanBuildFrom;)Ljava/lang/Object;

但是请稍等,Lambda对象内部做了什么事情?

Lambda对象

Lambda类来继承自scala.runtime.AbstractFunction1。通过这种方式,map() 函数可以多态调用重写后的 apply() 方法,apply()代码如下:

//这段代码是加载this及目标对象,检测它是不是一个字符串,然后调用另一个重载后的、真正工作的apply方法,最后包装返回结果

aload_0//加载this

aload_1//加载字符串参数

checkcast java/lang/String//确保是一个字符串 - 得到一个Object

// 调用synthetic类的apply()方法

invokevirtual myLambdas/Lambda1$$anonfun$1/apply(Ljava/lang/String;)I

//包装结果

invokestatic scala/runtime/BoxesRunTime/boxToInteger(I)Ljava/lang/Integer

areturn

真正的执行.length() 操作的代码嵌套在另个一apply方法中,该方法正如我们期望的一样,简单的返回了字符串的长度。

唷……,走了好长的一段路才到这。

aload_1

invokevirtual java/lang/String/length()I

ireturn

我们在上面只是写了一行简单的代码,但是却产生了许多的字节码,包括一个额外的类和一堆方法。但是,这绝不是在劝阻我们不要用Lambda(我们是在Scala中写代码,而不是C)。这仅仅是为了展示这种结构后面的复杂性。

我相当期待Java 8也是用这种方式实现的,但是令人惊讶的时,java采取了完全不同的方式。

Java 8:一种新的方式

Java 8产生的字节码比较短,但是还有更令人惊讶的东西。它刚开始简单的加载了名称变量,然后调用 stream() 方法,但是接下做了一些非常好的优化。它没有创建一个新的对象来包装Lambda函数,而是使用了新的 invokeDynamic 指令,该指令是Java 7时增加的,这个地方的用于调用真实的Lambda函数。

aload_1 // 加载名称变量

//调用stream()方法

invokeinterface java/util/List.stream:()Ljava/util/stream/Stream;

//invokeDynamic指令魔法!

invokedynamic #0:apply:()Ljava/util/function/Function;

//调用map()方法

invokeinterface java/util/stream/Stream.map:

(Ljava/util/function/Function;)Ljava/util/stream/Stream;

InvokeDynamic魔法:这条JVM指令在Java 7中增加,用于减少JVM的限制,允许动态语言在运行时绑定符号。而在这之前,所有的链接都是静态的,在代码编译的时候就由JVM完成。

动态链接:如果你看过invokedynamic指令,你会发现没有引用指向真正的Lambda函数(即lambda$0)。答案归结于invokedynamic指令的设计,但是更简短的答案是Lambda表达式的签名,就我们的例子来说是

//一个名为lamda$0的函数,获取一个字符串,返回一个整数

lambdas/Lambda1.lambda$0:(Ljava/lang/String;)Ljava/lang/Integer;

存储在.class的一个单独的表中,该表作为#0参数传递给指令。这个新的表确实改变了字节码规范的结构,这是多年之后的第一次改变,这同样需要采取Takipi的错误分析引擎。

Lambda代码

这段代码是真正的Lambda表达式。非常容易,简单地加载字符串参数,调用length()方法并包装成结果。请注意,它是编译成了一个静态函数,避免像之前看到的Scala一样,传入额外的this对象。

aload_0

invokevirtual java/lang/String.length:()

invokestatic java/lang/Integer.valueOf:(I)Ljava/lang/Integer;

areturn

这是invokedynamic方式的另一个优点,它允许我们通过多态的方式来调用 map() 函数,且不需要包装对象或调用虚拟的的重写方法。非常酷!

总结

Java看起非常具有吸引力,最“严格”的现代语言现在开始使用动态链接来增加Lambda表达式的功能。该方式也是非常有效的一种方式,不需要加载和编译额外的类,Lambda方法只是我们类中一个简单的私有方法。

Java 8确实对Java 7引入的新的技术做了很多优化,使用了非常直接的方式实现了对Lambda表达式的支持。非常高兴能看到像Java这样“端庄”的女士能教我们一些戏法。

你可能感兴趣的:(scala,java8)