最近几年Lambda表达式风靡于编程界。很多现代编程语言都把它作为函数式编程的基本组成部分。基于JVM的编程语言如Scala、Groovy及Clojure把它作为关键部分集成在语言中。而如今,(最终)Java 8也加入了这个有趣的行列。
Lambda表达式最有意思的地方在于,在JVM的角度来看它是完全不可见的。在JVM中没有匿名函数或Lambda表达式的概念。JVM唯一知道是字节码。字节码是一个严格的OO规范。由语言的创造者和编译者通过这些限制来创建新的、高级的语言元素。
我们第一次遇到Lambda表达式是需要在Takipi中增加对Scala的支持,所以不得不深入了解Scala的编译器。而这时Java 8也正处在关键时刻。我猜想Scala和Java编译器对Lambda表达式的实现肯定会非常有趣。结果让我极为惊讶。
为了演示这些内容,我写了一个简单的Lambda表达式,功能是将一个字符串列表转换为它们长度的列表。
Java:
List names = Arrays.asList("1", "2", "3");
Stream lengths = names.stream().map(name -> name.length());
Scala:
val names = List("1", "2", "3")
val lengths = names.map(name => name.length)
不要被它表面的简单所迷惑,后面执行了相当复杂的过程。
我们从Scala开始
代码
我使用 javap 来查看通过Scala编译器生成的.class文件的字节码的内容。让我们看一下字节码的结果(这才是JVM真正执行的内容)。
//将变量名加载到栈中(JVM视为变量#2),先保存在这,之后会在map函数中用到
aload_2
接下来的事情就变得更有趣了,一个由编译器生成的synthetic的实例创建并初始化(译者注:Synthetic类是指由JVM运行时生成的类)。非常有意思的是,Lambda作为整个方法的一部分来定义的,但它实际上完全存在于我们类的外部。
new myLambdas/Lambda1$$anonfun$1 //实例化Lambda对象
dup //把它加入栈中
//最后,调用构造函数.记住,这是源自JVM的一个简单对象
invokespecial myLambdas/Lambda1$$anonfun$1/()V
//这个两行加载immutable.List CanBuildFrom工厂,该工厂能生成新的list。工厂模式是Scala的集合架构的一部分。
getstatic scala/collection/immutable/List$/MODULE$
Lscala/collection/immutable/List$;
invokevirtual scala/collection/immutable/List$/canBuildFrom()
Lscala/collection/generic/CanBuildFrom;
//现在,栈上已经有了Lambda对象及工厂,下一阶段就可以调用map函数。
//你应该还记得,我们在一开始的时候将名称变量加载到了栈中。我们现在可以用它来实现map方法的调用了。
//map方法接受一个Lambda对象和一个工厂,生成一个长度的list。
invokevirtual scala/collection/immutable/List/map(Lscala/Function1;
Lscala/collection/generic/CanBuildFrom;)Ljava/lang/Object;
但是请稍等,Lambda对象内部做了什么事情?
Lambda对象
Lambda类来继承自scala.runtime.AbstractFunction1。通过这种方式,map() 函数可以多态调用重写后的 apply() 方法,apply()代码如下:
//这段代码是加载this及目标对象,检测它是不是一个字符串,然后调用另一个重载后的、真正工作的apply方法,最后包装返回结果
aload_0//加载this
aload_1//加载字符串参数
checkcast java/lang/String//确保是一个字符串 - 得到一个Object
// 调用synthetic类的apply()方法
invokevirtual myLambdas/Lambda1$$anonfun$1/apply(Ljava/lang/String;)I
//包装结果
invokestatic scala/runtime/BoxesRunTime/boxToInteger(I)Ljava/lang/Integer
areturn
真正的执行.length() 操作的代码嵌套在另个一apply方法中,该方法正如我们期望的一样,简单的返回了字符串的长度。
唷……,走了好长的一段路才到这。
aload_1
invokevirtual java/lang/String/length()I
ireturn
我们在上面只是写了一行简单的代码,但是却产生了许多的字节码,包括一个额外的类和一堆方法。但是,这绝不是在劝阻我们不要用Lambda(我们是在Scala中写代码,而不是C)。这仅仅是为了展示这种结构后面的复杂性。
我相当期待Java 8也是用这种方式实现的,但是令人惊讶的时,java采取了完全不同的方式。
Java 8:一种新的方式
Java 8产生的字节码比较短,但是还有更令人惊讶的东西。它刚开始简单的加载了名称变量,然后调用 stream() 方法,但是接下做了一些非常好的优化。它没有创建一个新的对象来包装Lambda函数,而是使用了新的 invokeDynamic 指令,该指令是Java 7时增加的,这个地方的用于调用真实的Lambda函数。
aload_1 // 加载名称变量
//调用stream()方法
invokeinterface java/util/List.stream:()Ljava/util/stream/Stream;
//invokeDynamic指令魔法!
invokedynamic #0:apply:()Ljava/util/function/Function;
//调用map()方法
invokeinterface java/util/stream/Stream.map:
(Ljava/util/function/Function;)Ljava/util/stream/Stream;
InvokeDynamic魔法:这条JVM指令在Java 7中增加,用于减少JVM的限制,允许动态语言在运行时绑定符号。而在这之前,所有的链接都是静态的,在代码编译的时候就由JVM完成。
动态链接:如果你看过invokedynamic指令,你会发现没有引用指向真正的Lambda函数(即lambda$0)。答案归结于invokedynamic指令的设计,但是更简短的答案是Lambda表达式的签名,就我们的例子来说是
//一个名为lamda$0的函数,获取一个字符串,返回一个整数
lambdas/Lambda1.lambda$0:(Ljava/lang/String;)Ljava/lang/Integer;
存储在.class的一个单独的表中,该表作为#0参数传递给指令。这个新的表确实改变了字节码规范的结构,这是多年之后的第一次改变,这同样需要采取Takipi的错误分析引擎。
Lambda代码
这段代码是真正的Lambda表达式。非常容易,简单地加载字符串参数,调用length()方法并包装成结果。请注意,它是编译成了一个静态函数,避免像之前看到的Scala一样,传入额外的this对象。
aload_0
invokevirtual java/lang/String.length:()
invokestatic java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
areturn
这是invokedynamic方式的另一个优点,它允许我们通过多态的方式来调用 map() 函数,且不需要包装对象或调用虚拟的的重写方法。非常酷!
总结
Java看起非常具有吸引力,最“严格”的现代语言现在开始使用动态链接来增加Lambda表达式的功能。该方式也是非常有效的一种方式,不需要加载和编译额外的类,Lambda方法只是我们类中一个简单的私有方法。
Java 8确实对Java 7引入的新的技术做了很多优化,使用了非常直接的方式实现了对Lambda表达式的支持。非常高兴能看到像Java这样“端庄”的女士能教我们一些戏法。