最近使用lambda表达式,感觉使用起来非常舒服,箭头函数极大增强了代码的表达能力。于是决心花点时间深入地去研究一下java8的函数式。
(想自学习编程的小伙伴请搜索圈T社区,更多行业相关资讯更有行业相关免费视频教程。完全免费哦!)
先po一个最经典的例子——线程
public static void main(String[] args) {
// Java7
new Thread(new Runnable() {
@Override
public void run() {
for (int i = 0; i < 100; i++) {
System.out.println(i);
}
}
}).start();
// Java8
new Thread(() -> {
for (int i = 0; i < 100; i++) {
System.out.println(i);
}
}).start();
}
第一次接触lambda表达式是在创建线程时,比较直观的感受就是lambda表达式相当于匿名类的语法糖,emm~,真甜。不过事实上,lambda表达式并不是匿名类的语法糖,而且经过一段时间的使用,感觉恰恰相反,在使用上匿名类更像是Java中lambda表达式的载体。
下面的一些使用场景均为个人的一些体会,可能存在不当或遗漏之处。
上面的创建线程就是一个很好简化编码的例子,此处就不再重复。
在Java中,我们经常会遇到这样一种场景,某个方法只会在某处使用且内部逻辑也很简单,在Java8之前我们通常都会创建一个方法,但是事实上我们经常会发现这样写着写着,一个类中的方法可能会变得非常庞杂,严重影响阅读体验,进而影响编码效率。但是如果使用lambda表达式,那么这个问题就可以很容易就解决掉了。
一个简单的例子,如果我们需要在一个函数中多次打印时间。(这个例子可能有些牵强,但是实际上还是挺常遇见的)
public class FunctionMain {
public static void main(String[] args) {
TimeDemo timeDemo = new TimeDemo();
timeDemo.createTime = System.currentTimeMillis();
timeDemo.updateTime = System.currentTimeMillis() + 10000;
outputTimeDemo(timeDemo);
}
private static void outputTimeDemo(TimeDemo timeDemo) {
Function timestampToDate = timestamp -> {
DateFormat df = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
return df.format(new Date(timestamp));
};
System.out.println(timestampToDate.apply(timeDemo.createTime));
System.out.println(timestampToDate.apply(timeDemo.updateTime));
}
interface Function {
String apply(long timestamp);
}
}
class TimeDemo {
long createTime;
long updateTime;
}
在这段代码的outputTimeDemo中我们可以看到,对于时间戳转换的内容,我们并没有额外创建一个方法,而是类似于创建了一个变量来表达。不过,这个时候出现了另一个问题,虽然我们少创建了一个方法,但是我们却多创建了一个接口Function,总有种因小失大的感觉, 不过这个问题,我们在后面的java.util.function包部分可以找到答案。
一个比较常见的例子就是回调。
public static void main(String[] args) {
execute("hello world", () -> System.out.println("callback"));
}
private static void execute(String s, Callback callback) {
System.out.println(s);
callback.callback();
}
@FunctionalInterface
interface Callback {
void callback();
}
在这里,可以发现一点小不同,就是Callback多了一个注解@FunctionalInterface,这个注解主要用于编译期检查,如果我们的接口不符合函数式接口的要求,那编译的时候就会报错。不加也是可以正常执行的。
这个在后面的stream中详解。
在之前的例子中,我们发现使用lambda表达式的时候,经常需要定义一些接口用来辅助我们的编码,这样就会使得本应轻量级的lambda表达式又变得重量级。那是否存在解决方案呢?其实Java8本身已经为我们提供了一些常见的函数式接口,就在java.util.function包下面。
接口 | 描述 |
---|---|
Function |
接受一个输入参数,返回一个结果 |
Supplier | 无参数,返回一个结果 |
Consumer | 接受一个输入参数,并且不返回任何结果 |
BiFunction |
接受两个输入参数的方法,并且返回一个结果 |
BiConsumer |
接受两个输入参数的操作,并且不返回任何结果 |
此处列出最基本的几个,其他的都是在这些的基础上做了一些简单的封装,例如IntFunction就是对Function
public static void main(String[] args) {
Function f = x -> x + 1;
System.out.println(f.apply(1));
BiFunction g = (x, y) -> x + y;
System.out.println(g.apply(1, 2));
}
lambda表达式虽然使用时和匿名类很相似,但是还是存在那么一些区别。
lambda表达式中使用this指向的是外部的类,而匿名类中使用this则指向的是匿名类本身。
public class FunctionMain {
private String test = "test-main";
public static void main(String[] args) {
new FunctionMain().output();
}
private void output() {
Function f = () -> {
System.out.println("1:-----------------");
System.out.println(this);
System.out.println(this.test);
};
f.outputThis();
new Function() {
@Override
public void outputThis() {
System.out.println("2:-----------------");
System.out.println(this);
System.out.println(this.test);
}
}.outputThis();
}
interface Function {
String test = "test-function";
void outputThis();
}
}
如上面这段代码,输出结果如下
所以如果想使用lambda表达式的同时去访问原类中的变量、方法的是做不到的。
从编译结果来看,两者的编译结果完全不同。
首先是匿名类的方式,代码如下:
import java.util.function.Function;
public class ClassMain {
public static void main(String[] args) {
Function f = new Function() {
@Override
public Integer apply(Integer integer) {
return integer + 1;
}
};
System.out.println(f.apply(1));
}
}
编译后的结果如下:
可以看到ClassMain在编译后生成了两个class,其中ClassMain$1.class就是匿名类生成的class。
那么接下来,我们再来编译一下lambda版本的。代码和编译结果如下:
import java.util.function.Function;
public class FunctionMain {
public static void main(String[] args) {
Function f = x -> x + 1;
System.out.println(f.apply(1));
}
}
在这里我们可以看到FunctionMain并没有生成第二个class文件。
更进一步,我们打开他们的字节码来寻找更多的细节。首先依然是匿名类的方式
在Code-0这一行,我们可以看到匿名类的方式是通过new一个类来实现的。
接下来是lambda表达式生成的字节码,
在lambda表达式的字节码中,我们可以看到我们的lambda表达式被编译成了一个叫做lambda$main$0的静态方法,接着通过invokedynamic的方式进行了调用。
lambda表达式想要替代匿名类是有条件的,即这个匿名类实现的接口必须是函数式接口,即只能有一个抽象方法的接口。
由于没有实际测试过lambda表达式的性能,且我使用lambda更多是基于编码简洁度的考虑,因此本文就不探讨性能相关问题。
关于lambda表达式和匿名类的性能对比可以参考官方ppt https://www.oracle.com/technetwork/java/jvmls2013kuksen-2014088.pdf
Stream API是Java8对集合类的补充与增强。它主要用来对集合进行各种便利的聚合操作或者批量数据操作。
在进行流操作的第一步是创建一个流,下面介绍几种常见的流的创建方式
从集合类创建流
如果已经我们已经有一个集合对象,那么我们可以直接通过调用其stream()方法得到对应的流。如下
List list = Arrays.asList("hello", "world", "la");
list.stream();
利用数组创建流
String[] strArray = new String[]{"hello", "world", "la"};
Stream.of(strArray);
利用可变参数创建流
Stream.of("hello", "world", "la");
根据范围创建数值流
IntStream.range(0, 100); // 不包含最后一个数
IntStream.rangeClosed(0, 99); // 包含最后一个数
BufferReader.lines()
对于BufferReader而言,它的lines方法也同样可以创建一个流
File file = new File("/Users/cayun/.m2/settings.xml");
BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(file)));
br.lines().forEach(System.out::println);
br.close();
在Stream API中,流的操作有两种:Intermediate和Terminal
Intermediate:一个流可以后面跟随零个或多个 intermediate 操作。其目的主要是打开流,做出某种程度的数据映射/过滤,然后返回一个新的流,交给下一个操作使用。这类操作都是惰性化的(lazy),就是说,仅仅调用到这类方法,并没有真正开始流的遍历。
Terminal:一个流只能有一个 terminal 操作,当这个操作执行后,流就被使用“光”了,无法再被操作。所以这必定是流的最后一个操作。Terminal 操作的执行,才会真正开始流的遍历,并且会生成一个结果,或者一个 side effect。
除此以外,还有一种叫做short-circuiting的操作
对于一个 intermediate 操作,如果它接受的是一个无限大(infinite/unbounded)的 Stream,但返回一个有限的新 Stream。
对于一个 terminal 操作,如果它接受的是一个无限大的 Stream,但能在有限的时间计算出结果。
常见的流操作可以如下归类:
Intermediate
map (mapToInt, flatMap 等)、 filter、 distinct、 sorted、 peek、 limit、 skip、 parallel、 sequential、 unordered
Terminal
forEach、 forEachOrdered、 toArray、 reduce、 collect、 min、 max、 count、 anyMatch、 allMatch、 noneMatch、 findFirst、 findAny、 iterator
Short-circuiting
anyMatch、 allMatch、 noneMatch、 findFirst、 findAny、 limit
forEach可以说是最常见的操作了,甚至对于List等实现了Collection接口的类可以不创建stream而直接使用forEach。简单地说,forEach就是遍历并执行某个操作。
Stream.of("hello", "world", "a", "b").forEach(System.out::println);
map也同样是一个非常高频的流操作,用来将一个集合映射为另一个集合。下面代码展示了将[1,2,3,4]映射为[1,4,9,16]
IntStream.rangeClosed(1, 4).map(x -> x * x).forEach(System.out::println);
除此之外,还有一个叫做flatMap的操作,这个操作在映射的基础上又做了一层扁平化处理。这个概念可能比较难理解,那举个例子,我们需要将[“hello”, “world”]转换成[h,e,l,l,o,w,o,r,l,d],可以尝试一下使用map,那你会惊讶地发现,可能结果不是你想象中的那样。如果不信可以执行下面这段代码,就会发现map与flatMap之间的区别了,
Stream.of("hello", "world").map(s -> s.split("")).forEach(System.out::println);
System.out.println("--------------");
Stream.of("hello", "world").flatMap(s -> Stream.of(s.split(""))).forEach(System.out::println);
filter则实现了过滤的功能,如果只需要[1,2,3,4,5]中的奇数,可以如下,
IntStream.rangeClosed(1, 5).filter(x -> x % 2 == 1).forEach(System.out::println);
其中sorted表示排序,distinct表示去重,简单的示例如下:
Integer[] arr = new Integer[]{5, 1, 2, 1, 3, 1, 2, 4}; // 千万不要用int
Stream.of(arr).sorted().forEach(System.out::println);
Stream.of(arr).distinct().forEach(System.out::println);
Stream.of(arr).distinct().sorted().forEach(System.out::println);
在流操作中,我们往往需求是从一个List得到另一个List,而不是直接通过forEach来打印。那么这个时候就需要使用到collect了。依然是之前的例子,将[1,2,3,4]转换成[1,4,9,16]。
List list1= Stream.of(1, 2, 3, 4).map(x -> x * x).collect(Collectors.toList());
// 对于IntStream生成的流需要使用mapToObj而不是map
List list2 = IntStream.rangeClosed(1, 4).mapToObj(x -> x * x).collect(Collectors.toList());
除了普通的stream之外还有parallelStream,区别比较直观,就是stream是单线程执行,parallelStream为多线程执行。parallelStream的创建及使用基本与stream类似,
List list = Arrays.asList(1, 2, 3, 4);
// 直接创建一个并行流
list.parallelStream().map(x -> x * x).forEach(System.out::println);
// 或者将一个普通流转换成并行流
list.stream().parallel().map(x -> x * x).forEach(System.out::println);
不过由于是并行执行,parallelStream并不保证结果顺序,同样由于这个特性,如果能使用findAny就尽量不要使用findFirst。
使用parallelStream时需要注意的一点是,多个parallelStream之间默认使用的是同一个线程池,所以IO操作尽量不要放进parallelStream中,否则会阻塞其他parallelStream。
Optional的引入是为了解决空指针异常的问题,事实上在Java8之前,Optional在很多地方已经较为广泛使用了,例如scala、谷歌的Guava库等。
在实际生产中我们经常会遇到如下这种情况,
public class FunctionMain {
public static void main(String[] args) {
Person person = new Person();
String result = null;
if (person != null) {
Address address = person.address;
if (address != null) {
Country country = address.country;
if (country != null) {
result = country.name;
}
}
}
System.out.println(result);
}
}
class Person {
Address address;
}
class Address {
Country country;
}
class Country {
String name;
}
每每写到这样的代码,作为编码者一定都会头皮发麻,满心地不想写,但是却不得不写。这个问题如果使用Optional,或许你就能找到你想要的答案了。
Optional.empty(); // 创建一个空Optional
Optional.of(T value); // 不接受null,会报NullPointerException异常
Optional.ofNullable(T value); // 可以接受null
get(); // 返回里面的值,如果值为null,则抛异常
orElse(T other); // 有值则返回值,null则返回other
orElseGet(Supplier other); // 有值则返回值,null则由提供的lambda表达式生成值
orElseThrow(Supplier exceptionSupplier); // 有值则返回值,null则抛出异常
isPresent(); // 判断是否为空
到这里,我们可能会开始考虑怎么用Optional解决引言中的问题了,于是思考半天,写出了这样一段代码,
public static void main(String[] args) {
Person person = new Person();
String result = null;
Optional per = Optional.ofNullable(person);
if (per.isPresent()) {
Optional address = Optional.ofNullable(per.get().address);
if (address.isPresent()) {
Optional country = Optional.ofNullable(address.get().country);
if (country.isPresent()) {
result = Optional.ofNullable(country.get().name).orElse(null);
}
}
}
System.out.println(result);
}
啊嘞嘞,感觉不仅没有使得代码变得简单,反而变得更加复杂了。那么很显然这并不是Optional的正确使用方法。接下来的部分才是Optional的正确使用方式。
在Optional中也有类似于Stream API中的链式方法map、flatMap、filter、ifPresent。这些方法才是Optional的精髓。此处以最典型的map作为例子,可以看看map的源码
public Optional map(Function super T, ? extends U> mapper) {
Objects.requireNonNull(mapper);
if (!isPresent())
return empty();
else {
return Optional.ofNullable(mapper.apply(value));
}
}
源码很简单,可以看到对于null情况仍然返回null,否则返回处理结果。那么此再来思考一下引言的问题,那就可以很简单地改写成如下的写法,
public static void main(String[] args) {
Person person = new Person();
String result = Optional.ofNullable(person)
.map(per -> per.address)
.map(address -> address.country)
.map(country -> country.name).orElse(null);
System.out.println(result);
}
哇哇哇,相比原先的null写法真真是舒服太多了。
map与flatMap的区别
这两者的区别,同样使用一个简单的例子来解释一下吧,
public class FunctionMain {
public static void main(String[] args) {
Person person = new Person();
String name = Optional.ofNullable(person).flatMap(p -> p.name).orElse(null);
System.out.println(name);
}
}
class Person {
Optional name;
}
在这里使用的不是map而是flatMap,稍微观察一下,可以发现Person中的name不再是String类型,而是Optional类型了,如果使用map的话,那map的结果就是Optional
至于filter和ifPresent用法类似,就不再叙述了。
由于个人目前为止也只是初探函数式阶段,很多地方了解也不多,此处只列举两个。(注意:下面的部分应用函数与柯里化对应的是scala中的概念,其他语言中可能略有偏差)
部分应用函数指的是对于一个有n个参数的函数f,但是我们只提供m个参数给它(m < n),那么我们就可以得到一个部分应用函数,简单地描述一下,如下
在这里g就是f的一个部分应用函数。
BiFunction f = (x, y) -> x + y;
Function g = x -> f.apply(1, x);
System.out.println(g.apply(2));
柯里化就是把接受多个参数的函数变换成接受一个单一参数(最初函数的第一个参数)的函数,并且返回接受余下的参数而且返回结果的新函数的技术。换个描述,如下
Java中对柯里化的实现如下,
Function> f = x -> y -> x + y;
System.out.println(f.apply(1).apply(2));
因为Java限制,我们不得不写成f.apply(1).apply(2)的形式,不过视觉上的体验与直接写成f(1)(2)相差就很大了。
柯里化与部分应用函数感觉很相像,不过因为个人几乎未使用过这两者,因此此处就不发表更多见解。