前言
上一篇博客一文带你深入了解 Lambda 表达式和方法引用我给大家介绍了 Java8 函数式特性中的 Lambda,这篇文章我将继续讨论 stream 流的用法
声明:本文首发于博客园,作者:后青春期的Keats;地址:https://www.cnblogs.com/keatsCoder/ 转载请注明,谢谢!
Show Time
首先给大家看一段代码,让大家直观感受下 Java7 和 Java8 遍历处理集合的不同
Dish 是一个菜肴对象,calories 属性表示该菜品的卡路里值,name 则是菜品的名称。我们需要过滤出卡路里小于400、然后根据卡路里值升序、接着拿到他们的名称列表并返回
Java7
public static List getLowCaloricDishesNamesInJava7(List dishes){
List lowCaloricDishes = new ArrayList<>();
for(Dish d: dishes){
if(d.getCalories() < 400){
lowCaloricDishes.add(d);
}
}
List lowCaloricDishesName = new ArrayList<>();
Collections.sort(lowCaloricDishes, new Comparator() {
public int compare(Dish d1, Dish d2){
return Integer.compare(d1.getCalories(), d2.getCalories());
}
});
for(Dish d: lowCaloricDishes){
lowCaloricDishesName.add(d.getName());
}
return lowCaloricDishesName;
}
Java8
public static List getLowCaloricDishesNamesInJava8(List dishes){
return dishes.stream()
.filter(d -> d.getCalories() < 400)
.sorted(comparing(Dish::getCalories))
.map(Dish::getName)
.collect(toList());
}
如果需要多核并行处理,则只需调用 dishes.parallelStream()
即可
在 Java8 之前,程序员需要通过 2次遍历 + 一次集合排序才能完成的工作,Java8 只需要一个链式调用就可以解决。这就是 stream 的强大之处
认识流
流是什么
流是 Java API 的新成员,允许程序员以声明式的方式处理集合数据,并且支持链式调用、支持并行处理。用流处理的集合数据高效且易读。
流与集合的异同
- 集合的主要功能是以一定的时间和空间复杂度存储和访问元素,而流主要是用于元素计算
- 集合中的元素可以随意添加和删除,而流不能添加和删除元素
- 流的元素是按需计算的,只有当用到时他才会参与计算,而集合中的元素必须提前全都准备好
- 流只能遍历一次,下面的代码会报错
java.lang.IllegalStateException: stream has already been operated upon or closed
流已经被消费掉
List names = Arrays.asList("Java8", "Lambdas", "In", "Action");
Stream s = names.stream();
s.forEach(System.out::println);
s.forEach(System.out::println);
- 集合采用外部迭代,流采用内部迭代。内部迭代意味着 Java 可以替你选择更优的迭代策略和并行处理。而外部迭代如果程序员想着做个更有的迭代/采用并行就相当于“下次一定”了
流操作分类
对流的操作可以分为两类,可以继续执行下一个流操作的称为中间操作(方法的返回值是 Stream),关闭流的操作称为终止操作。
中间操作
除非流水线上执行终端操作,否则中间操作不会执行任何处理。流会对中间操作进行合并、短路等优化
终端操作
终端操作会从流的流水线生成结果,返回一个非 Stream 的任意类型值
使用流
筛选和切片
筛选
filter(Predicate super T> predicate)
方法可以将流中满足某条件的元素筛选出来。该方法接收一个谓词函数,返回流。比如要选出某个苹果集合中红色的苹果
List appleList = new ArrayList<>();
List redAppleList = appleList.stream().filter(a -> "red".equals(a.getColor())).collect(Collectors.toList());
去重
distinct()
方法会根据元素的 hashCode() 和 equals() 方法对流中元素进行去重操作
截断
limit(n)
方法会返回流的前 n 个元素,对于有序集合List,流会按照添加顺序返回前 n 个元素,而无序集合则不会
跳过
skip(n)
方法会跳过流的前 n 个元素,可以通过 skip(m).limit(n) 返回列表中第 m - (m+n) 区间的元素,类似与 mysql 中的 limit m,n
映射
对流中的每个元素应用函数
map(Function super T, ? extends R> mapper)
方法。该方法接收一个 Function 函数,对流中的每一个元素使用。然后可以返回任意类型的对象。有了该方法,就可以结合 Lambda 表达式对集合中的元素使用函数进行各种转换
流的扁平化
flatMap()
可以将流操作中多个流合并成一个流的多个元素。举个例子:集合 words 有两个单词,现在想获得[H, e, l, o, W, r, d]
在 split 方法执行完毕后,返回的是 Stream(String[]) 对象,而此时如果执行 map 方法,返回的就是多个流的集合(这个例子中就是两个 Stream(String)),这时是无法继续接下来的 distinct 操作的,因此需要 flatMap 将两个 Stream 扁平化成一个 Stream,然后进行操作
List words = Arrays.asList("Hello", "World");
List charList = words.stream().map(word -> word.split("")).flatMap(Arrays::stream).distinct().collect(Collectors.toList());
该方法的方法声明 flatMap(Function super T, ? extends Stream extends R>> mapper)
中可以看出,他所使用的函数式接口 Function 第二个泛型 R 必须是 Stream 流。即函数式接口的抽象方法返回值必须是 Stream 流及其子类对象。
查找和匹配
检查谓词是否至少匹配一个元素
anyMatch
方法可以回答“流中是否存在至少一个复合谓词条件的元素”返回 boolean 类型的值,因此是一个终端操作,例如
List num = Arrays.asList(1, 2, 3, 4, 5, 6);
if (num.stream().anyMatch(n -> n % 3 == 0)) {
System.out.println("集合中有元素是3的整数倍");
}
控制台会输出'集合中有元素是3的整数倍',因为集合中 3、6都是3的整数倍,符合谓词的条件
检查谓词是否匹配所有元素
allMatch
方法和 anyMatch
方法原理类似,但是它仅当所有元素满足谓词条件时,返回 true。
noneMatch
与 allMatch
正好相反,仅当所有元素不满足谓词条件时,返回 true
ps:和 && || 运算符类似,以上三个操作都用到了短路的思想来提高效率。
查找元素
findAny()
该方法返回当前流中的任意元素,可以和其他流操作结合使用,这里需要注意 findAny() 返回的结果被 Optional 所包裹,Optional 是 Java8 为优雅的避免 NPE 所采用的新 API,关于 Optional 的用法我会在下一篇博客和大家讨论,敬请期待。这里需要说明的就是 Optional.ifPresent(Consumer super T> consumer) 表示当 Optional 包裹的元素不为空时,执行 consumer
num.stream().filter(n -> n > 2).findAny().ifPresent(System.out::println);
findFirst()
该方法返回当前流中的第一个元素,一般也和其他流操作(例如 filter() 过滤)结合使用。与 findAny()
不同的是,他一定返回有序集合的第一个满足条件的元素。当然有得必有失,作为代价,findFirst()
在并行处理时限制更多一些。
归约
元素求和
reduce(T identity, BinaryOperator
方法接收两个参数:identity 初始值,accumulator 对两个数的操作。例如求集合中数字的和:
num.stream().reduce(0, (a, b) -> a + b) // 计算完成,返回 21
ps:Lambda 表达式 (a, b) -> a + b)
中 a 是上一轮执行完后的累计值,b 是本次循环流中的元素。通过累加就可以计算出数字的和
最大值和最小值
reduce 方法不仅可以求和、求积。甚至可以计算最大值、最小值。
num.stream().reduce(Integer::max);
num.stream().reduce(Integer::min);
总结
- 流是 Java API 的新成员,允许程序员以声明式的方式处理集合数据,并且支持链式调用、支持并行处理。用流处理的集合数据高效且易读。
- 流的API中可以分为两大类,中间操作和终端操作,中间操作返回流对象,可以链式调用,终端操作则返回非流对象。
- 流提供了很多方便的API,如筛选 filter、去重 distinct、截断 limit、跳过 skip、函数转换 map、扁平化 flatMap、判断流中是否有任意元素符合要求 anyMatch、是否所有元素都符合要求 allMatch、是否所有元素都不符合要求 noneMatch、查找元素 findAny findFirst、累计式的计算元素 reduce
码字不易,如果你觉得读完以后有收获,不妨点个推荐让更多的人看到吧!