Stream作为Java8的新特性之一,他与Java IO包中的InputStream和OutputStream完全不是一个概念。Java8中的Stream是对集合功能的一种增强,主要用于对集合对象进行各种非常便利高效的聚合和大批量数据的操作。结合Lambda表达式可以极大的提高开发效率和代码可读性。
假设我们需要把一个集合中的所有形状设置成红色,那么我们可以这样写
for (Shape shape : shapes){
shape.setColor(RED)
}
如果使用Java8扩展后的集合框架则可以这样写:
shapes.foreach(s -> s.setColor(RED));
第一种写法我们叫外部迭代,for-each调用shapes
的iterator()
依次遍历集合中的元素。这种外部迭代有一些问题:
上面这两个问题我们会在后面的文章中逐步解答。
shapes.stream()
.filter(s -> s.getColor() == BLUE)
.forEach(s -> s.setColor(RED));
在`Collection`上调用`stream()`会生成该集合元素的流,接下来`filter()`操作会产生只包含蓝色形状的流,最后,这些蓝色形状会被`forEach`操作设为红色。 如果我们想把蓝色的形状提取到新的List里,则可以:
List<Shape> blue = shapes.stream()
.filter(s -> s.getColor() == BLUE)
.collect(Collectors.toList());
`collect()`操作会把其接收的元素聚集到一起(这里是List),`collect()`方法的参数则被用来指定如何进行聚集操作。在这里我们使用`toList()`以把元素输出到List中。 如果每个形状都被保存在`Box`里,然后我们想知道哪个盒子至少包含一个蓝色形状,我们可以这么写:
Set<Box> hasBlueShape = shapes.stream()
.filter(s -> s.getColor() == BLUE)
.map(s -> s.getContainingBox())
.collect(Collectors.toSet());
`map()`操作通过映射函数(这里的映射函数接收一个形状,然后返回包含它的盒子)对输入流里面的元素进行依次转换,然后产生新流。 如果我们需要得到蓝色物体的总重量,我们可以这样表达:
int sum = shapes.stream()
.filter(s -> s.getColor() == BLUE)
.mapToInt(s -> s.getWeight())
.sum();
filter()
和map()
这样的操作既可以被急性求值(以filter()
为例,急性求值需要在方法返回前完成对所有元素的过滤),也可以被惰性求值(用Stream
代表过滤结果,当且仅当需要时才进行过滤操作)在实际中进行惰性运算可以带来很多好处。比如说,如果我们进行惰性过滤,我们就可以把过滤和流水线里的其它操作混合在一起,从而不需要对数据进行多遍遍历。相类似的,如果我们在一个大型集合里搜索第一个满足某个条件的元素,我们可以在找到后直接停止,而不是继续处理整个集合。(这一点对无限数据源是很重要,惰性求值对于有限数据源起到的是优化作用,但对无限数据源起到的是决定作用,没有惰性求值,对无限数据源的操作将无法终止)
对于filter()
和map()
这样的操作,我们很自然的会把它当成是惰性求值操作,不过它们是否真的是惰性取决于它们的具体实现。另外,像sum()
这样生成值的操作和forEach()
这样产生副作用的操作都是天然急性求值,因为它们必须要产生具体的结果。
我们拿下面这段代码举例:
int sum = shapes.stream()
.filter(s -> s.getColor() == BLUE)
.mapToInt(s -> s.getWeight())
.sum();
这里的filter()
和map()
都是惰性的,这就意味着在调用sum()
之前不会从数据源中提取任何元素。在sum()
操作之后才会把filter()
、map()
和sum()
放在对数据源一次遍历中。这样可以大大减少维持中间结果所带来的开销。
前面长篇大论的介绍概念实在太枯燥,为了方便大家理解我们用Streams API来实现一个具体的业务场景。
假设我们有一个房源库项目,这个房源库中有一系列的小区,每个小区都有小区名和房源列表,每套房子又有价格、面积等属性。现在我们需要筛选出含有100平米以上房源的小区,并按照小区名排序。
我们先来看看不用Streams API如何实现:
List<Community> result = new ArrayList<>();
for (Community community : communities) {
for (House house : community.houses) {
if (house.area > 100) {
result.add(community);
break;
}
}
}
Collections.sort(result, new Comparator<Community>() {
@Override
public int compare(Community c1, Community c2) {
return c1.name.compareTo(c2.name);
}
});
return result;
如果使用Streams API:
return communities.stream()
.filter(c -> c.houses.stream().anyMatch(h -> h.area>100))
.sorted(Comparator.comparing(c -> c.name))
.collect(Collectors.toList());
如果你喜欢我的文章,就关注下我的知乎专栏或者在 GitHub 上添个 Star 吧!
- 知乎专栏:https://zhuanlan.zhihu.com/baron
- GitHub:https://github.com/BaronZ88