Java8 Stream流学习笔记

流简介

1.流是什么？

流到底是什么呢？简短的定义就是“ 从支持数据处理操作的源生成的元素序列 ”

元素序列：就像集合一样，流也提供了一个接口，可以访问特定元素类型的一组有序值。但流的目的在于表达计算，比如filter、sorted和map。集合讲的事数据，流讲的是计算。
源：流会使用一个提供数据的源，如集合、数组或者输入/输出资源。
数据处理操作：流的数据处理功能支持类似于数据库的操作，以及函数式编程语言中的常用操作，如filter、map、reduce、find、match、sort等。流操作可以顺序执行，也可以并行执行。

流操作两个重要的特点：

流水线：很多流操作本身会返回一个流，这样多个操作就可以链接起来，形成一个大的流水线。
内部迭代：与使用迭代器显示迭代的集合不同，流的迭代操作是在背后进行的。

2.流与集合

流与集合之间的差异在于什么时候进行计算。

集合是一个内存中的数据结构，它包含数据结构中目前所有的值——集合中的每个元素都得先算出来才能添加到集合中。（集合中的每个元素都是放在内存里的，元素都得先算出来才能成为集合的一部分。）

流是在概念上固定的数据结构（你不能添加或删除元素），其元素则是按需计算的。（流就像是一个延迟创建的集合：只有在消费者要求的时候才会计算值。）

2.1 流只能遍历一次

==和迭代器类似，流只能遍历一次。遍历完之后，我们就说这个流已经被消费掉了。==

就比如下面这段代码：

List title = Arrays.asList("Java8","In","Action");
Stream s = title.stream();
s.forEach(System.out::println);
//到这里就会报出异常：流已被操作或者关闭
s.forEach(System.out::println);

3. 外部迭代与内部迭代

使用Collection接口需要用户去做迭代（比如用for-each），这称为外部迭代。相反，Streams库使用内部迭代——它帮你把迭代做了，还把得到的流值存在了某个地方，你只要给出一个函数说要干什么就可以了。

3.1 使用内部迭代的原因

内部迭代时，项目可以透明的并行处理，或者用更优化的顺序进行处理。

Streams库的内部迭代可以自动选择一种适合硬件的数据表示和并行实现。与此相反，一旦通过写for-each而选择了外部迭代，那你基本上就要自己管理所有的并行问题了（自己管理实际上意味着“某个良辰吉日我们会把它并行化”或者“开始了关于人物和synchronized的漫长二而艰苦的斗争”。）

差异对比.png

4. 流操作

可以连接起来的流操作称为中间操作，关闭流的操作称为终端操作。

4.1 中间操作

诸如filter或sorted等中间操作会返回另一个流。折让多个操作可以链接起来形成一个查询。重要的是，==除非流水线上出发一个终端操作，否则中间操作不会执行任何处理——它们很懒。==

4.2 终端操作

终端操作会从流的流水线生成结果。其结果是任何不是流的值，比如List、Integer，甚至是void。

4.3 使用流

总而言之，流的使用一般包括三件事：

一个数据源（如集合）来执行一个查询；

一个中间操作链，形成一条流的流水线；

一个终端操作，执行流水线，并能生成结果；

中间操作：

操作	类型	返回类型	操作参数	函数描述符
filter	中间	Stream	Predicate	T -> boolean
map	中间	Stream	Funcation	T -> R
limit	中间	Stream
sorted	中间	Stream	Comparator	(T，T) -> int
distinct	中间	Stream

终端操作：

操作	类型	目的
forEach	终端	消费流中的每个元素并对其应用Lambda。这一操作返回void
count	终端	返回流中元素的个数。这一操作返回long
collect	终端	把流归约成一个集合，比如List、Map甚至是Integer。

小结

流是“ 从支持数据处理操作的源生成的一系列元素 ”。
流利用内部迭代：迭代通过filter、map、sorted等操作被抽象掉了。
流操作有两类：中间操作和终端操作（也就终止操作）。
filter和map等中间操作会返回一个流，并可以链接在一起。可以把它们设置成一条流水线，但并不会生成任何结果。
forEach和count等终端操作会返回一个非流的值，并处理流水线以返回结果。
流中的元素是按需计算的。

使用流

1. 筛选和切片

1.1 谓词筛选

Stream接口支持filter方法。该操作会接收一个谓词（一个返回boolean的函数）作为参数，并返回一个包括所有符合谓词的元素的流

代码示例：

List vegetarianMenu = menu.stream().filter(Dish::isVegetarian).collect(toList());

1.2 筛选各异元素（去重）

==使用distinct()方法。==

1.3 截短流

流支持==limit(n)==方法，该方法会返回一个不超过给定长度的流。所需的长度做为参数传递给limit。如果流是有序的，则最多会返回前n个元素。

1.4 跳过元素

流支持==skip(n)==方法，该方法会返回一个扔4

掉前n个元素的流。如果流中元素不足n个，则返回一个空值。

2. 映射

map

流支持map方法，它会接收一个函数做为参数。这个函数会被应用到每个元素上，并将其映射成一个新的元素（使用映射一次，是因为它和转换类似，但其中的细微差别在于它是“创建一个新版本”而不是去“修改”）。

flatMap

流支持flatMap方法，它的效果是，把一个流中的每个值都换成另一个流，然后把所有的流连接起来成为一个流。

3.查找和匹配

3.1 检查谓词是否至少匹配一个元素

使用==anyMatch==方法。anyMatch方法返回一个boolean，因此是一个终端操作。

3.2 检查谓词是否匹配所有元素

使用==allMatch==方法。它的工作原理和anyMatch类似，但它会看看流中的元素是否都能匹配给定的谓词。

其中和allMatch相对的是==noneMatch==。它可以确保流中没有任何元素与给定的谓词匹配。

==注意：anyMatch、allMatch和noneMatch这三个操作都用到了我们所谓的短路，这就是大家熟悉的Java中&&和||运算符短路在流中的版本。==

短路求值：

对于流而言，某些操作（例如allMatch、anyMatch、noneMatch、findFirst和findAny）不用处理整个流就能得到结果。只要找到一个元素，就可以有结果了。同样，limit也是一个短路操作：它只需要创建一个给定大小的流，而用不着处理流中所有的元素。在碰到无限大小的流的时候，这种操作就有用了：它们可以把无限流变成有限流。

3.3 查找元素

==findAny==方法将返回当前流中的任意元素。

其中这里涉及到Optional函数，以下为Optional简介：

Optional类（java.util.Optional）是一个容器类，代表一个值存在或不存在。findAny有时候可能什么元素都没找到。Java8的库设计人员引入了Optional，这样就不用返回众所周知容易出问题的null了。

Optional常用检查方法说明：

isPresent（）将在Optional包含值的时候返回true，否则返回false。
ifPresent（Consumer block）会在值存在的时候执行给定的代码块。
T get（）会在只存在时返回值，否则抛出一个NoSuchElement异常。
T orElse（T other）会在值存在时返回值，否则返回一个默认值。

4. 到目前为止所学习的中间操作和终端操作记录

操作	类型	返回类型	操作参数	函数描述符
filter	中间	Stream	Predicate	T -> boolean
map	中间	Stream	Funcation	T -> R
limit	中间（有状态-有界）	Stream
sorted	中间	Stream	Comparator	(T，T) -> int
distinct	中间（有状态-无界）	Stream
skip	中间（有状态-有界）	Stream	long
flatMap	中间	Stream	Funcation>	T -> boolean
anyMatch	终端	boolean	Predicate	T -> boolean
noneMatch	终端	boolean	Predicate	T -> boolean
allMatch	终端	boolean	Predicate	T -> boolean
findAny	终端	Optional
findFirst	终端	Optional
forEach	终端	void	Consumer	T -> void
collect	终端	R	Collector
reduce	终端（有状态-有界）	Optional	BinaryOperator	（T，T） -> T
count	终端	long