Java8 Stream流学习笔记

流简介

1.流是什么?

流到底是什么呢?简短的定义就是“ 从支持数据处理操作生成的元素序列

  • 元素序列:就像集合一样,流也提供了一个接口,可以访问特定元素类型的一组有序值。但流的目的在于表达计算,比如filter、sorted和map。集合讲的事数据,流讲的是计算。
  • 源:流会使用一个提供数据的源,如集合、数组或者输入/输出资源。
  • 数据处理操作:流的数据处理功能支持类似于数据库的操作,以及函数式编程语言中的常用操作,如filter、map、reduce、find、match、sort等。流操作可以顺序执行,也可以并行执行。

流操作两个重要的特点:

  1. 流水线:很多流操作本身会返回一个流,这样多个操作就可以链接起来,形成一个大的流水线。
  2. 内部迭代:与使用迭代器显示迭代的集合不同,流的迭代操作是在背后进行的。

2.流与集合

流与集合之间的差异在于什么时候进行计算

集合是一个内存中的数据结构,它包含数据结构中目前所有的值——集合中的每个元素都得先算出来才能添加到集合中。(集合中的每个元素都是放在内存里的,元素都得先算出来才能成为集合的一部分。)

流是在概念上固定的数据结构(你不能添加或删除元素),其元素则是按需计算的。(流就像是一个延迟创建的集合:只有在消费者要求的时候才会计算值。)

2.1 流只能遍历一次

==和迭代器类似,流只能遍历一次。遍历完之后,我们就说这个流已经被消费掉了。==

就比如下面这段代码:

List title = Arrays.asList("Java8","In","Action");
Stream s = title.stream();
s.forEach(System.out::println);
//到这里就会报出异常:流已被操作或者关闭
s.forEach(System.out::println);

3. 外部迭代与内部迭代

使用Collection接口需要用户去做迭代(比如用for-each),这称为外部迭代。相反,Streams库使用内部迭代——它帮你把迭代做了,还把得到的流值存在了某个地方,你只要给出一个函数说要干什么就可以了。

3.1 使用内部迭代的原因

内部迭代时,项目可以透明的并行处理,或者用更优化的顺序进行处理。

Streams库的内部迭代可以自动选择一种适合硬件的数据表示和并行实现。与此相反,一旦通过写for-each而选择了外部迭代,那你基本上就要自己管理所有的并行问题了(自己管理实际上意味着“某个良辰吉日我们会把它并行化”或者“开始了关于人物和synchronized的漫长二而艰苦的斗争”。)

差异对比.png

4. 流操作

可以连接起来的流操作称为中间操作,关闭流的操作称为终端操作

4.1 中间操作

诸如filter或sorted等中间操作会返回另一个流。折让多个操作可以链接起来形成一个查询。重要的是,==除非流水线上出发一个终端操作,否则中间操作不会执行任何处理——它们很懒。==

4.2 终端操作

终端操作会从流的流水线生成结果。其结果是任何不是流的值,比如List、Integer,甚至是void。

4.3 使用流

总而言之,流的使用一般包括三件事:

  1. 一个数据源(如集合)来执行一个查询;
  2. 一个中间操作链,形成一条流的流水线;
  3. 一个终端操作,执行流水线,并能生成结果;

中间操作:

操作 类型 返回类型 操作参数 函数描述符
filter 中间 Stream Predicate T -> boolean
map 中间 Stream Funcation T -> R
limit 中间 Stream
sorted 中间 Stream Comparator (T,T) -> int
distinct 中间 Stream

终端操作:

操作 类型 目的
forEach 终端 消费流中的每个元素并对其应用Lambda。这一操作返回void
count 终端 返回流中元素的个数。这一操作返回long
collect 终端 把流归约成一个集合,比如List、Map甚至是Integer。

小结

  1. 流是“ 从支持数据处理操作的源生成的一系列元素 ”。
  2. 流利用内部迭代:迭代通过filter、map、sorted等操作被抽象掉了。
  3. 流操作有两类:中间操作和终端操作(也就终止操作)。
  4. filter和map等中间操作会返回一个流,并可以链接在一起。可以把它们设置成一条流水线,但并不会生成任何结果。
  5. forEach和count等终端操作会返回一个非流的值,并处理流水线以返回结果。
  6. 流中的元素是按需计算的。

使用流

1. 筛选和切片

1.1 谓词筛选

Stream接口支持filter方法。该操作会接收一个谓词(一个返回boolean的函数)作为参数,并返回一个包括所有符合谓词的元素的流

代码示例:

List vegetarianMenu = menu.stream().filter(Dish::isVegetarian).collect(toList());

1.2 筛选各异元素(去重)

==使用distinct()方法。==

1.3 截短流

流支持==limit(n)==方法,该方法会返回一个不超过给定长度的流。所需的长度做为参数传递给limit。如果流是有序的,则最多会返回前n个元素。

1.4 跳过元素

流支持==skip(n)==方法,该方法会返回一个扔4

掉前n个元素的流。如果流中元素不足n个,则返回一个空值。

2. 映射

map

流支持map方法,它会接收一个函数做为参数。这个函数会被应用到每个元素上,并将其映射成一个新的元素 (使用映射一次,是因为它和转换类似,但其中的细微差别在于它是“创建一个新版本”而不是去“修改”)。

flatMap

流支持flatMap方法,它的效果是,把一个流中的每个值都换成另一个流,然后把所有的流连接起来成为一个流。

3.查找和匹配

3.1 检查谓词是否至少匹配一个元素

使用==anyMatch==方法。anyMatch方法返回一个boolean,因此是一个终端操作。

3.2 检查谓词是否匹配所有元素

使用==allMatch==方法。它的工作原理和anyMatch类似,但它会看看流中的元素是否都能匹配给定的谓词。

其中和allMatch相对的是==noneMatch==。它可以确保流中没有任何元素与给定的谓词匹配。

==注意:anyMatch、allMatch和noneMatch这三个操作都用到了我们所谓的短路,这就是大家熟悉的Java中&&和||运算符短路在流中的版本。==

短路求值:

​ 对于流而言,某些操作(例如allMatch、anyMatch、noneMatch、findFirst和findAny)不用处理整个流就能得到结果。只要找到一个元素,就可以有结果了。同样,limit也是一个短路操作:它只需要创建一个给定大小的流,而用不着处理流中所有的元素。在碰到无限大小的流的时候,这种操作就有用了:它们可以把无限流变成有限流

3.3 查找元素

==findAny==方法将返回当前流中的任意元素。

其中这里涉及到Optional函数,以下为Optional简介:

Optional类(java.util.Optional)是一个容器类,代表一个值存在或不存在。findAny有时候可能什么元素都没找到。Java8的库设计人员引入了Optional,这样就不用返回众所周知容易出问题的null了。

Optional常用检查方法说明:

  • isPresent()将在Optional包含值的时候返回true,否则返回false。
  • ifPresent(Consumer block)会在值存在的时候执行给定的代码块。
  • T get()会在只存在时返回值,否则抛出一个NoSuchElement异常。
  • T orElse(T other)会在值存在时返回值,否则返回一个默认值。

4. 到目前为止所学习的中间操作和终端操作记录

操作 类型 返回类型 操作参数 函数描述符
filter 中间 Stream Predicate T -> boolean
map 中间 Stream Funcation T -> R
limit 中间(有状态-有界) Stream
sorted 中间 Stream Comparator (T,T) -> int
distinct 中间(有状态-无界) Stream
skip 中间(有状态-有界) Stream long
flatMap 中间 Stream Funcation> T -> boolean
anyMatch 终端 boolean Predicate T -> boolean
noneMatch 终端 boolean Predicate T -> boolean
allMatch 终端 boolean Predicate T -> boolean
findAny 终端 Optional
findFirst 终端 Optional
forEach 终端 void Consumer T -> void
collect 终端 R Collector
reduce 终端(有状态-有界) Optional BinaryOperator (T,T) -> T
count 终端 long

你可能感兴趣的:(Java8 Stream流学习笔记)