8-20 JDK8的新特性;

Stream 接口:

Java.util.stream  

stream的操作可以串行执行或者并行执行




JAVA 8 在 TIME中也提供了一些:

clock  

二、流

2.1 流介绍

流是Java API的新成员,它允许你以声明性方式处理数据集合(通过查询语句来表达,而不是临时编写一个实现)。就现在来说,你可以把它们看成遍历数据集的高级迭代器。此外,流还可以透明地并行处理,你无需写任何多线程代码了!

2.2 使用流

类别 方法名 方法签名 作用

筛选切片 filter Stream filter(Predicate predicate) 过滤操作,根据Predicate判断结果保留为真的数据,返回结果仍然是流

  distinct Stream distinct() 去重操作,筛选出不重复的结果,返回结果仍然是流


  limit Stream limit(long maxSize) 截取限制操作,只取前 maxSize条数据,返回结果仍然是流


  skip Stream skip(long n) 跳过操作,跳过n条数据,取后面的数据,返回结果仍然是流


映射 map Stream map(Function mapper) 转化操作,根据参数T,转化成R类型,返回结果仍然是流

  flatMap Stream flatMap(Function> mapper) 转化操作,根据参数T,转化成R类型流,这里会生成多个R类型流,返回结果仍然是流


匹配 anyMatch boolean anyMatch(Predicate predicate) 判断是否有一条匹配,根据Predicate判断结果中是否有一条匹配成功

  allMatch boolean allMatch(Predicate predicate) 判断是否全都匹配,根据Predicate判断结果中是否全部匹配成功


  noneMatch boolean noneMatch(Predicate predicate) 判断是否一条都不匹配,根据Predicate判断结果中是否所有的都不匹配


查找 findAny Optional findAny() 查找操作, 查询当前流中的任意元素并返回Optional

  findFirst Optional findFirst() 查找操作, 查询当前流中的第一个元素并返回Optional


归约 reduce T reduce(T identity, BinaryOperator accumulator); 归约操作,同样两个类型的数据进行操作后返回相同类型的结果。比如两个整数相加、相乘等。

  max Optional max(Comparator comparator) 求最大值,根据Comparator计算的比较结果得到最大值


  min Optional min(Comparator comparator) 求最小值,根据Comparator计算的比较结果得到最小值


汇总统计 collect R collect(Collector collector) 汇总操作,汇总对应的处理结果。这里经常与

  count long count() 统计流中数据数量


遍历 foreach void forEach(Consumer action) 遍历操作,遍历执行Consumer 对应的操作

上面是Stream API的一些常用操作,按场景结合lambda表达式调用对应方法即可。至于Stream的生成方式,Stream的of方法或者Collection接口实现类的stream方法都可以获得对应的流对象,再进一步根据需要做对应处理。

另外上述方法如果返回是Stream对象时是可以链式调用的,这个时候这个操作只是声明或者配方,不产生新的集合,这种类型的方法是惰性求值方法;有些方法返回结果非Stream类型,则是及早求值方法。

“为什么要区分惰性求值和及早求值? 只有在对需要什么样的结果和操 作有了更多了解之后, 才能更有效率地进行计算。 例如, 如果要找出大于 10 的第一个数字, 那么并不需要和所有元素去做比较, 只要找出第一个匹配的元素就够了。 这也意味着可以在集合类上级联多种操作, 但迭代只需一次。这也是函数编程中惰性计算的特性,即只在需要产生表达式的值时进行计算。这样代码更加清晰,而且省掉了多余的操作。

这里还对上述列表操作中相关的Optional与Collectors类做下说明。

Optional类是为了解决经常遇到的NullPointerException出现的,这个类是一个可能包含空值的容器类。用Optional替代null可以显示说明结果可能为空或不为空,再使用时使用isPresent方法判断就可以避免直接调用的空指针异常。

Collectors类是一个非常有用的是归约操作工具类,工具类中的方法常与流的collect方法结合使用。比如

groupingBy方法可以用来分组,在转化Map时非常实用;partitioningBy方法可以用来分区(分区可以当做一种特殊的分组,真假值分组),joining方法可以用来连接,这个应用在比如字符串拼接的场景。

2.3 并行流

Collection接口的实现类调用parallelStream方法就可以实现并行流,相应地也获得了并行计算的能力。或者Stream接口的实现调用parallel方法也可以得到并行流。并行流实现机制是基于fork/join 框架,将问题分解再合并处理。

不过并行计算是否一定比串行快呢?这也不一定。实际影响性能的点包括:

(1)数据大小输入数据的大小会影响并行化处理对性能的提升。 将问题分解之后并行化处理, 再将结果合并会带来额外的开销。 因此只有数据足够大、 每个数据处理管道花费的时间足够多

时, 并行化处理才有意义。

(2) 源数据结构

每个管道的操作都基于一些初始数据源, 通常是集合。 将不同的数据源分割相对容易,这里的开销影响了在管道中并行处理数据时到底能带来多少性能上的提升。

(3) 装箱

处理基本类型比处理装箱类型要快。

(4) 核的数量

极端情况下, 只有一个核, 因此完全没必要并行化。 显然, 拥有的核越多, 获得潜在性能提升的幅度就越大。 在实践中, 核的数量不单指你的机器上有多少核, 更是指运行时你的机器能使用多少核。 这也就是说同时运行的其他进程, 或者线程关联性( 强制线程在某些核或 CPU 上运行) 会影响性能。

(5) 单元处理开销

比如数据大小, 这是一场并行执行花费时间和分解合并操作开销之间的战争。 花在流中

每个元素身上的时间越长, 并行操作带来的性能提升越明显

实际在考虑是否使用并行时需要考虑上面的要素。在讨论流中单独操作每一块的种类时, 可以分成两种不同的操作: 无状态的和有状态的。无状态操作整个过程中不必维护状态, 有状态操作则有维护状态所需的开销和限制。如果能避开有状态, 选用无状态操作, 就能获得更好的并行性能。 无状态操作包括 map、filter 和 flatMap, 有状态操作包括 sorted、 distinct 和 limit。这种理解在理论上是更好的,当然实际使用还是以测试结果最为可靠 。

————————————————

版权声明:本文为CSDN博主「虫草」的原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/qiubabin/article/details/70256683
























9.38--9.51

你可能感兴趣的:(8-20 JDK8的新特性;)