文 | 莫若吻
(注:此文中涉及到的一部分图片为网络图片,若有问题,请联系我将其删除。)
Java 8 对 IO/NIO 也做了一些改进,主要包括:
- 改进了java.nio.charset.Charset 的实现,使编码和解码的效率得以提升;
- 精简了jre/lib/charsets.jar 包;
- 优化了 String(byte[],*) 构造方法和 String.getBytes() 方法的性能;
- 增加了一些新的 IO/NIO 方法,使用这些方法可以从文件或者输入流中获取流(java.util.stream.Stream),通过对流的操作,可以简化文本行处理、目录遍历和文件查找。
新增的 API 如下:
BufferedReader.line() --> 返回文本行的流 Stream
File.lines(Path, Charset) --> 返回文本行的流 Stream
File.list(Path) --> 遍历当前目录下的文件和目录
File.walk(Path, int, FileVisitOption) --> 遍历某一个目录下的所有文件和指定深度的子目录
File.find(Path, int, BiPredicate, FileVisitOption... ) --> 查找相应的文件eg:用流式操作列出当前目录下的所有文件和目录
Files.list(new File(".").toPath()).forEach(System.out::println);
Java 8引入了全新的Stream API。这里的Stream和I/O流不同,它更像具有Iterable的集合类,但行为和集合类又有所不同。
最新添加的Stream API(java.util.stream) 把真正的函数式编程风格引入到Java中。这是目前为止对Java类库最好的补充,因为Stream API可以极大提供Java程序员的生产力,让程序员写出高效率、干净、简洁的代码。
接口 Stream 官方英文文档地址:
http://docs.oracle.com/javase/8/docs/api/java/util/stream/Stream.html
Collectors类 官方英文文档地址:
http://docs.oracle.com/javase/8/docs/api/java/util/stream/Collectors.html
1. Stream 的官方描述
A sequence of elements supporting sequential and parallel aggregate operations .
(一个序列的元素支持顺序和并行聚合操作。)
理解:
Stream是元素的集合,这点让Stream看起来用些类似Iterator;
可以支持顺序和并行的对原Stream进行聚合(聚合也可以理解为聚汇、合并)的操作。
Note:
可以把Stream当成一个高级版本的Iterator。原始版本的Iterator,用户只能一个一个的遍历元素并对其执行某些操作;高级版本的Stream,用户只要给出需要对其包含的元素执行什么操作,如“过滤掉长度大于10的字符串”、“获取每个字符串的首字母”等,具体这些操作如何应用到每个元素上,就给Stream就OK了!
eg:获取一个List中,元素不为null的个数。
//Lists是Guava中的一个工具类 List
nums = Lists.newArrayList(1,null,3,4,null,6); nums.stream().filter(num -> num != null).count();
2. 流操作
2.1 流(Stream)操作
在官网上有这样一个示例:使用一个原始的流,以及一个只能用在原始流上的sum()方法。
int sumOfWeights = blocks.stream().filter(b -> b.getColor() == RED) .mapToInt(b -> b.getWeight()) .sum();
流提供了流畅的API,可以进行数据转换和对结果执行某些操作。流操作既可以是“中间的”也可以是“末端的”。
1)中间的 :
中间的操作保持流打开状态,并允许后续的操作。eg:filter()和map()方法就是中间的操作。
这些操作的返回数据类型是流;它们返回当前的流以便串联更多的操作。
2)末端的 :
Note:中间的 操作是延迟的(lazy)。只有末端的操作会立即开始流中元素的处理。在那个时刻,不管包含了多少中间的操作,元素会在一个传递中处理(通常,但并不总是。有状态的操作eg:sorted() 和distinct()可能需要对元素的二次传送。)末端的操作必须是对流的最终操作。当一个末端操作被调用,流被“消耗”并且不再可用。
eg:sum()方法就是一个末端的操作。
通常,处理一个流需要以下步骤:(注:这里的步骤和下面讲到的“使用Stream的基本步骤”道理是一样。只是理解方式不同)
Note:可能你想在一个方法中执行所有那些步骤。那样,就需要知道源头和流的属性,而且要可以保证它被正确的使用。你可能不想接受任意的Stream
- 从某个源头获得一个流。
- 执行一个或更多的中间的操作。
- 执行一个末端的操作。
实例作为你的方法的输入,因为它们可能具有你难以处理的特性,比如并行的或无限的。
2.2 流操作的特性
1)有状态的:
有状态的操作给流增加了一些新的属性,如:元素的唯一性,或者元素的最大数量,或者保证元素以排序的方式被处理。这些典型的要比无状态的中间操作代价大。
2)短路:
短路操作潜在的允许对流的操作尽早停止,而不去检查所有的元素。这是对无限流的一个特殊设计的属性;如果对流的操作没有短路,那么代码可能永远也不会终止。
2.3 中间的 操作(API方法)
filter() --> 排除所有与断言不匹配的元素。
map() --> 通过Function对元素执行一对一的转换。
flatMap() --> 通过FlatMapper将每个元素转变为无或更多的元素。
peek() --> 对每个遇到的元素执行一些操作。主要对调试很有用。
distinct() --> 根据.equals行为排除所有重复的元素。这是一个有状态的操作。
sorted() --> 确保流中的元素在后续的操作中,按照比较器(Comparator)决定的顺序访问。这是一个有状态的操作。
limit() --> 保证后续的操作所能看到的最大数量的元素。这是一个有状态的短路的操作。
substream() --> 确保后续的操作只能看到一个范围的(根据index)元素。像不能用于流的String.substring一样。也有两种形式,一种有一个开始索引,一种有一个结束索引。二者都是有状态的操作,有一个结束索引的形式也是一个短路的操作。
2.4 末端的 操作(API方法)
forEach() -->对流中的每个元素执行一些操作。
toArray() --> 将流中的元素倾倒入一个数组。
reduce() --> 通过一个二进制操作将流中的元素合并到一起。
collect() --> 将流中的元素倾倒入某些容器,eg:一个Collection或Map.
min() --> 根据一个比较器找到流中元素的最小值。
max() --> 根据一个比较器找到流中元素的最大值。
count() --> 计算流中元素的数量。
anyMatch() --> 判断流中是否至少有一个元素匹配断言。这是一个短路的操作。
allMatch() --> 判断流中是否每一个元素都匹配断言。这是一个短路的操作。
noneMatch()--> 判断流中是否没有一个元素匹配断言。这是一个短路的操作。
findFirst()--> 查找流中的第一个元素。这是一个短路的操作。
findAny() --> 查找流中的任意元素,可能对某些流要比findFirst代价低。这是一个短路的操作。
3. 使用Stream的基本步骤
1)创建Stream;
2)转换Stream,每次转换原有Stream对象不改变,返回一个新的Stream对象(可以有多次转换);
3)对Stream进行聚合(Reduce)操作,获取想要的结果。
(注:官方文档 reduce,也叫fold。“聚合”一词是我自己翻译的;也可以理解为合并。具体怎么译看每个人怎么理解。也有人译成 汇聚。)
eg:
剖析Stream通用语法
图片就是对于Stream例子的一个解析:原本一条语句被三种颜色的框分割成了三个部分。
红色框中的语句是一个Stream的生命开始的地方,负责创建一个Stream实例;
绿色框中的语句是赋予Stream灵魂的地方,把一个Stream转换成另外一个Stream,红框的语句生成的是一个包含所有nums变量的Stream,进过绿框的filter方法以后,重新生成了一个过滤掉原nums列表所有null以后的Stream;
蓝色框中的语句是丰收的地方,把Stream的里面包含的内容按照某种算法来汇聚成一个值,例子中是获取Stream中包含的元素个数。
过程解析如图:
4. 创建Stream
最常用的创建Stream有两种途径:
1)通过Stream接口的静态工厂方法(Note:Java8里接口可以带静态方法)。
2)通过Collection接口的默认方法 stream(),把一个Collection对象转换成Stream。
4.1 使用Stream静态方法来创建Stream
有三种方式:
1) of方法: 有两个,一个接受变长参数,一个接受单一值。
static
Stream of(T... values) static
Stream of(T t) eg:
Stream
integerStream = Stream.of(1, 5, 9, 5); Stream stringStream = Stream.of("meili");
2) generator方法:生成一个无限长度的Stream,其元素的生成是通过给定的Supplier(这个接口可以看成一个对象的工厂,每次调用返回一个给定类型的对象)
static
Stream generate(Supplier s) eg:
//1.普通表现形式 Stream.generate(new Supplier
() { @Override public Double get() { return Math.random(); } }); //2.lambda表达式的表现形式 Stream.generate(() -> Math.random()); //3.方法引用的表现形式 Stream.generate(Math::random);
上面三条语句的作用都是一样的,只是使用了lambda表达式和方法引用的语法来简化代码。
每条语句其实都是生成一个无限长度的Stream,其中值是随机的。
这个无限长度Stream是懒加载,一般这种无限长度的Stream都会配合Stream的 limit()方法来用。
3) iterate方法:也是生成无限长度的Stream,和generator不同的是,其元素的生成是重复对给定的种子值(seed)调用用户指定函数来生成的。其中包含的元素可以认为是:seed,f(seed),f(f(seed))无限循环
static
Stream iterate(T seed, UnaryOperator f) eg:
//先获取一个无限长度的正整数集合的Stream,然后取出前10个打印。 Stream.iterate(1, item -> item + 1).limit(10).forEach(System.out::println);
Note:此方法需配合 limit()方法 使用 ,不然会无限打印下去。
4.2 通过Collection子类获取Stream
Collection接口有一个stream方法,所以其所有子类都都可以获取对应的Stream对象。从List对象获取其对应的Stream对象。
public interface Collection
extends Iterable { //其他方法省略 default Stream stream() { return StreamSupport.stream(spliterator(), false); } }
eg:一个流的最常见方法是从一个collection获取。
Stream
stream = collection.stream();
5.转换Stream
转换Stream其实就是把一个Stream通过某些行为转换成一个新的Stream。
eg:
说明:给定一个Integer类型的List,获取其对应的Stream对象,然后进行过滤掉null,再去重,再每个元素乘以2,再每个元素被消费的时候打印自身,在跳过前两个元素,最后去前四个元素进行加和运算。List
nums = Lists.newArrayList(1,1,null,2,3,4,null,5,6,7,8,9,10); System.out.println(“sum is:” + nums.stream().filter(num -> num != null) .distinct().mapToInt(num -> num * 2) .peek(System.out::println).skip(2).limit(4).sum() );
性能问题:
在对于一个Stream进行多次转换操作,每次都对Stream的每个元素进行转换,而且是执行多次,这样时间复杂度就是一个for循环里把所有操作都做掉的N(转换的次数)倍。但是事实上不是这样的,转换操作都是lazy的,多个转换操作只会在聚合(reduce)操作的时候融合起来,一次循环完成。我们可以这样简单的理解,Stream里有个操作函数的集合,每次转换操作就是把转换函数放入这个集合中,在聚合操作的时候循环Stream对应的集合,然后对每个元素执行所有的函数。
5.1 distinct()
Stream
distinct() 对于Stream中包含的元素进行去重操作(去重逻辑依赖元素的equals方法),新生成的Stream中没有重复的元素。(根据.equals行为排除所有重复的元素。)
distinct()方法示意图:
5.2 filter( )
Stream
filter(Predicate super T> predicate)
对于Stream中包含的元素使用给定的过滤函数进行过滤操作,新生成的Stream只包含符合条件的元素。(排除所有与断言不匹配的元素。)
filter()方法示意图:
5.3 map( )
Stream map(Function super T,? extends R> mapper) DoubleStream mapToDouble(ToDoubleFunction super T> mapper)
IntStreammapToInt(ToIntFunction super T> mapper)
LongStream mapToLong(ToLongFunction super T> mapper)对于Stream中包含的元素使用给定的转换函数进行转换操作,新生成的Stream只包含转换生成的元素。(通过Function对元素执行一对一的转换)
这个方法有三个对于原始类型的变种方法,分别是:mapToInt(),mapToLong()和mapToDouble()。比较好理解,如mapToInt就是把原始Stream转换成一个新的Stream,这个新生成的Stream中的元素都是int类型。此三个变种方法,可以免除自动装箱/拆箱的额外消耗;
map()方法示意图:
5.4 flatMap( )
Stream flatMap(Function super T,? extends Stream extends R>> mapper)
DoubleStream flatMapToDouble(Function super T,? extends DoubleStream> mapper)
IntStream flatMapToInt(Function super T,? extends IntStream> mapper)
LongStream flatMapToLong(Function super T,? extends LongStream> mapper)和map类似,不同的是其每个元素转换得到的是Stream对象,会把子Stream中的元素压缩到父集合中。(通过FlatMapper将每个元素转变为无或更多的元素。)
flatMap()方法示意图:
5.5 peek( )
Stream
peek(Consumer super T> action) (返回一个流的元素组成的流,另外在每个元素上执行所提供的行动产生的流元素消耗。)
生成一个包含原Stream的所有元素的新Stream,同时会提供一个消费函数(Consumer实例),新Stream每个元素被消费的时候都会执行给定的消费函数.(对每个遇到的元素执行一些操作。主要对调试很有用。)
peek()方法示意图:
5.6 limit( )
Stream
limit(long maxSize)
对一个Stream进行截断操作,获取其前N个元素;如果原Stream中包含的元素个数小于N,那就获取其所有的元素。(保证后续的操作所能看到的最大数量的元素。)
limit()方法示意图:
5.7 skip( )
Stream
skip(long n) 返回一个丢弃原Stream的前N个元素后剩下元素组成的新Stream,如果原Stream中包含的元素个数小于N,那么返回空Stream。(取N个元素后面的所有元素)
skip()方法示意图:
6.Reduce(聚合)Stream
聚合(也称为折叠)接受一个元素序列为输入,反复使用某个合并操作,把序列中的元素合并成一个汇总的结果。eg:查找一个数字列表的总和或者最大值,或者把这些数字累积成一个List对象。
Stream接口有一些通用的聚合操作,eg:reduce()和collect();
也有一些特定用途的聚合操作,eg:sum(),max()和count()。
Note:sum()方法不是所有的Stream对象都有的,只有IntStream、LongStream和DoubleStream是实例才有。
聚合操作:
1)可变聚合:把输入的元素们累积到一个可变的容器中,eg:Collection或者StringBuilder。
2)其他聚合:除去可变汇聚剩下的,一般都不是通过反复修改某个可变对象,而是通过把前一次的聚合(汇聚)结果当成下一次的入参,反复如此。eg:reduce(),count(),allMatch()。
6.1 可变聚合(collect)
collect()方法可以把Stream中的所有元素收集到一个结果容器中(eg:Collection)
Rcollect(Collector super T,A,R> collector)
R collect(Supplier supplier, BiConsumer accumulator, BiConsumer combiner) 方法参数说明:Supplier supplier是一个工厂函数,用来生成一个新的容器;BiConsumer accumulator也是一个函数,用来把Stream中的元素添加到结果容器中;BiConsumer combiner还是一个函数,用来把中间状态的多个结果容器合并成为一个(并发的时候会用到)。
eg:对一个元素是Integer类型的List,先过滤掉全部的null,然后把剩下的元素收集到一个新的List中。
说明:第一个函数生成一个新的ArrayList实例;List
nums = Lists.newArrayList(1,1,null,2,3,4,null,5,6,7,8,9,10); List numsWithoutNull = nums.stream().filter(num -> num != null) .collect(() -> new ArrayList (), (list, item) -> list.add(item), (list1, list2) -> list1.addAll(list2));
第二个函数接受两个参数,第一个是前面生成的ArrayList对象,第二个是stream中包含的元素,函数体就是把stream中的元素加入ArrayList对象中。第二个函数被反复调用直到原stream的元素被消费完毕;
第三个函数也是接受两个参数,这两个都是ArrayList类型的,函数体就是把第二个ArrayList全部加入到第一个中。
Java8还给我们提供了Collector的工具类Collectors,其中已经定义了一些静态工厂方法,
eg:Collectors.toCollection()收集到Collection中;
Collectors.toList()收集到List中;
Collectors.toSet()收集到Set中。
Collectors英文文档地址:
http://docs.oracle.com/javase/8/docs/api/java/util/stream/Collectors.html
eg:
List
nums = Lists.newArrayList(1,1,null,2,3,4,null,5,6,7,8,9,10); List numsWithoutNull = nums.stream().filter(num -> num != null) .collect(Collectors.toList());
6.2其他聚合(或汇聚)
reduce()、count(),sum()等方法。
reduce()方法有三种形式:
Optional
reduce(BinaryOperator accumulator)
T reduce(T identity, BinaryOperatoraccumulator)
U reduce(U identity, BiFunction accumulator, BinaryOperator combiner)
eg:
一个参数的reduce方法:
两个参数的 reduce方法:/** *这个函数有两个参数,第一个参数是上次函数执行的返回值(也称为中间结果),第二个参数是stream中的元素,这个函数把这两个值相加,得到的和会被赋值给下次执行这个函数的第一个参数。Note:**第一次执行的时候第一个参数的值是Stream的第一个元素,第二个参数是Stream的第二个元素。 *这个方法返回值类型是Optional,这是Java8防止出现NPE的一种可行方法。 */ List
ints = Lists.newArrayList(1,2,3,4,5,6,7,8,9,10); System.out.println("ints sum is:" + ints.stream().reduce((sum, item) -> sum + item).get());
count()方法示例:/** *不同的是:它允许用户提供一个循环计算的初始值,如果Stream为空,就直接返回该值。 *而且这个方法不会返回Optional,因为其不会出现null值。 */ List
ints = Lists.newArrayList(1,2,3,4,5,6,7,8,9,10); System.out.println("sum is:" + ints.stream().reduce(0, (sum, item) -> sum + item));
List
ints = Lists.newArrayList(1,2,3,4,5,6,7,8,9,10); System.out.println("sum is:" + ints.stream().count());
7. 应用示例
1)Stream API示例
eg:
public class MyStreams { private enum Status { OPEN, CLOSED }; /** * Task类有一个分数的概念(或者说是伪复杂度),其次是还有一个值可以为OPEN或CLOSED的状态. */ private static final class Task { private final Status status; private final Integer points; Task( final Status status, final Integer points ) { this.status = status; this.points = points; } public Integer getPoints() { return points; } public Status getStatus() { return status; } @Override public String toString() { return String.format( "[%s, %d]", status, points ); } } } /** * Stream API极大简化了集合框架的处理 */ public class StreamDemo { public static void main(String[] args) { final Collection< Task > tasks = Arrays.asList( new Task( Status.OPEN, 5 ), new Task( Status.OPEN, 13 ), new Task( Status.CLOSED, 8 ) ); //1.获取tasks中状态为OPEN的总数和 getOpenTotalPoint(); //2.计算所有状态的总和 getTotalPoints(); //3.根据状态分组 getListByStatus(); //4.计算整个集合中每个task分数(或权重)的平均值 //5.从文本文件中逐行读取数据这样典型的I/O操作也很适合用Stream API来处理。 final Path path = new File( filename ).toPath(); try( Stream< String > lines = Files.lines( path, StandardCharsets.UTF_8 ) ) { //对一个stream对象调用onClose方法会返回一个在原有功能基础上新增了关闭功能的stream对象, //当对stream对象调用close()方法时,与关闭相关的处理器就会执行。 lines.onClose( () -> System.out.println("Done!") ).forEach( System.out::println ); } } /** 1.获取tasks中状态为OPEN的总数和 思路: 第一,task集合被转换化为其相应的stream表示。然后,filter操作过滤掉状态为CLOSED的task。 下一步,mapToInt操作通过Task::getPoints这种方式调用每个task实例的getPoints方法把Task的stream转化为Integer的stream。 最后,用sum函数把所有的分数加起来,得到最终的结果。 */ public static void getOpenTotalPoint(){ final long totalPointsOfOpenTasks = tasks .stream() .filter( task -> task.getStatus() == Status.OPEN ) .mapToInt( Task::getPoints ) .sum(); System.out.println( "OPEN--Total points: " + totalPointsOfOpenTasks );//输出结果:OPEN--Total points:18 } /** * stream另一个有价值的地方是能够原生支持并行处理。 * 2.计算所有状态的总和 */ public static void getTotalPoints(){ //这个示例和第一个示例很相似,但这个例子的不同之处在于这个程序是并行运行的, //其次使用reduce方法来算最终的结果。 final double totalPoints = tasks .stream() .parallel() .map( task -> task.getPoints() ) // 或 map( Task::getPoints ) .reduce( 0, Integer::sum ); System.out.println( "Total points (all tasks): " + totalPoints );//输出结果:Total points (all tasks): 26.0 } /** 按照某种准则来对集合中的元素进行分组。 3.根据状态分组 */ public static void getListByStatus(){ final Map< Status, List< Task > > map = tasks .stream() .collect( Collectors.groupingBy( Task::getStatus ) ); System.out.println( map );//输出结果:{CLOSED=[[CLOSED, 8]], OPEN=[[OPEN, 5], [OPEN, 13]]} } /** 4.计算整个集合中每个task分数(或权重)的平均值 */ public static void getPercentage(){ final Collection< String > result = tasks .stream() // Stream< String > .mapToInt( Task::getPoints ) // IntStream .asLongStream() // LongStream .mapToDouble( points -> points / totalPoints ) // DoubleStream .boxed() // Stream< Double > .mapToLong( weigth -> ( long )( weigth * 100 ) ) // LongStream .mapToObj( percentage -> percentage + "%" ) // Stream< String> .collect( Collectors.toList() ); // List< String > System.out.println( result );//输出结果:[19%, 50%, 30%] } }
2)生成斐波那契数列示例(利用Stream API,可以设计更加简单的数据接口。)
生成斐波那契数列,完全可以用一个无穷流表示(受限Java的long型大小,可以改为BigInteger)。
eg:
class FibonacciSupplier implements Supplier
{ long a = 0; long b = 1; @Override public Long get() { long x = a + b; a = b; b = x; return a; } } public class FibonacciStream { public static void main(String[] args) { Stream fibonacci = Stream.generate(new FibonacciSupplier()); fibonacci.limit(10).forEach(System.out::println); //如果想取得数列的前10项,用limit(10),如果想取得数列的第20~30项,用skip(), //通过collect()方法把Stream变为List。该List存储的所有元素就已经是计算出的确定的元素了. List list = fibonacci.skip(20).limit(10).collect(Collectors.toList()); } }
Note:用Stream表示Fibonacci数列,其接口比任何其他接口定义都要来得简单灵活并且高效。
3)计算π可以利用π的展开式:π/4 = 1 - 1/3 + 1/5 - 1/7 + 1/9 - ...
eg:
输出结果:/** * 把π表示为一个无穷Stream */ class PiSupplier implements Supplier
{ double sum = 0.0; double current = 1.0; boolean sign = true; @Override public Double get() { sum += (sign ? 4 : -4) / this.current; this.current = this.current + 2.0; this.sign = ! this.sign; return sum; } } public class StreamDemo { public static void main(String[] args) { /* * 这个级数从100项开始可以把π的值精确到3.13~3.15之间 */ Stream piStream = Stream.generate(new PiSupplier()); piStream.skip(100).limit(10).forEach(System.out::println); } } 3.1514934010709914
3.1317889675734545
3.1513011626954057
3.131977491197821
3.1511162471786824
3.1321589012071183
3.150938243930123
3.132333592767332
3.1507667724908344
3.1325019323081857
4)利用欧拉变换对级数进行加速,
可以利用下面的公式:
eg:
输出结果:/** * 用代码实现就是把一个流变成另一个流 */ class EulerTransform implements Function
{ double n1 = 0.0; double n2 = 0.0; double n3 = 0.0; @Override public Double apply(Double t) { n1 = n2; n2 = n3; n3 = t; if (n1 == 0.0) { return 0.0; } return calc(); } double calc() { double d = n3 - n2; return n3 - d * d / (n1 - 2 * n2 + n3); } } public class StreamDemo { public static void main(String[] args) { /* * 可以在10项之内把π的值计算到3.141~3.142之间: */ Stream piStream2 = Stream.generate(new PiSupplier()); piStream2.map(new EulerTransform()) .limit(10) .forEach(System.out::println); } } 0.0
0.0
3.166666666666667
3.1333333333333337
3.1452380952380956
3.13968253968254
3.1427128427128435
3.1408813408813416
3.142071817071818
3.1412548236077655
可以多次使用上面的加速器,下面输出结果自己测试哦。
/* 20项之内可以计算出极其精确的值 */ Stream
piStream3 = Stream.generate(new PiSupplier()); piStream3.map(new EulerTransform()) .map(new EulerTransform()) .map(new EulerTransform()) .map(new EulerTransform()) .map(new EulerTransform()) .limit(20) .forEach(System.out::println);
8.流(Stream)的串行与并行
一个流就像一个地带器。这些值“流过”(模拟水流)然后他们离开。一个流可以只被遍历一次,然后被丢弃。流也可以无限使用。
流能够是 串行的 或者 并行的。 它们可以使用其中一种方式开始,然后切换到另外的一种方式;使用stream.sequential()(切换串行)或stream.parallel()(切换并行)来达到这种切换。串行流在一个线程上连续操作。而并行流就可能一次出现在多个线程上。
Note:
重要的是要意识到并行不是毫无代价的。从性能的立场它不是无代价的,不能简单的将顺序流替换为并行流,且不做进一步思考就期望得到相同的结果。在并行化一个流以前,需要考虑很多特性,关于流、它的操作以及数据的目标方面。eg:访问顺序确实对我有影响吗?我的函数是无状态的吗?我的流有足够大,并且我的操作有足够复杂,这些能使得并行化是值得的吗?
如何通过并行Stream来提升性能?
//如何并行Stream来提升性能 class StreamDemo { public static void main(String[] args) { //创建一个没有重复元素的大表 int max =1000000; List
val=new ArrayList<>(max); for(int i=0;i
Collection是关于静止的数据结构,而Stream是有关动词算法和计算的。
Collection是主要面向内存,存储在内存中;Stream主要是面向CPU,通过CPU实现计算的。
理解说明:
将一个影片存储在DVD盘上,这是一个集合,因为它包含整个电影的字节数据结构,而这个影片被放在互联网上,我们通过视频软件去观看它时,它实际是被流化了,它变成了一个字节流,流是与时间有关的概念,而数据结构是与时间无关,不会随着时间变化变化,流正好相反,随着时间不断地动态变化,如同水流一样潺潺不断。
所以,集合与流的主要区别是是否需要被计算,集合是一个内存数据结构,集合中每个元素在加入到集合之前已经被计算了,相反,流是在即时要求即时计算。
使用集合需要开发者主动去遍历,使用一个遍历循环,这称为外部遍历。
使用一个流库需要使用内部遍历,它自己为你遍历元素,然后将结果保存在某处,你只要提供一个函数,它就会用这个函数对元素处理完成。eg:
List
transactionIds = new ArrayList<>(); for(Transaction t: transactions){ transactionIds.add(t.getId()); //外部遍历 } List transactionIds = transactions.stream() .map(Transaction::getId) //内部遍历 .collect(toList()) }
Stream操作不同于Collection操作有两个根本点:
1)管道Pipelining: 许多流Stream操作返回流Stream自身,这就允许对其操作可以像链条一样排列,变成一个管道,这其中也会激活比如懒加载和short-circuiting操作。
2)内部迭代:相比于集合Collection是显式迭代(需要我们编码完成迭代),Stream操作是在其内部完成迭代操作。
以下Oracle官方给出的解释:
1)集合类持有的所有元素都是存储在内存中的,非常巨大的集合类会占用大量的内存,而Stream的元素却是在访问的时候才被计算出来,这种“延迟计算”的特性有点类似Clojure的lazy-seq,占用内存很少。
2)集合类的迭代逻辑是调用者负责,通常是for循环,而Stream的迭代是隐含在对Stream的各种操作中,eg:map()。
要理解“延迟计算”,不妨创建一个无穷大小的Stream。
分析:如果要表示自然数集合,显然用集合类是不可能实现的,因为自然数有无穷多个。但是Stream可以做到。
eg:
/** * 自然数集合的规则非常简单,每个元素都是前一个元素的值+1。 * 反复调用get(),将得到一个无穷数列,利用这个Supplier,可以创建一个无穷的Stream */ class NaturalSupplier implements Supplier
{ long num = 0; public Long get() { this.num = this.num + 1; return this.num; } } class StreamDemo { public static void main(String[] args) { /** * 对这个Stream做任何map()、filter()等操作都是完全可以的,这说明Stream API对Stream进行转换并生成一个新的Stream并非实时计算,而是做了延迟计算。 * 当然,对这个无穷的Stream不能直接调用forEach(),这样会无限打印下去。但是我们可以利用limit()变换,把这个无穷Stream变换为有限的Stream。 */ Stream
natural = Stream.generate(new NaturalSupplier()); natural.map((x) -> { return x * x; }).limit(10).forEach(System.out::println); } }