Java8Stream

StreamAPI(一)

1. 流的基本概念

1.1 什么是流?

流是Java8引入的全新概念,它用来处理集合中的数据,暂且可以把它理解为一种高级集合。

众所周知,集合操作非常麻烦,若要对集合进行筛选、投影,需要写大量的代码,而流是以声明的形式操作集合,它就像SQL语句,我们只需告诉流需要对集合进行什么操作,它就会自动进行操作,并将执行结果交给你,无需我们自己手写代码。

因此,流的集合操作对我们来说是透明的,我们只需向流下达命令,它就会自动把我们想要的结果给我们。由于操作过程完全由Java处理,因此它可以根据当前硬件环境选择最优的方法处理,我们也无需编写复杂又容易出错的多线程代码了。

1.2 流的特点

  1. 只能遍历一次 
    我们可以把流想象成一条流水线,流水线的源头是我们的数据源(一个集合),数据源中的元素依次被输送到流水线上,我们可以在流水线上对元素进行各种操作。一旦元素走到了流水线的另一头,那么这些元素就被“消费掉了”,我们无法再对这个流进行操作。当然,我们可以从数据源那里再获得一个新的流重新遍历一遍。

  2. 采用内部迭代方式 
    若要对集合进行处理,则需我们手写处理代码,这就叫做外部迭代。而要对流进行处理,我们只需告诉流我们需要什么结果,处理过程由流自行完成,这就称为内部迭代。

1.3 流的操作种类

流的操作分为两种,分别为中间操作 和 终端操作。

  1. 中间操作 
    当数据源中的数据上了流水线后,这个过程对数据进行的所有操作都称为“中间操作”。 
    中间操作仍然会返回一个流对象,因此多个中间操作可以串连起来形成一个流水线。

  2. 终端操作 
    当所有的中间操作完成后,若要将数据从流水线上拿下来,则需要执行终端操作。 
    终端操作将返回一个执行结果,这就是你想要的数据。

1.4 流的操作过程

使用流一共需要三步:

  1. 准备一个数据源
  2. 执行中间操作 
    中间操作可以有多个,它们可以串连起来形成流水线。
  3. 执行终端操作 
    执行终端操作后本次流结束,你将获得一个执行结果。

2. 流的使用

2.1 获取流

在使用流之前,首先需要拥有一个数据源,并通过StreamAPI提供的一些方法获取该数据源的流对象。数据源可以有多种形式:

  1. 集合 
    这种数据源较为常用,通过stream()方法即可获取流对象:
List list = new ArrayList(); 
Stream stream = list.stream();
  • 1
  • 2
  1. 数组 
    通过Arrays类提供的静态函数stream()获取数组的流对象:
String[] names = {"chaimm","peter","john"};
Stream<String> stream = Arrays.stream(names);
  • 1
  • 2
  1. 值 
    直接将几个值变成流对象:
Stream<String> stream = Stream.of("chaimm","peter","john");
  • 1
  1. 文件 
    try(Stream lines = Files.lines(Paths.get(“文件路径名”),Charset.defaultCharset())){ 
    //可对lines做一些操作 
    }catch(IOException e){ 

    PS:Java7简化了IO操作,把打开IO操作放在try后的括号中即可省略关闭IO的代码。

2.2 筛选filter

filter函数接收一个Lambda表达式作为参数,该表达式返回boolean,在执行过程中,流将元素逐一输送给filter,并筛选出执行结果为true的元素。 
如,筛选出所有学生:

List result = list.stream()
                    .filter(Person::isStudent)
                    .collect(toList());
  • 1
  • 2
  • 3

2.3 去重distinct

去掉重复的结果:

List result = list.stream()
                    .distinct()
                    .collect(toList());
  • 1
  • 2
  • 3

2.4 截取

截取流的前N个元素:

List result = list.stream()
                    .limit(3)
                    .collect(toList());
  • 1
  • 2
  • 3

2.5 跳过

跳过流的前n个元素:

List result = list.stream()
                    .skip(3)
                    .collect(toList());
  • 1
  • 2
  • 3

2.6 映射

对流中的每个元素执行一个函数,使得元素转换成另一种类型输出。流会将每一个元素输送给map函数,并执行map中的Lambda表达式,最后将执行结果存入一个新的流中。 
如,获取每个人的姓名(实则是将Perosn类型转换成String类型):

List<Person> result = list.stream()
                    .map(Person::getName)
                    .collect(toList());
  • 1
  • 2
  • 3

2.7 合并多个流

例:列出List中各不相同的单词,List集合如下:

List<String> list = new ArrayList<String>();
list.add("I am a boy");
list.add("I love the girl");
list.add("But the girl loves another girl");
  • 1
  • 2
  • 3
  • 4

思路如下:

  • 首先将list变成流:
list.stream();
  • 1
  • 按空格分词:
list.stream()
            .map(line->line.split(" "));
  • 1
  • 2

分完词之后,每个元素变成了一个String[]数组。

  • 将每个String[]变成流:
list.stream()
            .map(line->line.split(" "))
            .map(Arrays::stream)
  • 1
  • 2
  • 3

此时一个大流里面包含了一个个小流,我们需要将这些小流合并成一个流。

  • 将小流合并成一个大流: 
    用flagmap替换刚才的map
list.stream()
            .map(line->line.split(" "))
            .flagmap(Arrays::stream)
  • 1
  • 2
  • 3
  • 去重
list.stream()
            .map(line->line.split(" "))
            .flagmap(Arrays::stream)
            .distinct()
            .collect(toList());
  • 1
  • 2
  • 3
  • 4
  • 5

2.8 是否匹配任一元素:anyMatch

anyMatch用于判断流中是否存在至少一个元素满足指定的条件,这个判断条件通过Lambda表达式传递给anyMatch,执行结果为boolean类型。 
如,判断list中是否有学生:

boolean result = list.stream()
            .anyMatch(Person::isStudent);
  • 1
  • 2

2.9 是否匹配所有元素:allMatch

allMatch用于判断流中的所有元素是否都满足指定条件,这个判断条件通过Lambda表达式传递给anyMatch,执行结果为boolean类型。 
如,判断是否所有人都是学生:

boolean result = list.stream()
            .allMatch(Person::isStudent);
  • 1
  • 2

2.10 是否未匹配所有元素:noneMatch

noneMatch与allMatch恰恰相反,它用于判断流中的所有元素是否都不满足指定条件:

boolean result = list.stream()
            .noneMatch(Person::isStudent);
  • 1
  • 2

2.11 获取任一元素findAny

findAny能够从流中随便选一个元素出来,它返回一个Optional类型的元素。

Optional person = list.stream()
                                    .findAny();
  • 1
  • 2

Optional介绍

Optional是Java8新加入的一个容器,这个容器只存1个或0个元素,它用于防止出现NullpointException,它提供如下方法:

  • isPresent() 
    判断容器中是否有值。
  • ifPresent(Consume lambda) 
    容器若不为空则执行括号中的Lambda表达式。
  • T get() 
    获取容器中的元素,若容器为空则抛出NoSuchElement异常。
  • T orElse(T other) 
    获取容器中的元素,若容器为空则返回括号中的默认值。

2.12 获取第一个元素findFirst

Optional person = list.stream()
                                    .findFirst();
  • 1
  • 2

2.13 归约

归约是将集合中的所有元素经过指定运算,折叠成一个元素输出,如:求最值、平均数等,这些操作都是将一个集合的元素折叠成一个元素输出。

在流中,reduce函数能实现归约。 
reduce函数接收两个参数:

  • 初始值
  • 进行归约操作的Lambda表达式

2.13.1 元素求和:自定义Lambda表达式实现求和

例:计算所有人的年龄总和

int age = list.stream().reduce(0, (person1,person2)->person1.getAge()+person2.getAge());
  • 1

reduce的第一个参数表示初试值为0; 
reduce的第二个参数为需要进行的归约操作,它接收一个拥有两个参数的Lambda表达式,reduce会把流中的元素两两输给Lambda表达式,最后将计算出累加之和。

2.13.2 元素求和:使用Integer.sum函数求和

上面的方法中我们自己定义了Lambda表达式实现求和运算,如果当前流的元素为数值类型,那么可以使用Integer提供了sum函数代替自定义的Lambda表达式,如:

int age = list.stream().reduce(0, Integer::sum);
  • 1

Integer类还提供了min、max等一系列数值操作,当流中元素为数值类型时可以直接使用。

2.14 数值流的使用

采用reduce进行数值操作会涉及到基本数值类型和引用数值类型之间的装箱、拆箱操作,因此效率较低。 
当流操作为纯数值操作时,使用数值流能获得较高的效率。

2.14.1 将普通流转换成数值流

StreamAPI提供了三种数值流:IntStream、DoubleStream、LongStream,也提供了将普通流转换成数值流的三种方法:mapToInt、mapToDouble、mapToLong。 
如,将Person中的age转换成数值流:

IntStream stream = list.stream()
                            .mapToInt(Person::getAge);
  • 1
  • 2

2.14.2 数值计算

每种数值流都提供了数值计算函数,如max、min、sum等。 
如,找出最大的年龄:

OptionalInt maxAge = list.stream()
                                .mapToInt(Person::getAge)
                                .max();
  • 1
  • 2
  • 3

由于数值流可能为空,并且给空的数值流计算最大值是没有意义的,因此max函数返回OptionalInt,它是Optional的一个子类,能够判断流是否为空,并对流为空的情况作相应的处理。 

此外,mapToInt、mapToDouble、mapToLong进行数值操作后的返回结果分别为:OptionalInt、OptionalDouble、OptionalLong

StreamAPI(二)

1. 收集器简介

收集器用来将经过筛选、映射的流进行最后的整理,可以使得最后的结果以不同的形式展现。

collect方法即为收集器,它接收Collector接口的实现作为具体收集器的收集方法。

Collector接口提供了很多默认实现的方法,我们可以直接使用它们格式化流的结果;也可以自定义Collector接口的实现,从而定制自己的收集器。

这里先介绍Collector常用默认静态方法的使用,自定义收集器会在下一篇博文中介绍。

2. 收集器的使用

2.1 归约

流由一个个元素组成,归约就是将一个个元素“折叠”成一个值,如求和、求最值、求平均值都是归约操作。

2.1.1 计数

long count = list.stream()
                    .collect(Collectors.counting());
  • 1
  • 2

也可以不使用收集器的计数函数:

long count = list.stream().count();
  • 1

注意:计数的结果一定是long类型。

2.1.2 最值

例:找出所有人中年龄最大的人

Optional oldPerson = list.stream()
                    .collect(Collectors.maxBy(Comparator.comparingInt(Person::getAge)));
  • 1
  • 2

计算最值需要使用Collector.maxBy和Collector.minBy,这两个函数需要传入一个比较器Comparator.comparingInt,这个比较器又要接收需要比较的字段。 
这个收集器将会返回一个Optional类型的值。 
Optional类简介请移步至:Java8新特性——StreamAPI(一)

2.1.3 求和

例:计算所有人的年龄总和

int summing = list.stream()
                    .collect(Collectors.summingInt(Person::getAge));
  • 1
  • 2

当然,既然Java8提供了summingInt,那么还提供了summingLong、summingDouble。

2.1.4 求平均值

例:计算所有人的年龄平均值

double avg = list.stream()
                    .collect(Collectors.averagingInt(Person::getAge));
  • 1
  • 2

注意:计算平均值时,不论计算对象是int、long、double,计算结果一定都是double。

2.1.5 一次性计算所有归约操作

Collectors.summarizingInt函数能一次性将最值、均值、总和、元素个数全部计算出来,并存储在对象IntSummaryStatisics中。 
可以通过该对象的getXXX()函数获取这些值。

2.1.6 连接字符串

例:将所有人的名字连接成一个字符串

String names = list.stream()
                        .collect(Collectors.joining());
  • 1
  • 2

每个字符串默认分隔符为空格,若需要指定分隔符,则在joining中加入参数即可:

String names = list.stream()
                        .collect(Collectors.joining(", "));
  • 1
  • 2

此时字符串之间的分隔符为逗号。

2.1.7 一般性的归约操作

若你需要自定义一个归约操作,那么需要使用Collectors.reducing函数,该函数接收三个参数:

  • 第一个参数为归约的初始值
  • 第二个参数为归约操作进行的字段
  • 第三个参数为归约操作的过程

例:计算所有人的年龄总和

Optional sumAge = list.stream()
                                    .collect(Collectors.reducing(0,Person::getAge,(i,j)->i+j));
  • 1
  • 2

上面例子中,reducing函数一共接收了三个参数:

  • 第一个参数表示归约的初始值。我们需要累加,因此初始值为0
  • 第二个参数表示需要进行归约操作的字段。这里我们对Person对象的age字段进行累加。
  • 第三个参数表示归约的过程。这个参数接收一个Lambda表达式,而且这个Lambda表达式一定拥有两个参数,分别表示当前相邻的两个元素。由于我们需要累加,因此我们只需将相邻的两个元素加起来即可。

Collectors.reducing方法还提供了一个单参数的重载形式。 
你只需传一个归约的操作过程给该方法即可(即第三个参数),其他两个参数均使用默认值。

  • 第一个参数默认为流的第一个元素
  • 第二个参数默认为流的元素 
    这就意味着,当前流的元素类型为数值类型,并且是你要进行归约的对象。

例:采用单参数的reducing计算所有人的年龄总和

Optional sumAge = list.stream()
            .filter(Person::getAge)
            .collect(Collectors.reducing((i,j)->i+j));
  • 1
  • 2
  • 3

2.2 分组

分组就是将流中的元素按照指定类别进行划分,类似于SQL语句中的GROUPBY。

2.2.1 一级分组

例:将所有人分为老年人、中年人、青年人

Map> result = list.stream()
                                    .collect(Collectors.groupingby((person)->{
        if(person.getAge()>60)
            return "老年人";
        else if(person.getAge()>40)
            return "中年人";
        else
            return "青年人";
                                    }));
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

groupingby函数接收一个Lambda表达式,该表达式返回String类型的字符串,groupingby会将当前流中的元素按照Lambda返回的字符串进行分组。 
分组结果是一个Map< String,List< Person>>,Map的键就是组名,Map的值就是该组的Perosn集合。

2.2.2 多级分组

多级分组可以支持在完成一次分组后,分别对每个小组再进行分组。 
使用具有两个参数的groupingby重载方法即可实现多级分组。

  • 第一个参数:一级分组的条件
  • 第二个参数:一个新的groupingby函数,该函数包含二级分组的条件

例:将所有人分为老年人、中年人、青年人,并且将每个小组再分成:男女两组。

Map>> result = list.stream()
                                    .collect(Collectors.groupingby((person)->{
        if(person.getAge()>60)
            return "老年人";
        else if(person.getAge()>40)
            return "中年人";
        else
            return "青年人";
                                    },
                                    groupingby(Person::getSex)));
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

此时会返回一个非常复杂的结果:Map< String,Map< String,List< Person>>>。

2.2.3 对分组进行统计

拥有两个参数的groupingby函数不仅仅能够实现多几分组,还能对分组的结果进行统计。

例:统计每一组的人数

Map result = list.stream()
                                    .collect(Collectors.groupingby((person)->{
        if(person.getAge()>60)
            return "老年人";
        else if(person.getAge()>40)
            return "中年人";
        else
            return "青年人";
                                    },
                                    counting()));
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

此时会返回一个Map< String,Long>类型的map,该map的键为组名,map的值为该组的元素个数。

将收集器的结果转换成另一种类型

当使用maxBy、minBy统计最值时,结果会封装在Optional中,该类型是为了避免流为空时计算的结果也为空的情况。在单独使用maxBy、minBy函数时确实需要返回Optional类型,这样能确保没有空指针异常。然而当我们使用groupingBy进行分组时,若一个组为空,则该组将不会被添加到Map中,从而Map中的所有值都不会是一个空集合。既然这样,使用maxBy、minBy方法计算每一组的最值时,将结果封装在optional对象中就显得有些多余。 
我们可以使用collectingAndThen函数包裹maxBy、minBy,从而将maxBy、minBy返回的Optional对象进行转换。

例:将所有人按性别划分,并计算每组最大的年龄。

Map<String,Integer> map = list.stream()
                            .collect(groupingBy(Person::getSex,
                            collectingAndThen(
                            maxBy(comparingInt(Person::getAge)),
                            Optional::get
                            )));
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

此时返回的是一个Map< String,Integer>,String表示每组的组名(男、女),Integer为每组最大的年龄。 
如果不用collectingAndThen包裹maxBy,那么最后返回的结果为Map< String,Optional< Person>>。 
使用collectingAndThen包裹maxBy后,首先会执行maxBy函数,该函数执行完后便会执行Optional::get,从而将Optional中的元素取出来。

2.3 分区

分区是分组的一种特殊情况,它只能分成true、false两组。 
分组使用partitioningBy方法,该方法接收一个Lambda表达式,该表达是必须返回boolean类型,partitioningBy方法会将Lambda返回结果为true和false的元素各分成一组。 
partitioningBy方法返回的结果为Map< Boolean,List< T>>。 
此外,partitioningBy方法和groupingBy方法一样,也可以接收第二个参数,实现二级分区或对分区结果进行统计。


你可能感兴趣的:(java8)