在Java 8
中,得益于Lambda
所带来的函数式编程,引入了一个全新的Stream
概念,用于解决已有集合类库既有的弊端。
几乎所有的集合(如 Collection
接口或 Map
接口等)都支持直接或间接的迭代遍历操作。而当我们需要对集合中的元素进行操作的时候,除了必需的添加、删除、获取外,最典型的就是集合遍历。例如:
public class Demo {
public static void main(String[] args) {
List<String> list = new ArrayList<>();
list.add("张无忌");
list.add("周芷若");
list.add("赵敏");
list.add("张三");
list.add("张三丰");
for (String name : list) {
System.out.println(name);
}
}
}
这是一段非常简单的集合遍历操作:对集合中的每一个字符串都进行打印输出操作。
循环遍历的弊端
Java 8
的Lambda
让我们可以更加专注于做什么(What
),而不是怎么做(How
),这点此前已经结合内部类进行了对比说明。现在,我们仔细体会一下上例代码,可以发现:
for
循环的语法就是“怎么做”for
循环的循环体才是“做什么”为什么使用循环?因为要进行遍历。但循环是遍历的唯一方式吗?遍历是指每一个元素逐一进行处理,而并不是从第一个到最后一个顺次处理的循环。前者是目的,后者是方式。
试想一下,如果希望对集合中的元素进行筛选过滤:
那怎么办?在Java 8
之前的做法可能为:
这段代码中含有三个循环,每一个作用不同:
public class DemoFilter {
public static void main(String[] args) {
List<String> list = new ArrayList<>();
list.add("张无忌");
list.add("周芷若");
list.add("赵敏");
list.add("张三");
list.add("张三丰");
List<String> zhangList = new ArrayList<>();
for (String name : list) {
if (name.startsWith("张")) {
zhangList.add(name);
}
}
List<String> shortList = new ArrayList<>();
for (String name : zhangList) {
if (name.length() == 3) {
shortList.add(name);
}
}
for (String name : shortList) {
System.out.println(name);
}
}
}
每当我们需要对集合中的元素进行操作的时候,总是需要进行循环、循环、再循环。这是理所当然的么?不是。循环是做事情的方式,而不是目的。另一方面,使用线性循环就意味着只能遍历一次。如果希望再次遍历,只能再使用另一个循环从头开始。
那,Lambda
的衍生物Stream
能给我们带来怎样更加优雅的写法呢?
public static void main(String[] args) {
List<String> list = new ArrayList<>();
list.add("张无忌");
list.add("周芷若");
list.add("赵敏");
list.add("阳顶天");
list.add("小昭");
list.add("杨逍");
list.add("杨过");
list.add("韦一笑");
list.add("谢逊");
list.add("灭绝师太");
list.add("静虚师太");
//获取list的stream流
Stream<String> listStream = list.stream();
//stream.filter(boolean) 当boolean = true 是保留,false移除
//过滤流中的非姓张的人名 //boolean test(T t)
Stream<String> zhangStream = listStream.filter(t -> t.startsWith("张"));
//姓张 且名字长度是3个字的
Stream<String> shortStream = zhangStream.filter(t -> t.length() == 3);
//迭代输出 //void accept(T t)
shortStream.forEach(t -> System.out.println(t));
//等同于
list.stream().filter(s -> s.startsWith("张"))
.filter(s -> s.length() == 3)
.forEach(s -> System.out.println(s));
}
直接阅读代码的字面意思即可完美展示无关逻辑方式的语义:获取流、过滤姓张、过滤长度为3、逐一打印。代码中并没有体现使用线性循环或是其他任何算法进行遍历,我们真正要做的事情内容被更好地体现在代码中。流式版本比之前的写法要更易于阅读,因为流遵循了"做什么而非怎么做"的原则。
流表面上看起来和集合很类似,都可以让我们转换和获取数据。但是,它们之间存在着显著的差异:
流并不存储其元素。这些元素可能存储在底层的集合中,或者是按需生成的。
流的操作不会修改其数据源。例如,filter
方法不会从新的流中移除元素,而是会生成一个新的流,其中不包含被过滤掉的元素。
流的操作是尽可能惰性执行的。这意味着直至需要其结果时,操作才会执行。
例如:
如果我们只想査找前5个长单词而不是所有的长单词,那么filter
方法就会在匹配到第 5 个单词后就停止过滤。
注意:请暂时忘记对传统IO流的固有印象!
整体来看,流式思想类似于工厂车间的“生产流水线”
当需要对多个元素进行操作(特别是多步操作)的时候,考虑到性能及便利性,我们应该首先拼好一个“模型”步骤方案,然后再按照方案去执行它。
这张图中展示了过滤、映射、跳过、计数等多步操作,这是一种集合元素的处理方案,而方案就是一种“函数模型”。图中的每一个方框都是一个“流”,调用指定的方法,可以从一个流模型转换为另一个流模型。而最右侧的数字3是最终结果。
这里的 filter
、 map
、 skip
都是在对函数模型进行操作,集合元素并没有真正被处理。只有当终结方法 count
执行的时候,整个模型才会按照指定策略执行操作。而这得益于Lambda
的延迟执行特性。
备注:“Stream流”其实是一个集合元素的函数模型,它并不是集合,也不是数据结构,其本身并不存储任何元素(或其地址值)。
生成Stream流的方式
Collection体系集合
使用默认方法stream()生成流, default Stream stream()
Map体系集合
把Map转成Set集合,间接的生成流
数组
通过Arrays中的静态方法stream生成流
同种数据类型的多个数据
通过Stream接口的静态方法of(T… values)生成流
java.util.stream.Stream
是Java 8
新加入的最常用的流接口。(这并不是一个函数式接口。)
public interface Stream<T> extends BaseStream<T, Stream<T>>
获取一个流非常简单,有以下几种常用的方式:
Collection
集合都可以通过 stream
默认方法获取流;Stream
接口的静态方法 of
可以获取数组对应的流。**根据Collection
获取流 **
首先, java.util.Collection
接口中加入了default
方法 stream
用来获取流,所以其所有实现类均可获取流。
public class DemoGetStream {
public static void main(String[] args) {
/*
获取Stream流的方式
1.Collection中 方法 Stream stream()
2.Stream接口 中静态方法 of(T...t) 向Stream中添加多个数据
*/
List<String> list = new ArrayList<>();
Stream<String> stream1 = list.stream();
Set<String> set = new HashSet<>();
Stream<String> stream2 = set.stream();
}
}
根据数组获取流
如果使用的不是集合或映射而是数组,由于数组对象不可能添加默认方法,所以 Stream
接口中提供了静态方法of
,使用很简单:
public static void main(String[] args) {
String[] array = { "张无忌", "张翠山", "张三丰", "张翠山" };
Stream<String> stream = Stream.of(array);
Stream<String> stream3 = Stream.of("张小山");
Stream<String> stream4 = Stream.of("张无忌", "张翠山", "张三丰", "张一元");
}
of
方法的参数其实是一个可变参数,所以支持数组。
流模型的操作很丰富,这里介绍一些常用的API
。这些方法可以被分成两种:
终结方法:返回值类型不再是 Stream
接口自身类型的方法,因此不再支持类似 StringBuilder
那样的链式调用。终结方法包括 count
和 forEach
等 方法。
非终结方法(中间方法):返回值类型仍然是 Stream
接口自身类型的方法,因此支持链式调用。(除了终结方法外,其余方法均为非终结方法。)
备注:除了以下要介绍的方法外还有更多方法,请自行参考API文档。
方法名 | 说明 |
---|---|
Stream filter(Predicate predicate) | 用于对流中的数据进行过滤 |
Stream limit(long maxSize) | 返回此流中的元素组成的流,截取前指定参数个数的数据 |
Stream skip(long n) | 跳过指定参数个数的数据,返回由该流的剩余元素组成的流 |
static Stream concat(Stream a, Stream b) | 合并a和b两个流为一个流 |
Stream distinct() | 返回由该流的不同元素(根据Object.equals(Object) )组成的流 |
filter:过滤
可以通过 filter
方法将一个流转换成另一个子集流。方法声明:
Stream<T> filter(Predicate<? super T> predicate);
该接口接收一个 Predicate
函数式接口参数(可以是一个Lambda
)作为筛选条件。
public static void main(String[] args) {
Stream<String> original = Stream.of("张无忌", "张三丰", "周芷若");
Stream<String> result = original.filter((String s) -> s.startsWith("张"));
}
limit:取用前几个
limit
方法可以对流进行截取,只取用前n
个。方法:
Stream<T> limit(long maxSize)
参数是一个long
型,如果集合当前长度大于参数则进行截取;否则不进行操作。基本使用:
public static void main(String[] args) {
Stream<String> original = Stream.of("张无忌", "张三丰", "周芷若");
Stream<String> result = original.limit(2);
System.out.println(result.count()); // 2
}
skip:跳过前几个
如果希望跳过前几个元素,可以使用 skip
方法获取一个截取之后的新流:
Stream skip(long n)
如果流的当前长度大于n
,则跳过前n
个;否则将会得到一个长度为0的空流。基本使用:
public static void main(String[] args) {
Stream<String> original = Stream.of("张无忌", "张三丰", "周芷若");
Stream<String> result = original.skip(2);
System.out.println(result.count()); // 1
}
concat:组合
如果有两个流,希望合并成为一个流,那么可以使用 Stream
接口的静态方法concat
:
static <T> Stream<T> concat(Stream<? extends T> a, Stream<? extends T> b)
这是一个静态方法,与 java.lang.String 当中的 concat 方法是不同的。
public static void main(String[] args) {
Stream<String> streamA = Stream.of("张无忌");
Stream<String> streamB = Stream.of("张翠山");
Stream<String> result = Stream.concat(streamA, streamB);
}
distinct: 去重
public static void main(String[] args) {
//创建一个集合,存储多个字符串元素
ArrayList<String> list = new ArrayList<String>();
list.add("林青霞");
list.add("张曼玉");
list.add("王祖贤");
list.add("柳岩");
list.add("张敏");
list.add("张无忌");
// 取前4个数据组成一个流
Stream<String> s1 = list.stream().limit(4);
// 跳过2个数据组成一个流
Stream<String> s2 = list.stream().skip(2);
Stream.concat(s1,s2).distinct().forEach(s-> System.out.println(s));
}
终结方法:
forEach : 逐一处理
虽然方法名字叫 forEach
,但是与for
循环中的for-each
不同,该方法并不保证元素的逐一消费动作在流中是被有序执行的。
void forEach(Consumer<? super T> action);
该方法接收一个 Consumer
接口函数,会将每一个流元素交给该函数进行处理。例如:
public class DemoForEach {
public static void main(String[] args) {
Stream<String> stream = Stream.of("张无忌", "张三丰", "周芷若");
stream.forEach((String str)->{System.out.println(str);});
}
}
在这里,lambda
表达式 (String str)->{System.out.println(str);}
就是一个Consumer
函数式接口的示例。
count:统计个数
正如旧集合 Collection
当中的 size
方法一样,流提供 count
方法来数一数其中的元素个数:
long count();
此处方法返回值是long
而不是int
public static void main(String[] args) {
Stream<String> original = Stream.of("张无忌", "张三丰", "周芷若");
Stream<String> result = original.filter((String s) -> s.startsWith("张"));
System.out.println(result.count()); // 2
}
在上述介绍的各种方法中,凡是返回值仍然为 Stream
接口的为函数拼接方法,它们支持链式调用;而返回值不再为Stream
接口的为终结方法,不再支持链式调用。
Files.lines : 方法
Files.lines
是 Java 8 中的一个方法,用于读取文件中的所有行并返回为一个流(Stream)对象。
使用 Files.lines
方法可以方便地逐行读取文本文件。下面是一个示例代码:
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.stream.Stream;
public class FileLinesExample {
public static void main(String[] args) {
String filename = "path/to/file.txt";
try (Stream<String> lines = Files.lines(Paths.get(filename))) {
lines.forEach(System.out::println);
} catch (IOException e) {
e.printStackTrace();
}
}
}
在这个示例中,我们使用 Paths.get
方法来获取文件路径,并将其传递给 Files.lines
方法。然后使用 try-with-resources
语句来确保在读取完成后关闭流。在 lines.forEach(System.out::println)
中,我们遍历每一行并打印到控制台上。
请注意,你需要替换 filename
变量的值为实际的文件路径。此外,使用 Files.lines
时要注意处理可能抛出的 IOException
异常。
常见末端方法:
返回类型 | 方法名 | 方法签名 | 描述 |
---|---|---|---|
void | forEach |
void forEach(Consumer super T> action) | 对流中的每个元素执行给定的操作 |
void | forEachOrdered |
void forEachOrdered(Consumer super T> action) | 保证按照流中元素的遍历顺序执行给定的操作 |
long | count |
long count() | 返回流中的元素数 |
Optional |
findFirst |
Optional findFirst() | 返回流中的第一个元素 |
Optional |
findAny |
Optional findAny() | 返回流中的任意一个元素 |
boolean | allMatch |
boolean allMatch(Predicate super T> predicate) | 检查流中的所有元素是否都满足给定的谓词 |
boolean | anyMatch |
boolean anyMatch(Predicate super T> predicate) | 检查流中是否有任意一个元素满足给定的谓词 |
boolean | noneMatch |
boolean noneMatch(Predicate super T> predicate) | 检查流中的所有元素是否都不满足给定的谓词 |
Optional |
max |
Optional max(Comparator super T> comparator) | 返回流中根据给定比较器最大的元素 |
Optional |
min |
Optional min(Comparator super T> comparator) | 返回流中根据给定比较器最小的元素 |
T | reduce |
T reduce(T identity, BinaryOperator accumulator) | 根据给定的起始值和累加函数将流中的所有元素聚合成一个结果 |
Optional |
reduce |
Optional reduce(BinaryOperator accumulator) | 根据给定的累加函数将流中的所有元素聚合成一个结果 |
R | collect |
R collect(Collector super T, A, R> collector) | 将流中的所有元素收集到一个容器中 |
IntStream | mapToInt |
IntStream mapToInt(ToIntFunction super T> mapper) | 将流中的元素映射为 int 值,返回一个 IntStream |
LongStream | mapToLong |
LongStream mapToLong(ToLongFunction super T> mapper) | 将流中的元素映射为 long 值,返回一个 LongStream |
DoubleStream | mapToDouble |
DoubleStream mapToDouble(ToDoubleFunction super T> mapper) | 将流中的元素映射为 double 值,返回一个 DoubleStream |
Stream |
distinct |
Stream distinct() | 返回一个去除重复元素之后的新流 |
Stream |
sorted |
Stream sorted() | 返回一个根据自然顺序升序排序后的新流 |
Stream |
sorted |
Stream sorted(Comparator super T> comparator) | 返回一个根据给定比较器排序后的新流 |
Stream |
skip |
Stream skip(long n) | 返回一个丢弃前 n 个元素后的新流 |
Stream |
limit |
Stream limit(long maxSize) | 截取前 maxSize 个元素返回一个新流 |
概念
对数据使用Stream流的方式操作完毕后,可以把流中的数据收集到集合中
常用方法
方法名 | 说明 |
---|---|
R collect(Collector collector) | 把结果收集到集合中 |
工具类Collectors提供了具体的收集方式
方法名 | 说明 |
---|---|
public static Collector toList() | 把元素收集到List集合中 |
public static Collector toSet() | 把元素收集到Set集合中 |
public static Collector toMap(Function keyMapper,Function valueMapper) | 把元素收集到Map集合中 |
代码演示
// toList和toSet方法演示
public class MyStream7 {
public static void main(String[] args) {
ArrayList<Integer> list1 = new ArrayList<>();
for (int i = 1; i <= 10; i++) {
list1.add(i);
}
list1.add(10);
list1.add(10);
list1.add(10);
list1.add(10);
list1.add(10);
//filter负责过滤数据的.
//collect负责收集数据.
//获取流中剩余的数据,但是他不负责创建容器,也不负责把数据添加到容器中.
//Collectors.toList() : 在底层会创建一个List集合.并把所有的数据添加到List集合中.
List<Integer> list = list1.stream().filter(number -> number % 2 == 0)
.collect(Collectors.toList());
System.out.println(list);
Set<Integer> set = list1.stream().filter(number -> number % 2 == 0)
.collect(Collectors.toSet());
System.out.println(set);
}
}
/**
Stream流的收集方法 toMap方法演示
创建一个ArrayList集合,并添加以下字符串。字符串中前面是姓名,后面是年龄
"zhangsan,23"
"lisi,24"
"wangwu,25"
保留年龄大于等于24岁的人,并将结果收集到Map集合中,姓名为键,年龄为值
*/
public class MyStream8 {
public static void main(String[] args) {
ArrayList<String> list = new ArrayList<>();
list.add("zhangsan,23");
list.add("lisi,24");
list.add("wangwu,25");
Map<String, Integer> map = list.stream().filter(
s -> {
String[] split = s.split(",");
int age = Integer.parseInt(split[1]);
return age >= 24;
}
// collect方法只能获取到流中剩余的每一个数据.
//在底层不能创建容器,也不能把数据添加到容器当中
//Collectors.toMap 创建一个map集合并将数据添加到集合当中
// s 依次表示流中的每一个数据
//第一个lambda表达式就是如何获取到Map中的键
//第二个lambda表达式就是如何获取Map中的值
).collect(Collectors.toMap(
s -> s.split(",")[0],
s -> Integer.parseInt(s.split(",")[1]) ));
System.out.println(map);
}
}
现在有两个ArrayList集合,分别存储6名男演员名称和6名女演员名称,要求完成如下的操作
演员类Actor已经提供,里面有一个成员变量,一个带参构造方法,以及成员变量对应的get/set方法
代码实现
演员类
public class Actor {
private String name;
public Actor(String name) {
this.name = name;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
}
测试类
public class StreamTest {
public static void main(String[] args) {
//创建集合
ArrayList<String> manList = new ArrayList<String>();
manList.add("周润发");
manList.add("成龙");
manList.add("刘德华");
manList.add("吴京");
manList.add("周星驰");
manList.add("李连杰");
ArrayList<String> womanList = new ArrayList<String>();
womanList.add("林心如");
womanList.add("张曼玉");
womanList.add("林青霞");
womanList.add("柳岩");
womanList.add("林志玲");
womanList.add("王祖贤");
//男演员只要名字为3个字的前三人
Stream<String> manStream = manList.stream().filter(s -> s.length() == 3).limit(3);
//女演员只要姓林的,并且不要第一个
Stream<String> womanStream = womanList.stream().filter(s -> s.startsWith("林")).skip(1);
//把过滤后的男演员姓名和女演员姓名合并到一起
Stream<String> stream = Stream.concat(manStream, womanStream);
// 将流中的数据封装成Actor对象之后打印
stream.forEach(name -> {
Actor actor = new Actor(name);
System.out.println(actor);
});
}
}
forEachOrdered 和 forEach 区别
forEachOrdered
和 forEach
都是 Java 8 中 Stream API 提供的方法,用于对流中的元素进行迭代操作。它们之间的区别在于元素的处理顺序。
forEach
方法:它在并行流上不保证元素的处理顺序。在并行流中,元素会按照多个线程处理,可能会导致输出的顺序与源数据的顺序不一致。
forEachOrdered
方法:它在并行流上保证元素的处理顺序与源数据的顺序一致。无论是串行流还是并行流,forEachOrdered
方法都会按照源数据的顺序依次处理元素。
下面是一个示例来演示两者之间的区别:
import java.util.Arrays;
import java.util.concurrent.TimeUnit;
public class ForEachExample {
public static void main(String[] args) {
String[] words = {"apple", "banana", "cherry", "date"};
// forEach
System.out.println("forEach:");
Arrays.stream(words)
.parallel()
.forEach(System.out::println);
// forEachOrdered
System.out.println("forEachOrdered:");
Arrays.stream(words)
.parallel()
.forEachOrdered(System.out::println);
}
}
在这个示例中,我们创建了一个包含几个单词的字符串数组。然后使用并行流对这些单词进行处理。通过 forEach
方法打印输出时,由于并行流的处理顺序不确定,每次运行结果可能会有所不同。而通过 forEachOrdered
方法打印输出时,无论是串行流还是并行流,都会按照源数据的顺序依次输出单词。
总结来说,forEach
方法适用于不关心元素处理顺序的场景,而 forEachOrdered
方法适用于需要保证元素处理顺序和源数据顺序一致的场景。需要根据具体需求选择使用哪个方法。