转载请注明出处 http://blog.csdn.net/u014205968/article/details/71484374
本文主要讲解Java8 Stream API
,但是要讲解这一部分需要匿名内部类、lambda表达式以及函数式接口的相关知识,本文将分为两篇文章来讲解上述内容,读者可以按需查阅。
本文是本系列文章的第二篇,主要讲解Stream API
,在学习Stream API
之前要求读者有一定的lambda表达式
基础,如果相关知识不了解可以参考本系列文章的第一篇Java 匿名内部类、lambda表达式与函数式接口。
Java8
新增的stream
功能非常强大,这里的stream
和Java IO
中的stream
是完全不同概念的两个东西。本文要讲解的stream
是能够对集合对象进行各种串行或并发聚集操作,Stream API
依赖于前一篇文讲解的
,只有当两者结合时才能极大的提高编程效率并且代码更易理解和维护。
lambda表达式Stream API
支持串行和并发的集合操作,这也是响应了现在多核处理器的需求,Stream API
的并发采用的是我们熟悉的fork/join
模式,手动编写并行代码很复杂也很容易出错,但是采用Stream API
来进行集合对象上的并发操作你不需要编写任何多线程代码就能够轻而易举的实现并发操作,从而提高代码的运行效率,也极大的简化了编程难度。
在实际开发中,我们经常对一个集合内的对象进行一系列的操作,比如排序、查找、过滤、重组、数据统计等操作,通常情况下我们可能会采用for循环
遍历的方式来逐一进行操作,这样的代码即复杂又难以维护,如果对性能有要求再进行多线程代码的编写就更加的复杂了,同时也更容易出错。
下面举一个栗子:
class User
{
private String userID;
private boolean isVip;
private int balance;
public User(String userID, boolean isVip, int balance)
{
this.userID = userID;
this.isVip = isVip;
this.balance = balance;
}
public boolean isVip()
{
return this.isVip;
}
public String getUserID()
{
return this.userID;
}
public int getBalance()
{
return this.balance;
}
}
public class HelloWorld
{
public static void main(String[] args)
{
ArrayList users = new ArrayList<>();
users.add(new User("2017001", false, 0));
users.add(new User("2017002", true, 36));
users.add(new User("2017003", false, 98));
users.add(new User("2017004", false, 233));
users.add(new User("2017005", true, 68));
users.add(new User("2017006", true, 599));
users.add(new User("2017007", true, 1023));
users.add(new User("2017008", false, 9));
users.add(new User("2017009", false, 66));
users.add(new User("2017010", false, 88));
//普通实现方式
ArrayList tempArray = new ArrayList<>();
ArrayList idArray = new ArrayList<>(3);
for (User user: users)
{
if (user.isVip())
{
tempArray.add(user);
}
}
tempArray.sort(new Comparator(){
public int compare(User o1, User o2) {
return o2.getBalance() - o1.getBalance();
}
});
for (int i = 0; i < 3; i++)
{
idArray.add(tempArray.get(i).getUserID());
}
for (int i = 0; i < idArray.size(); i++)
{
System.out.println(idArray.get(i));
}
//Stream API实现方式
//也可以使用parallelStream方法获取一个并发的stream,提高计算效率
Stream stream = users.stream();
List array = stream.filter(User::isVip).sorted((t1, t2) -> t2.getBalance() - t1.getBalance()).limit(3).map(User::getUserID).collect(Collectors.toList());
array.forEach(System.out::println);
}
}
上述代码首先定义了一个用户类,这个类保存用户是否是VIP、用户ID以及用户的余额,假如现在有一个需求,将VIP中余额最高的三个用户的ID找出来,传统的思路一般就是创建一个临时的list
,然后逐一判断,将所有的VIP用户加入到这个临时的list
中,然后调用集合类的sort
方法根据余额排序,最后再遍历三次获取余额最高的三个用户的ID等信息。这样的方法看似简单,但代码写出来即混乱也不好看,如果用户量非常大,有几千万甚至几个亿,这样遍历的方式效率就会特别低,如果手工加上多线程的并发操作,代码就更加复杂了。
上述代码的第二部分使用Stream API
的方式来计算,首先通过集合类获取了一个普通的stream
,如果数据量大可以使用parallelStream
方法获取一个并发的stream
,这样接下来的计算程序员不需要编写任何多线程代码系统会自动进行多线程计算。获取了stream
以后首先调用filter
方法找到是否为VIP用户然后对VIP用户进行排序操作,接下来限制只获取三个用户的信息,然后将用户映射为用户ID,最后将该stream
转换为集合类,两种实现方式的结果完全一样,但是明显的采用Stream API
的代码更加简洁易懂。
Stream API
的编写大量依赖lambda表达式
以及lambda表达式
的引用方法
和引用构造器
,如果您对这一块不理解可以查阅文章Java 匿名内部类、lambda表达式与函数式接口。
A sequence of elements supporting sequential and parallel aggregate operations
上面是Java
文档中定义的Stream
,可以看出,Stream
就是元素的集合,并且可以采用串行或并行的方式进行聚集操作。在使用时我们可以将Stream
理解为一个迭代器,只不过这个迭代器更加高级,能够对其中的每一个元素进行我们规定的计算。
当我们要使用Stream API
时,首先需要创建一个Stream
对象,可以通过集合类的实例方法stream
或parallelStream
来获取一个普通的串行stream
或是并行stream
。也可以使用Stream
、IntStream
、LongStream
或DoubleStream
创建一个Stream
对象,Stream
是一个比较通用的流,可以代表任何引用数据类型,其他的则是指特定类型的流。最常用的就是通过一个集合类型来获取相应类型的Stream
。
流的操作分为中间操作 Intermediate
和结束操作 Terminal
:
filter
、map
操作等。每一个操作结束后都会返回一个新的流,并且这些操作都是lazy的,也就是在进行结束操作时才会真正的进行计算,一次遍历就计算出所有结果。collect
方法。当开始执行结束操作的时候才会对流进行遍历并且只一次遍历就计算出所有结果。通过集合创建Stream
的方法是我们最常用的,集合类的实例方法stream
和parallelStream
可以获取相应的流。
ArrayList users = new ArrayList<>();
users.add(new User("2017001", false, 0));
users.add(new User("2017002", true, 36));
users.add(new User("2017003", false, 98));
Stream stream = users.stream();
String[] str = {"Hello World", "Jiaming Chen", "Zhouhang Cheng"};
Stream stream = Stream.of(str);
Stream<Integer> stream = Stream.of(1, 2, 3, 4);
一般我们都会对Stream
进行结束操作,用于获取一个数组或是集合类,通过数组和集合类创建Stream
前文已经介绍了,这里介绍通过Stream
获取数组或集合类。
String[] str = {"Hello World", "Jiaming Chen", "Zhouhang Cheng"};
Stream<String> stream = Stream.of(str);
String[] strArray = stream.toArray(String[]::new);
List<String> strList = stream.collect(Collectors.toList());
ArrayList<String> strArrayList = stream.collect(Collectors.toCollection(ArrayList::new));
Set<String> strSet = stream.collect(Collectors.toSet());
上面的代码分别将流转换为数组、List、ArrayList和Set类型,具体的参数可以查看官方API文档。
filter
的栗子前面已经举过了,filter
函数需要传入一个实现Predicate
函数式接口的对象,该接口的抽象方法test
接收一个参数并返回一个boolean
值,为true
则保留,false
则剔除,前文举的栗子就是判断是否为VIP用户,如果是就保留,不是就剔除。
原理如图所示:
map
的栗子前面已经举过了,map
函数需要传入一个实现Function
函数式接口的对象,该接口的抽象方法apply
接收一个参数并返回一个值,可以理解为映射关系,前文举的栗子就是将每一个用户映射为一个userID
。
原理如图所示:
map
方法是一个一对一的映射,每输入一个数据也只会输出一个值。
flatMap
方法是一对多的映射,对每一个元素映射出来的仍旧是一个Stream
,然后会将这个子Stream
的元素映射到父集合中,栗子如下:
Stream> inputStream = Stream.of(Arrays.asList(1), Arrays.asList(2, 3), Arrays.asList(4, 5, 6));
List integerList = inputStream.flatMap((childList) -> childList.stream()).collect(Collectors.toList());
//将一个“二维数组”flat为“一维数组”
integerList.forEach(System.out::println);
limit
用于限制获取多少个结果,与数据库中的limit
作用类似,skip
用于排除前多少个结果。
sorted
的栗子前面也举过了,sorted
函数需要传入一个实现Comparator
函数式接口的对象,该接口的抽象方法compare
接收两个参数并返回一个整型值,作用就是排序,与其他常见排序方法一致。
distinct
用于剔除重复,与数据库中的distinct
用法一致。
findFirst
方法总是返回第一个元素,如果没有则返回空,它的返回值类型是Optional
类型,接触过swift
的同学应该知道,这是一个可选类型,如果有第一个元素则Optional
类型中保存的有值,如果没有第一个元素则该类型为空。
Stream stream = users.stream();
Optional userID = stream.filter(User::isVip).sorted((t1, t2) -> t2.getBalance() - t1.getBalance()).limit(3).map(User::getUserID).findFirst();
userID.ifPresent(uid -> System.out.println("Exists"));
min
可以对整型流求最小值,返回OptionalInt
。
max
可以对整型流求最大值,返回OptionalInt
。
这两个方法是结束操作,只能调用一次。
allMatch
:Stream
中全部元素符合传入的predicate
返回 true
anyMatch
:Stream
中只要有一个元素符合传入的predicate
返回 true
noneMatch
:Stream
中没有一个元素符合传入的predicate
返回 true
reduce
方法用于组合Stream
元素,它可以提供一个初始值然后按照传入的计算规则依次和Stream
中的元素进行计算,因此上文介绍的min
、max
都可以看做是reduce
的一种实现。
举个栗子:
IntStream is = IntStream.range(0, 10);
System.out.println(is.reduce(0, Integer::sum));
IntStream intStream = IntStream.range(0, 10);
System.out.println(intStream.reduce((o1, o2) -> o1 + o2));
Stream stream = Stream.of("Hello", "World", "Jiaming", "Chen");
System.out.println(stream.reduce("", String::concat));
第一个IntStream
调用的reduce
方法设置了一个初始值,因此最终reduce
计算的结果一定有值,该方法调用Integer
的类方法sum
用于计算Stream
的总和。
第二个IntStream
调用reduce
方法时没有设置初始值,因此最终reduce
计算的结果不一定有值,所以返回值类型是Optional
类型,没有提供初始值时会自动将第一个和第二个元素先进行计算,但有可能不存在第一个或第二个元素,因此返回值是Optional
类型。
这篇文章详细测试了Stream API
的性能Java Stream API性能测试。
总的来说,对于复杂计算并且拥有多核CPU来说,使用Stream API
进行并发计算速度最快,也推荐使用。对于计算比较简单,手工外部迭代性能更加。单核CPU尽量不要使用并发的Stream API
计算。如果没有太高的性能要求,想要编写出简洁的代码还是推荐使用Stream API
。
由于作者水平有限,难免出现纰漏,如有问题还请不吝赐教。