官方新特性说明地址
下面对几个常用的特性做下重点说明。
(Type1 param1, Type2 param2, ..., TypeN paramN) -> { statment1; statment2; //............. return statmentM;}
(param1,param2, ..., paramN) -> { statment1; statment2; //............. return statmentM;}
param1 -> { statment1; statment2; //............. return statmentM;}
param1 -> statment
Listlist = Arrays.asList(1,2,3,4,5,6,7,8,9,10);
long num = list.stream().filter( a -> a > 4 ).count();
System.out.println(num);
a-> a> 4
,这里参数a没有定义类型,会自动判断为Integer类型,而这个表达式的值会自动转化成函数接口Predicate对应的对象(filter方法定义的输入参数类型),至于stream及相关的操作则是下面要说的流操作。它们经常一起配合进行一起数据处理。
流是Java API的新成员,它允许你以声明性方式处理数据集合(通过查询语句来表达,而不是临时编写一个实现)。就现在来说,你可以把它们看成遍历数据集的高级迭代器。此外,流还可以透明地并行处理,你无需写任何多线程代码了!
类别 | 方法名 | 方法签名 | 作用 |
---|---|---|---|
筛选切片 | filter | Stream |
过滤操作,根据Predicate判断结果保留为真的数据,返回结果仍然是流 |
distinct | Stream |
去重操作,筛选出不重复的结果,返回结果仍然是流 | |
limit | Stream |
截取限制操作,只取前 maxSize条数据,返回结果仍然是流 | |
skip | Stream |
跳过操作,跳过n条数据,取后面的数据,返回结果仍然是流 | |
映射 | map | |
转化操作,根据参数T,转化成R类型,返回结果仍然是流 |
flatMap | |
转化操作,根据参数T,转化成R类型流,这里会生成多个R类型流,返回结果仍然是流 | |
匹配 | anyMatch | boolean anyMatch(Predicate super T> predicate) | 判断是否有一条匹配,根据Predicate判断结果中是否有一条匹配成功 |
allMatch | boolean allMatch(Predicate super T> predicate) | 判断是否全都匹配,根据Predicate判断结果中是否全部匹配成功 | |
noneMatch | boolean noneMatch(Predicate super T> predicate) | 判断是否一条都不匹配,根据Predicate判断结果中是否所有的都不匹配 | |
查找 | findAny | Optional |
查找操作, 查询当前流中的任意元素并返回Optional |
findFirst | Optional |
查找操作, 查询当前流中的第一个元素并返回Optional | |
归约 | reduce | T reduce(T identity, BinaryOperator |
归约操作,同样两个类型的数据进行操作后返回相同类型的结果。比如两个整数相加、相乘等。 |
max | Optional |
求最大值,根据Comparator计算的比较结果得到最大值 | |
min | Optional |
求最小值,根据Comparator计算的比较结果得到最小值 | |
汇总统计 | collect | |
汇总操作,汇总对应的处理结果。这里经常与 |
count | long count() | 统计流中数据数量 | |
遍历 | foreach | void forEach(Consumer super T> action) | 遍历操作,遍历执行Consumer 对应的操作 |
上面是Stream API的一些常用操作,按场景结合lambda表达式调用对应方法即可。至于Stream的生成方式,Stream的of方法或者Collection接口实现类的stream方法都可以获得对应的流对象,再进一步根据需要做对应处理。
另外上述方法如果返回是Stream对象时是可以链式调用的,这个时候这个操作只是声明或者配方,不产生新的集合,这种类型的方法是惰性求值方法;有些方法返回结果非Stream类型,则是及早求值方法。
“为什么要区分惰性求值和及早求值? 只有在对需要什么样的结果和操 作有了更多了解之后, 才能更有效率地进行计算。 例如, 如果要找出大于 10 的第一个数字, 那么并不需要和所有元素去做比较, 只要找出第一个匹配的元素就够了。 这也意味着可以在集合类上级联多种操作, 但迭代只需一次。这也是函数编程中惰性计算的特性,即只在需要产生表达式的值时进行计算。这样代码更加清晰,而且省掉了多余的操作。
这里还对上述列表操作中相关的Optional与Collectors类做下说明。
Optional类是为了解决经常遇到的NullPointerException出现的,这个类是一个可能包含空值的容器类。用Optional替代null可以显示说明结果可能为空或不为空,再使用时使用isPresent方法判断就可以避免直接调用的空指针异常。
Collectors类是一个非常有用的是归约操作工具类,工具类中的方法常与流的collect方法结合使用。比如
groupingBy方法可以用来分组,在转化Map时非常实用;partitioningBy方法可以用来分区(分区可以当做一种特殊的分组,真假值分组),joining方法可以用来连接,这个应用在比如字符串拼接的场景。
Collection接口的实现类调用parallelStream方法就可以实现并行流,相应地也获得了并行计算的能力。或者Stream接口的实现调用parallel方法也可以得到并行流。并行流实现机制是基于fork/join 框架,将问题分解再合并处理。
不过并行计算是否一定比串行快呢?这也不一定。实际影响性能的点包括:
(1)数据大小输入数据的大小会影响并行化处理对性能的提升。 将问题分解之后并行化处理, 再将结果合并会带来额外的开销。 因此只有数据足够大、 每个数据处理管道花费的时间足够多
时, 并行化处理才有意义。
(2) 源数据结构
每个管道的操作都基于一些初始数据源, 通常是集合。 将不同的数据源分割相对容易,这里的开销影响了在管道中并行处理数据时到底能带来多少性能上的提升。
(3) 装箱
处理基本类型比处理装箱类型要快。
(4) 核的数量
极端情况下, 只有一个核, 因此完全没必要并行化。 显然, 拥有的核越多, 获得潜在性能提升的幅度就越大。 在实践中, 核的数量不单指你的机器上有多少核, 更是指运行时你的机器能使用多少核。 这也就是说同时运行的其他进程, 或者线程关联性( 强制线程在某些核或 CPU 上运行) 会影响性能。
(5) 单元处理开销
比如数据大小, 这是一场并行执行花费时间和分解合并操作开销之间的战争。 花在流中
每个元素身上的时间越长, 并行操作带来的性能提升越明显
实际在考虑是否使用并行时需要考虑上面的要素。在讨论流中单独操作每一块的种类时, 可以分成两种不同的操作: 无状态的和有状态的。无状态操作整个过程中不必维护状态, 有状态操作则有维护状态所需的开销和限制。如果能避开有状态, 选用无状态操作, 就能获得更好的并行性能。 无状态操作包括 map、filter 和 flatMap, 有状态操作包括 sorted、 distinct 和 limit。这种理解在理论上是更好的,当然实际使用还是以测试结果最为可靠 。
方法引用的基本思想是,如果一个Lambda代表的只是“直接调用这个方法”,那最好还是用名称来调用它,而不是去描述如何调用它。事实上,方法引用就是让你根据已有的方法实现来创建Lambda表达式。但是,显式地指明方法的名称,你的代码的可读性会更好。所以方法引用只是在内容中只有一个表达式的简写。
当 你 需 要使用 方 法 引用时 , 目 标引用 放 在 分隔符::前 ,方法 的 名 称放在 后 面 ,即ClassName :: methodName
。例如 ,Apple::getWeight
就是引用了Apple类中定义的方法getWeight。请记住,不需要括号,因为你没有实际调用这个方法。方法引用就是Lambda表达式(Apple a) -> a.getWeight()
的快捷写法。
这里有种情况需要特殊说明,就是类的构造函数情况,这个时候是通过ClassName::new
这种形式创建Class构造函数对应的引用,例如:
JDK8 新增了Method.getParameters方法,可以获取参数信息,包括参数名称。不过为了避免.class文件因为保留参数名而导致.class文件过大或者占用更多的内存,另外也避免有些参数( secret/password)泄露安全信息,JVM默认编译出的class文件是不会保留参数名这个信息的。
这一选项需由编译开关 javac -parameters 打开,默认是关闭的。在Eclipse(或者基于Eclipse的IDE)中可以如下图勾选保存:
LocalDate为日期处理类、LocalTime为时间处理类、LocalDateTime为日期时间处理类,方法都类似,具体可以看API文档或源码,选取几个代表性的方法做下介绍。
now相关的方法可以获取当前日期或时间,of方法可以创建对应的日期或时间,parse方法可以解析日期或时间,get方法可以获取日期或时间信息,with方法可以设置日期或时间信息,plus或minus方法可以增减日期或时间信息;
这个类在日期调整时非常有用,比如得到当月的第一天、最后一天,当年的第一天、最后一天,下一周或前一周的某天等。
以前日期格式化一般用SimpleDateFormat类,但是不怎么好用,现在1.8引入了DateTimeFormatter类,默认定义了很多常量格式(ISO打头的),在使用的时候一般配合LocalDate/LocalTime/LocalDateTime使用,比如想把当前日期格式化成yyyy-MM-dd hh:mm:ss的形式:
LocalDateTime dt = LocalDateTime.now();
DateTimeFormatter dtf = DateTimeFormatter.ofPattern("yyyy-MM-dd hh:mm:ss");
System.out.println(dtf.format(dt));
官方教程:http://docs.oracle.com/javase/tutorial/
《Java 8实战》
《Java 8函数式编程》