基于Java8并行流(parallelStream)的注意点

Java8并行流(parallelStream)注意点

在最初使用并行流的时候,查询列表会偶尔性报空指针异常,这令我非常纳闷

代码是这样的:

List orderListVOS = new LinkedList();

baseOrderBillList.parallelStream().forEach(baseOrderBill -> {
   OrderListVO orderListVO = new OrderListVO();
   // 设置order中的属性

   orderListVO.setOrderbillgrowthid(baseOrderBill.getOrderbillgrowthid());
   orderListVO.setOrderbillid(baseOrderBill.getOrderbillid());
   ……
   orderListVOS.add(orderListVO);
}

代码本身是在做多表拆分然后业务层组装,使用并行流能够提升这种纯粹的CPU密集型操作,parallelStream 此方法默认是以服务器CPU核数为线程池大小的。

因为是并行流,所以其实是多线程在并发操作这个orderListVOS 容器,但是这个容器是不能保证线程安全的。

修改之后:

List orderListVOS = Collections
.synchronizedList(new LinkedList());

这样就能得到理想的结果。

另外,stream自带最后的聚合方法:

List orderListVOS = orderListVOS.parallelStream()
                .sorted(Comparator.comparing(OrderListVO::getCreatetime).reversed())
                .collect(Collectors.toList());

collect(Collectors.toList()) 方法最后回将操作后的数据进行汇总,此方法本身实现了线程安全性的操作,最后得到的结果也会是正确的。

JAVA8之parallelStream()并行流的正确用法

1.因为是并行流,所以所涉及到的数据结构

需要使用线程安全的,比如

listByPage.parallelStream().forEach(str-> {
           //使用线程安全的数据结构
           //ConcurrentHashMap
           //CopyOnWriteArrayList
           //等等进行操作
        });

2.默认优先用在CPU密集型计算中

这里有的人就说了,用在IO密集比如HTTP请求啊什么的这种耗时高的操作并行去请求不是效果显著吗

由于默认并行流使用的是全局的线程池,线程数量是根据cpu核数设置的,所以如果某个操作占用了线程,将影响全局其他使用并行流的操作

所以折中的方案是自定义线程池来执行某个并行流操作

  ForkJoinPool forkJoinPool = new ForkJoinPool(10);
        forkJoinPool.execute(() -> {
            listByPage.parallelStream().forEach(str -> {
                
            });
        });

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

你可能感兴趣的:(基于Java8并行流(parallelStream)的注意点)