如何从JDK8 Stream转换为反应式框架流?

一、前言

最近在做一个项目,获取JDK8 Stream对象后,想要批量消费,不想自己写个集合来做批量处理。而反应式编程实现比如rxjava或者reactor是有丰富的流操作符,所以调研了下如何把JDK8 Stream转换为反应式流。

二、批量消费

有时候场景需要我们批量消费以便提高执行效率,比如对应同一个表的插入操作,批量插入的效率比单条逐个插入效率要好很多。那么对应给定的一个数据源,如何聚合数据为批量那?当数据源是一个内存list时候,最简单方法如下:

   public static void main(String[] ar) {
        //1.创建list
        List personList = new ArrayList();
        for (int i = 0; i < 100; ++i) {
            personList.add(i);
        }


        //2.切分处理
        List> list = Lists.partition(personList, 20);
        list.stream().forEach(tempList->System.out.println(JSON.toJSONString(tempList)));
}

如上代码1创建了一个list列表,代码2,使用Google guava包里面的Lists.partition函数把list切分为一个个最多包含20个元素的list列表,并打印输出。

但是当数据源是个流那,比如文件流或者数据库连接流等等(一般为Stream对象),这时候我们不可能把流下的所有数据全部加载到内存,然后在使用上面的Lists.partition方法,因为这样可能会造成OOM。

我们想要的是从这些流中每次读取limit条记录,然后批量处理这limit条记录,这样内存中每次只会存在limit条记录。这时由于JDK Stream不支持Buffer操作,我们需要自己实现,实现代码大概如下:

       //1.缓存列表
        List mergeList = new ArrayList<>();
        int limit = 20;
        //2.循环获取元素并缓存
        stream.forEach(e -> {
            if (mergeList.size() >= limit) {
                System.out.println(JSON.toJSONString(mergeList));
                mergeList.clear();
            }
            mergeList.add(e);
        });
        //3.退出后,补漏处理
        if (mergeList.size()>0){
            System.out.println(JSON.toJSONString(mergeList));
        }
`

如上代码在Stream中迭代元素时,我们把元素缓存到mergeList列表,每当mergeList有了20个元素,则处理一次。最后等流结束后,如果mergeList还有元素则需要补漏处理下。

如果不想实现上面繁琐代码,我们可以考虑吧JDK 8Stream切换到反应式实现框架比如Reactor或者Rxjava,因为后者有丰富的流操作符。其中Reactor的一个实现是:

        //1.为了使用buffer功能,转换为Reactor的流对象Flux
        Flux flux = Flux.fromStream(stream);
        //2..聚合消费
        flux.buffer(20).subscribe(integers -> {
            System.out.println(JSON.toJSONString(integers));
        });

如上代码,我们使用Reactor框架的Flux.fromStream方法把JDKStream转换为Flux流对象,然后调用其buffer方法设置缓存20个元素消费一次,然后调用subscribe订阅缓存流,并打印。

可知代码简洁很多,并且符合声明式编程。

总结

在Java 8中引入了Stream,它旨在有效地处理数据流(包括原始类型)。它是基于拉的,并且只能使用一次,但是缺少与时间相关的操作(比如buffer、window操作),虽然可以执行并行计算(基于ForkJoinPool.commonPool()),但无法指定用业务自己的线程池。另外它也还没有设计用于处理延迟操作(比如rxjava的defer()操作)。其所不支持的特性就是Reactor或RxJava等Reactive API的用武之地。

更多反应式编程知识,可以移步:Java异步编程

戳下面阅读

????

我的第三本书    我的第二本书    我的第一本书

golang并发教程    ForkJoinPool    K8s网络模型

人生需规划   再见阿里巴巴  我的视频号

点亮再看哦????

你可能感兴趣的:(如何从JDK8 Stream转换为反应式框架流?)