分组帮助文档

        分组步骤是根据指定字段将数据先进行分组再聚合后,输出到流中。步骤配置信息如图1所示。

                                    分组帮助文档_第1张图片

                                                                                     图1 步骤配置信息

 

        下文详细解释各控件的含义:

        1、转换步骤名称:步骤的名称,在单一转换中,名称必须唯一。

        2、包括所有的行:勾选此项,激活第3、4、5个控件,将在输入流中的行集新增一列聚合字段输出到流中;若不选此项,只输出控件8和控件9所设置的字段。

        3.临时目录临时文件的存储路径 。可以用变量来获取,插件默认的变量是“%%java.io.tmpdir%%”,这个变量是获取操作系统缓存的临时目录,不同操作系统的缓存临时目录不一样,在Windows的缓存目录为:C:\Users\登录用户~1\AppData\Local\Temp\;Linux:/tmp。

        4.临时文件前缀:设置一个可识别的前缀,以便文件在临时文件目录中时对其进行标识。 

        5.增加行号,每组重新开始:若勾选此项,将新增一列行号,且输入的数据行集进行分组后的每一组都将独享一个行号序列。

        6.行号列名:指定行号列的字段名称。

        7.总返回一个结果行:勾选此项,当在没有输入行的情况下,也至少生成一行,这样在计数聚集的情况下,可以获得正确结果。

        8.构成分组的字段:指定分组的字段。

        9.聚合: 

        (1)名称:指定聚合之后结果数据的字段名称。

        (2)字段:指定进行聚合的字段。

        (3)类型:指定聚合的函数。

        (4)值:只有在类型选择为“使用指定字符链接同组字符串”时,该值会成为一个分隔符将同组数据分隔。如图2所示:

                                                分组帮助文档_第2张图片

                                                                                                    图2

        

        文章原创首发于:https://ckettle.ccsaii.com.cn/help/StepPluginType/GroupBy?s=csdn

        更多CKettle内容,欢迎点击上述链接学习。

你可能感兴趣的:(CKettle插件说明文档,大数据)