Kettle8.2输入组件之多文件合并

Kettle8.2输入组件之多文件合并

    • 一、需求说明
    • 二、设计转换
    • 三、转换配置
    • 四、运行转换
    • 五、结果分析

一、需求说明


  • 需求说明: 数据往往也是以多个文件的形式出现,有的数据还会分散在多个子文件夹。所以合并数据也是开发中非常常见的操作。
  • 需求分析: 故该案例中可以简单使用Excel组件进行转换与Excel输出组件进行测试即可
  • 要求: 读取input目录下以04多文件合并开头的所有Excel数据合并到一个Excel
  • 数据源: 下载后解压缩放在某个文件夹下即可
    https://download.csdn.net/download/sujiangming/16191925
    
  • 期望的结果:
    Kettle8.2输入组件之多文件合并_第1张图片

二、设计转换


Kettle8.2输入组件之多文件合并_第2张图片

三、转换配置


  • Step1:Excel输入配置

    • 双击组件,写上步骤名称
      Kettle8.2输入组件之多文件合并_第3张图片
      重点是会写正则表达式,获取某个目录下的所有以.xlsx作为后缀的文件,换做其他后缀也需要会写,合并其实本质是将性质相似的数据进行统一或者合并成一个文件
    • 切换到“字段”菜单,配置希望读取到的字段,如下所示:
      Kettle8.2输入组件之多文件合并_第4张图片
  • Excel输出组件配置

    • 双击打开,设置步骤名称,如Excel-Output
    • 选择输出文件所在路径,可以设置其他的内容,具体如下:
      Kettle8.2输入组件之多文件合并_第5张图片
      可以设置相关样式
      Kettle8.2输入组件之多文件合并_第6张图片
      获取字段,得到目标字段如下:
      Kettle8.2输入组件之多文件合并_第7张图片

四、运行转换


Kettle8.2输入组件之多文件合并_第8张图片

结果如下:
Kettle8.2输入组件之多文件合并_第9张图片

五、结果分析


  • 查看执行结果日志
    Kettle8.2输入组件之多文件合并_第10张图片
    总结: 该案例重点是会写正则表达式,获取某个目录下的所有以.xlsx作为后缀的文件,换做其他后缀也需要会写,合并其实本质是将性质相似的数据进行统一或者合并成一个文件

你可能感兴趣的:(Kettle)