Kettle使用入门

介绍

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。
Kettle中有两种脚本文件,作业(Job)和转换(transformation),转换完成针对数据的基础转换,作业完成整个工作流的控制。

安装

下载地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration/
下载之后解压就可以使用,不需要安装。

四大核心组件

  • Chef—工作(job)设计工具 (GUI方式)。
  • Kitchen—工作(job)执行器 (命令行方式)。
  • Spoon—转换(transform)设计工具 (GUI方式)。
  • pan—转换(transform)执行器 (命令行方式)。

使用

在windows下只需要双击Spoon.bat即可打开软件

主界面

使用示例

该示例为在两个不同的数据库/表之间同步数据

  • 新建一个转换,左边有很多组件,通过拖拽的方式将组件加入到转换中。


    image.png
  • 首先需要一个数据库查询组件作为转换的数据源
    image.png
  • 在左边双击组件进行配置,配置数据库、表名及字段

创建数据库连接的时候可能会报错,这是因为缺少连接数据库的类库,如连接mysql就需要连接mysql对应的jar包mysql-connector-java-5.1.41-bin.jar,到网上下载后放到lib目录下即可。

image.png
  • 再同样的方式添加一个 插入/更新组件
    image.png
  • 数据库查询组件指向插入/更新组件
    image.png
  • 双击插入/更新编辑,配置数据库、表及字段。
    image.png
  • 执行测试,成功就说明转换创建完成了


    image.png
  • 接下来新建作业,新建完成后从左边引入START转换两个组件,并从START连接到转换
    image.png
  • 配置START,也就是配置定时任务
    image.png
  • 配置转换,选择上面保存的转换文件
    image.png
  • 执行测试


    image.png
  • 完成
    在linux系统中只需要执行
./kitchen.sh -file=作业文件路径

即可完成定时任务的启动

你可能感兴趣的:(Kettle使用入门)