开源 ETL 工具 -----kettle 使用

一.介绍:

kettle 是纯 java 开发,开源的ETL 工具。用于数据库间的数据迁移 。可以在 Linux、windows中运行。有图形界面,也有命令脚本还可以二次开发。http://www.kettle.net.cn/ 中文:http://www.kettle.net.cn/ 国外下载较慢,可使用国内镜像或者百度网盘地址,永久有效:

链接:https://pan.baidu.com/s/1F0vMey8Kr1Qod4II_omMWg 
提取码:bb3g

二.使用:

win10为例: 下载后解压,如图:

开源 ETL 工具 -----kettle 使用_第1张图片

 1.安装jdk 1.8+,配置 JAVA_HOME 环境变量。https://www.oracle.com/cn/java/technologies/javase-jdk8-downloads.html#license-lightbox

2.根据使用的数据库和版本,选择适合的驱动jar ,并放到C:\tools\pdi-ce-9.0.0.0-423\data-integration\lib 目录。


三.demo 完成oracle 源库t_user 到mysql 目标库t_user_info

  • 启动windows 环境点击C:\tools\pdi-ce-9.0.0.0-423\data-integration\Spoon.bat,启动较慢,莫急。

开源 ETL 工具 -----kettle 使用_第2张图片

  • 新建转换,添加数据源“DB 连接”,oracle 和mysql.

开源 ETL 工具 -----kettle 使用_第3张图片

 开源 ETL 工具 -----kettle 使用_第4张图片

  • 点击核心对象-输入-表输入
  • 开源 ETL 工具 -----kettle 使用_第5张图片

开源 ETL 工具 -----kettle 使用_第6张图片

点击三角运行,看效果,可以输出详细日志。

四.有坑吗?有吧

  • 源数据库表结构修改,直接刷新时字段不会同步,需要重新添加数据源,再执行。
  • 数据库blob类型时,直接使用kettle 8+,7不支持。 

 

你可能感兴趣的:(学习笔记,博客,etl)