Kettle案例总结一—多表连接(记录集连接)

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。

Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

使用kettle常见需求是要求从一个库将数据抽取到另一个库或将多张数据表数据关联转换后加载到另一张表中。前者只要一个表输入连接到
一个表输出即可,而后者相对略复杂一点。具体步骤总结如下:
1、两张表数据连接:
Kettle案例总结一—多表连接(记录集连接)_第1张图片
2、三张表数据连接:
Kettle案例总结一—多表连接(记录集连接)_第2张图片

PS:在数据抽取过程中出现中文乱码问题,可行解决办法有:
打开Spoon.bat,在if “%PENTAHO_DI_JAVA_OPTIONS%”==”” set PENTAHO_DI_JAVA_OPTIONS=”-Xms1024m” “-Xmx2048m” “-XX:MaxPermSize=256m”
后面加了”-Dfile.encoding=UTF-8”,再重启即可解决乱码。
Kettle案例总结一—多表连接(记录集连接)_第3张图片

你可能感兴趣的:(kettle)