Kettle学习1

kettle工程存储方式

  • 以XML形式存储
  • 资源库方式存储

两类设计

  • 转换(Transformation),完成针对数据的基础转换
  • 作业(Job),完成整个工程流的控制

常用三大家族

  • Spoon:通过图形界面方式设计、运行、调试Job与Transformation
  • Pan:通过脚本命令方式运行Transformation
  • Kitchen:通过脚本命令方式来运行Job,一般就是通过调用Kitchen脚本来完成定时任务

重要文件介绍

  • lib:存放Kettle的核心(core)jar包,工作引擎(engine)jar包,数据库(DB)jar包,图形界面(UI)jar包
  • plugins:存放Kettle自定义插件时,需要把自定义好的插件打成jar包放在此目录
  • docs:存放kettle各种语言版本的API文档
  • libext:存放Kettle所是哟个到的第三方jar包,如:数据库驱动包,如缺少时需要把对应的数据库驱动包放入此文件夹里
  • pwd:存放kettle配置进群时所需要的配置文件与加密文件
  • simple-jndi:存放kettle使用jndi方式连接数据源方式的文件存放目录。目录下的jdbc.properties配置文件中有相应的实例提供参考。
  • libswt:存放kettle对应不同平台的相关UI jar包
  • samples:存放Kettle自带的一些Job与Trans实例
  • launcher:粗放ketlle Spoon加载的一些配置信息。
  • ui:存放kettle初始化使用到的图片和配置信息。

图形化打开方式

双击Spoon.bat

kettle数据源连接配置

关于Kettle数据源连接方式有三种:JDBC、ODBC、JNDI、(OCI只针对Oracle DB),但经常用到的只有两种,一直种是:JDBC,一种是ODBC数据库连接方式
Kettle中对于数据源有作用域的定义,也就是说有全局数据源与局部数据源两种
全局数据源可以从share.xml处查看,或者从在图形界面中查看是否是黑体

你可能感兴趣的:(工具使用)