kettle简介及下载

企业数据仓库模型:

kettle简介及下载_第1张图片

一、Kettle简介:

ETL简介

ETL(Extract-Transform-Load的缩写,即数据抽取、转换、的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少、介绍的ETL工具是Kettle。

Kettle简介

Kettle是一款国外开源的ETL工具,纯Java编写,可以在Windows、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定

Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式流出。

Kettle这个ETL工具库,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做

Kettle中有两种脚本文件,transformationjob,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

Kettle(现在已经更名为PDI,Pentaho Data Integration-Pentaho数据集成)。

Kettle的结构:

kettle简介及下载_第2张图片

Kettle的结构-Spoon和Date Integration Server

Spoon是构建ETL JobsTransformations的工具。Spoon以拖拽的方式图形化设计,能够通过spoon调用专用的数据集成引擎或者集群

Data Integration Server是一个专用的ETL Server,它的主要功能有:

功能

描述

执行

通过Pentaho Data Integration引擎执行ETL的作业或转换

安全性

管理用户、角色或集成的安全性

内容管理

提供一个集中的资源库,用来管理ETL的作业和转换。资源库包含所有内容和特征的历史版本。

时序安排

在spoon设计者环境中提供管理Data Integration Server上的活动的时序和监控的的服务

Kettle的结构-Enterprise Console

Enterprise Console(企业控制台)提供了一个小型的客户端,用于管理Pentaho Data Integration企业版的部署

包括企业版本的证书管理监控控制远程Pentaho Data Integration服务器上的活动分析已登记的作业和转换的动态绩效

Kettle的核心组件:

名称

描述

Spoon

通过图形接口,用于编辑作业和转换的桌面应用

Pan

一个独立的命令行程序,用于执行由Spoon编辑的转换和作业

Kitchen

一个独立的命令行程序,用于执行由Spoon编辑的作业

Carte

Carte是一个轻量级的Web容器,用于建立专用、远程的ETL Server

Kettle概念模型:

kettle简介及下载_第3张图片
Kettle的执行分为两个层次:Job(作业)和Transformation(转换)。

总结-Kettle简介:

   1.ETL是数据抽取、转换、加载。

   2.Spoon是图形界面接口。

   3.Kettle包含job和transformation两种脚本。

二、Kettle下载:

kettle我已经下载好了,包括数据库的驱动也单独整理出来了,包括mysql、Oracle、SQL Server,需要的自取。kettle我下的是7和8两个版本。

链接: https://pan.baidu.com/s/1NwFNQETIz3KRFfHf0A0YPg 提取码: 8383 复制这段内容后打开百度网盘手机App,操作更方便哦

Kettle目录文件:

kettle简介及下载_第4张图片

kettle简介及下载_第5张图片

kettle简介及下载_第6张图片

你可能感兴趣的:(kettle)