Kettle快速入门

0.资源下载

链接: https://pan.baidu.com/s/1EJGXy19x70081pl1MkxfDw 提取码: xn63 复制这段内容后打开百度网盘手机App,操作更方便哦

1.快速入门

将下载好的压缩包解压(注意:上级目录不能有中文

image-20210322193743691

将mysql-connector-java-5.1.38.jar复制到lib文件夹下面

Kettle快速入门_第1张图片

进入目录data-integration,双击Spoon.bat启动(第一次记载比较慢)

Kettle快速入门_第2张图片

启动成功,点击右上角connect

Kettle快速入门_第3张图片

新建配置仓库

Kettle快速入门_第4张图片

Kettle快速入门_第5张图片

注意:不能有中文

Kettle快速入门_第6张图片

新建

Kettle快速入门_第7张图片

配置文件(注意需要提前在mysql创建kettle数据库)

Kettle快速入门_第8张图片

链接成功

Kettle快速入门_第9张图片

之后点击finsh创建配置仓库完成。

默认使用admin admin登录仓库

Kettle快速入门_第10张图片

成功连接

Kettle快速入门_第11张图片

2.测试MySQL连接

在mysql创建kettledemo数据库,并创建表格

create table stu1(id int, name varchar(20), age int);
create table stu2(id int, name varchar(20));

insert into stu1 values(1001,'zhangsan',22),(1002,'lisi',22),(1003,'xiaohua',22);
insert into stu2 values(1001,'hanmeimei');

Kettle快速入门_第12张图片

创建转换

Kettle快速入门_第13张图片

拉取表输入并双击

Kettle快速入门_第14张图片

新建

Kettle快速入门_第15张图片

创建链接

Kettle快速入门_第16张图片

预览数据

Kettle快速入门_第17张图片

拉取插入更新

Kettle快速入门_第18张图片

按住shift连接

Kettle快速入门_第19张图片

如图进行配置

Kettle快速入门_第20张图片

执行

Kettle快速入门_第21张图片

执行成功

Kettle快速入门_第22张图片

Kettle快速入门_第23张图片

3.测试Hive连接

首先启动hiveserver2服务

Kettle快速入门_第24张图片

在hive的default数据库下创建表格数据

create table emp(
empno int,
ename string, 
job string,
mgr int,
hiredate string,
sal int,
comm string,
deptno int
)
row format delimited
fields terminated by '\t';

create table dept(
deptno int,
dname string, 
loc string
)
row format delimited
fields terminated by '\t';

insert into dept values
(10,'accounting','NEW YORK'),
(20,'RESEARCH','DALLAS'),
(30,'SALES','CHICAGO'),
(40,'OPERATIONS','BOSTON');

insert into emp values
(7369,'SMITH','CLERK','7902','1980-12-17',800,NULL,20),
(7499,'ALLEN','SALESMAN','7698','1980-12-17',1600,300,30),
(7521,'WARD','SALESMAN','7698','1980-12-17',1250,500,30),
(7566,'JONES','MANAGER','7839','1980-12-17',2975,NULL,20);

修改data-integration\plugins\pentaho-big-data-plugin目录下的plugin.properties

Kettle快速入门_第25张图片

进入data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp26文件夹,将服务器的配置文件拉取到本地

Kettle快速入门_第26张图片

我的hive版本是1.1.0而kettle里面的版本是1.2.0

Kettle快速入门_第27张图片

于是我将kettle的hive文件删除,然后复制了服务器的hive相关jar

Kettle快速入门_第28张图片

创建表输入并配置hive连接

Kettle快速入门_第29张图片

加载表数据

Kettle快速入门_第30张图片

Kettle快速入门_第31张图片

进行排序

Kettle快速入门_第32张图片

Kettle快速入门_第33张图片

连接数据

Kettle快速入门_第34张图片

文件输出

Kettle快速入门_第35张图片

测试

Kettle快速入门_第36张图片

注意:

脚本执行语句

执行job

Kitchen.bat -rep=mysql_rep -user=admin -pass=admin -job=jobdemo1 -dir=/ -logfile=H:\study\kettle\kettle-neo4j-remix-8.2.0.7-719-REMIX\data-integration\logs\log.txt

 ./kitchen.sh -rep=mysql_rep -user=admin -pass=admin -job=jobdemo1 -dir=/ -logfile=./logs/log.txt

执行转换

./pan.sh -rep=mysql_rep -user=admin -pass=admin -trans=hive2hdfs -dir=/

你可能感兴趣的:(其他,大数据)