说明,接下来我会写一系列关于 Kettle使用的博客,希望能够帮到各位。
环境: Oracle数据库,建立test_student02表。 test_student02表结构及测试数据如下所示:
-- 创建 test_student02表
create table TEST_STUDENT02
(
ST_ID VARCHAR2(64),
ST_NAME VARCHAR2(255),
ST_AGE NUMBER(3),
ST_ADDRESS VARCHAR2(255),
ST_SEX VARCHAR2(8),
ST_STATUS NUMBER(2),
CREATE_DATE DATE
)
-- 插入一些测试数据
insert into test_student02 (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('001', '侯耀华', 77, '北京市-海淀区', '男', 0, to_date('10-06-2019 10:56:21', 'dd-mm-yyyy hh24:mi:ss'));
insert into test_student02 (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('002', '郭德纲', 45, '河北省-保定市', '男', 0, to_date('09-06-2019 16:56:21', 'dd-mm-yyyy hh24:mi:ss'));
insert into test_student02 (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('003', '曹云金', 33, '河南省-洛阳市', '男', 1, to_date('10-06-2019 13:22:21', 'dd-mm-yyyy hh24:mi:ss'));
insert into test_student02 (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('004', '岳云鹏', 31, '河南省-周口市', '男', 0, to_date('08-06-2019 09:35:27', 'dd-mm-yyyy hh24:mi:ss'));
insert into test_student02 (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('005', '宋丹丹', 52, '黑龙江-佳木斯', '女', 0, to_date('09-06-2019 07:35:27', 'dd-mm-yyyy hh24:mi:ss'));
insert into test_student02 (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('006', '倪妮', 31, '江苏省-南京市', '女', 1, to_date('08-06-2019 04:16:41', 'dd-mm-yyyy hh24:mi:ss'));
insert into test_student02 (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('007', '江流儿', 445, '明朝-汴梁人氏', '男', 0, to_date('11-06-1798 15:11:47', 'dd-mm-yyyy hh24:mi:ss'));
insert into test_student02 (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('008', '赵丽颖', 31, '河南省-平顶山市', '女', 0, to_date('06-06-2019 03:24:51', 'dd-mm-yyyy hh24:mi:ss'));
Mysql数据库,建立 test_student 表, test_student表结构及测试数据如下所示:
-- 创建表
CREATE TABLE `test_student` (
`st_id` varchar(64) NOT NULL DEFAULT '' COMMENT '编号',
`st_name` varchar(255) DEFAULT '' COMMENT '姓名',
`st_age` int(3) DEFAULT NULL COMMENT '年龄',
`st_address` varchar(255) DEFAULT NULL COMMENT '地址',
`st_sex` varchar(8) DEFAULT NULL COMMENT '性别',
`st_status` int(2) DEFAULT NULL COMMENT '状态, 0-正常, 1-异常. ',
`create_date` datetime DEFAULT NULL COMMENT '创建时间',
`update_date` datetime DEFAULT NULL COMMENT '修改时间',
PRIMARY KEY (`st_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
-- 插入一些测试数据
INSERT INTO test_student (st_id, st_name, st_age, st_address, st_sex, st_status, create_date, update_date) VALUES ('user_001', '蒋涛', '25', '湖南省-长沙市', '男', NULL, '2019-06-09 10:13:54', NULL);
INSERT INTO test_student (st_id, st_name, st_age, st_address, st_sex, st_status, create_date, update_date) VALUES ('user_002', '吴玉', '19', '福建省-龙岩市', '女', NULL, '2019-06-08 10:14:02', NULL);
INSERT INTO test_student (st_id, st_name, st_age, st_address, st_sex, st_status, create_date, update_date) VALUES ('user_003', '上官飞', '20', '河北省-廊坊市', '男', NULL, '2019-06-07 10:14:06', NULL);
insert into test_student (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('001', '侯耀华', 77, '北京市-海淀区', '男', 0, '2019/6/10 10:56:21');
insert into test_student (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('002', '郭德纲', 45, '河北省-保定市', '男', 0, '2019/6/9 16:56:21');
insert into test_student (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('003', '曹云金', 33, '河南省-洛阳市', '男', 1, '2019/6/10 13:22:21');
insert into test_student (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('004', '岳云鹏', 31, '河南省-周口市', '男', 0, '2019/6/8 9:35:27');
insert into test_student (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('005', '宋丹丹', 52, '黑龙江-佳木斯', '女', 0, '2019/6/9 7:35:27');
insert into test_student (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('006', '倪妮', 31, '江苏省-南京市', '女', 1, '2019/6/8 4:16:41');
insert into test_student (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('007', '江流儿', 445, '明朝-汴梁人氏', '男', 0, '1798/6/11 15:11:47');
insert into test_student (ST_ID, ST_NAME, ST_AGE, ST_ADDRESS, ST_SEX, ST_STATUS, CREATE_DATE)
values ('008', '赵丽颖', 31, '河南省-平顶山市', '女', 0, '2019/6/6 3:24:51');
使用kettle实现如下SQL语句:
-- 说明:test_student表是 Mysql数据库中的表
-- test_student02表是Oracle数据库中的表
update test_student
set status_cd=-5
where st_id in (
SELECT st_id
FROM test_student02
)
and status_cd=1;
具体步骤如下:
1、新建一个转换, 建立 Mysql、Oracle数据库的链接功能。如下图一、图二、图三、图四、图五所示。
图一
图二
图三
图四
图五
2、创建“表输入控件”, 选择需要链接的数据库,编写SQL语句,SQL语句如下所示。其中, 将 st_status 字段设置成1, new_st_status值设置成 -5 。表输入控件的具体操作如下图六所示。
SELECT st_id, 1 st_status, -5 new_st_status
FROM test_student02
图六
3、创建 “更新” 控件。 选择需要链接的数据库、目标表, 相关联字段,需要进行判断的字段,更新字段。在“更新控件”界面,需要勾选“忽略查询失败?”,否则运行会报错。 “更新”操作步骤如下图七、图八、图九所示。
图七
图八
图九
4、点击“运行”,可以通过日志、运行窗口查看运行情况。 在运行前,通过图十、图十一可以看到数据库表中源数据。
图十二、图十三是 Kettle运行操作步骤, 图十四是运行结束后数据库中的数据显示,图十五是Kettle运行“步骤度量”窗口。
图十
图十一
图十二
图十三
图十四
图十五