8.3 案例实现(加载演员数据至演员维度表)

操作介绍:

通过Kettle工具加载演员数据至演员维度表dim_actor。

1.打开Kettle工具,创建转换

使用Kettle工具,创建一个转换load_dim_actor,并添加表输入控件、插入/更新控件以及Hop跳连接线,具体如图所示。

8.3 案例实现(加载演员数据至演员维度表)_第1张图片

2.配置表输入控件

双击“表输入”控件,进入“表输入”配置界面,单击【新建】按钮,配置数据库连接,配置完成后单击【确认】按钮。MySQL数据库连接的配置,如图所示。

8.3 案例实现(加载演员数据至演员维度表)_第2张图片在SQL框中编写SQL语句,用于获取字段actor_last_update中的最大值,将该值替换为”1970-01-01 00:00:00”并赋值给临时字段max_dim_actor_last_update;单击“预览”按钮,查看临时字段max_dim_actor_last_update是否将默认值设置为“1970-01-01 00:00:00”,如图所示。

8.3 案例实现(加载演员数据至演员维度表)_第3张图片

8.3 案例实现(加载演员数据至演员维度表)_第4张图片3.配置表输入2控件

 双击“表输入2”控件,进入“表输入”界面,单击【新建】按钮,配置数据库连接,配置完成后单击【确认】按钮。MySQL数据库连接的配置如图所示。

8.3 案例实现(加载演员数据至演员维度表)_第5张图片

在SQL框中编写SQL语句,用于获取数据库sakila中数据表actor中的最新数据,如图所示。 

8.3 案例实现(加载演员数据至演员维度表)_第6张图片

4.配置插入/更新控件

双击“插入/更新”控件,进入“插入/更新”界面,单击【新建】按钮,配置数据库连接,配置完成后单击【确认】按钮。MySQL数据库连接的配置,如图所示。

8.3 案例实现(加载演员数据至演员维度表)_第7张图片单击目标表右侧的【浏览】按钮,弹出“数据库浏览器”窗口,选择目标表,即维度表dim_actor。单击【获取字段】按钮,用来指定查询数据所需要的关键字,这里选择的是dim_actor数据表中的actor_id字段和输入流里面的actor_id字段;单击【获取和更新字段】按钮,用来指定需要更新的字段,如图所示。

8.3 案例实现(加载演员数据至演员维度表)_第8张图片

5.运行转换load_dim_actor

单击转换工作区顶部的运行按钮,运行创建的转换load_dim_actor,实现加载演员数据至演员维度表dim_actor中,如图所示。

8.3 案例实现(加载演员数据至演员维度表)_第9张图片6.查看数据表dim_actor中的数据

通过SQLyog工具,查看数据表dim_actor是否已成功插入演员数据,查看结果,如图所示。

8.3 案例实现(加载演员数据至演员维度表)_第10张图片

 

你可能感兴趣的:(kettle数据清洗案例,数据库)