6.2不一致数据转换

不一致数据转换主要是将不同业务系统中的相同类型的数据进行统一。

在数据表company中,可以看出存在同一品牌型号的手机,售价却不同,具体如下图。

6.2不一致数据转换_第1张图片

下面通过kettle工具对数据表company进行不一致数据的转换操作,及通过与供货商提供的标准价格表进行比较,得出不一致的数据,从而进行修改,最终输出到数据表company中,具体实现操作如下。

一,创建转换

6.2不一致数据转换_第2张图片

二,配置控件“表输入”

6.2不一致数据转换_第3张图片

抽取成功如下图

6.2不一致数据转换_第4张图片

三,配置控件“表输入2”

6.2不一致数据转换_第5张图片

四,配置控件“字段选择”

“选择和修改”选项卡

6.2不一致数据转换_第6张图片

 “移除”选项卡

移除id,id与后面数据转换无关。

6.2不一致数据转换_第7张图片

 五,配置控件“表输入3”

6.2不一致数据转换_第8张图片

预览如下

6.2不一致数据转换_第9张图片

 六,配置控件“记录集连接”

“第一个步骤”选择字段选择;

“第二个步骤”选择表输入3;

“连接类型”选择RIGHT OUTER;

在第一个步骤的连接字段中选择brand,model,unitPrice1;第二个步骤的连接字段中选择brand,model,initPrice;

6.2不一致数据转换_第10张图片

 七,配置控件“字段选择2”

6.2不一致数据转换_第11张图片

八,配置控件“插入/更新”

6.2不一致数据转换_第12张图片

九,查看结果

6.2不一致数据转换_第13张图片

 

你可能感兴趣的:(数据清洗,etl)