5.4.2Kettle数据的清洗与检验——数据规范化处理

1.打开kettle工具创建转换data_validation,并添加如下控件以及Hop跳连接线。

5.4.2Kettle数据的清洗与检验——数据规范化处理_第1张图片

 2.配置“自定义常量数据”控件,“元数据”与“数据”选项卡配置如下图所示。

5.4.2Kettle数据的清洗与检验——数据规范化处理_第2张图片

 5.4.2Kettle数据的清洗与检验——数据规范化处理_第3张图片

3.配置“计算器”控件

在“字段”处添加一个新字段UnitPrice,用于存储计算出的产品单价数据。

5.4.2Kettle数据的清洗与检验——数据规范化处理_第4张图片

 

 4.配置“数据检验”控件

点击“增加检验”,增加三个检验,分别为“date_verify”“name_verify”“price_verify”;单机检验分别设置检验条件。

“date_verify”检验

5.4.2Kettle数据的清洗与检验——数据规范化处理_第5张图片

 “name_verify”检验

5.4.2Kettle数据的清洗与检验——数据规范化处理_第6张图片

  “price_verify”检验

5.4.2Kettle数据的清洗与检验——数据规范化处理_第7张图片

 

5.配置“空操作”控件

通过分发方式设置“主输出步骤”连接到“空操作(什么也不做)”控件;设置“错误处理步骤”连接到“空操作(什么也不做)2”控件。

6.运行转换data_validation

5.4.2Kettle数据的清洗与检验——数据规范化处理_第8张图片

 5.4.2Kettle数据的清洗与检验——数据规范化处理_第9张图片

 不符合校验规则的数据成功被检验出来。

你可能感兴趣的:(ETL-kettle,java,开发语言,etl工程师,etl,数据挖掘)