5.4.2 数据规范化处理

案例介绍:通过Kettle工具,对数据进行检验操作

使用Kettle工具,创建一个转换,并添加“自定义常量数据”控件、“计算器”控件、“数据检验”控件、“空操作”控件以及Hop跳连接线。如图所示

5.4.2 数据规范化处理_第1张图片

 配置自定义常量数据控件

双击“自定义常量数据”控件,进入“自定义常量数据”界面配置实验用数据;单击“元数据”选项卡,添加字段常量ProductionDate、ProductionName、ProductionNumber以及CommoditySales并指定其数据类型;单击“数据”选项卡,添加自定义的数据。

5.4.2 数据规范化处理_第2张图片

5.4.2 数据规范化处理_第3张图片 配置 计算器 控件

双击“计算器”控件,进入“计算器”界面;在“字段”处,添加一个新字段UnitPrice,用于存储计算出的产品单价数据;在“字段A”和“字段B”处的下拉选项中分别选择“CommoditySales”(销售额)和“ProductionNumber”(销售数量)字段;在“计算”处的下拉框中选择“A/B”,即表示将字段A与字段B进行相除计算。

5.4.2 数据规范化处理_第4张图片

 配置数据检验控件

5.4.2 数据规范化处理_第5张图片

 运行转换5.4.2 数据规范化处理_第6张图片

选中“空操作(什么也不做)2”控件,单击执行结果窗口的“Preview data”选项卡,查看是否将不符合校验规则的数据检验出来。5.4.2 数据规范化处理_第7张图片 

你可能感兴趣的:(数据清洗,etl)