Kettle转换控件

转换概述

转换控件是转换里面的第四个分类,转换控件也是转换中的第三大控件,用来转换数据。转换时ETL里面的T(Transform),主要做数据转换,数据清洗的工作。ETL整个过程中,Taransform的工作量很大,耗费时间也最久,大概可以占到整个ETL的三分之二。

Concat fields

转换控件、顾名思义,就是将多个字段连接起来形成一个新的字段。





值映射

值映射就是把字段的一个值映射成其他的值。在数据质量规范上使用非常多,比如很多系统对应性别sex字段的定义不同,所以我们需要利用此控件,将同一字段的不同值,映射转换成我们需要的值。


增加常量& 增加序列

增加常量就是在本身的数据流里面添加一列数据,该列的数据都是相同的值。
增加序列是给数据流添加一个序列字段,可以自定义该序列字段的递增步长。


字段选择

字段选择就是从数据流中选择字段,改变名称,修改数据类型



计算器

计算器是一个函数集合来创建新的字段,还可以设置字段是否移除(临时字段)。我们可以通过计算器里面的多个计算函数对已有的字段进行计算,得出新字段。

你可能感兴趣的:(Kettle转换控件)