1.前言
数据清洗过程需要对数据进行转换拼装计算,Kettle提供“公式步骤”供用户使用,下面将介绍如何在kettle中使用公式。

2.公式步骤帮助手册介绍

打开kettle工具, 在左侧找到“公式步骤”(核心对象->脚本->公式),主要包含“新字段”(计算后产生的新字段)、“替换值”(用计算获得的值替换原有的值,“替换值”优先级高于“新字段”),计算公式,点击公式输入框会弹出帮助手册,此处重点介绍公式基本使用方法。

Kettle巧用公式轻松实现数据抽取_第1张图片
Kettle巧用公式轻松实现数据抽取_第2张图片
(1)基本计算介绍(Basic computation)
Kettle巧用公式轻松实现数据抽取_第3张图片
点击左上角小三角形,自动展开,右侧框内会有描述和示例。在上面的编辑框内输入公式,下面会同步进行校验,如果输入正确,则下方编辑框内不存在任何提示。
Kettle巧用公式轻松实现数据抽取_第4张图片
下面这里是几个简单示例,字段需要用[]括起来,如果存在多运算符采用()决定先后运算顺序。
Kettle巧用公式轻松实现数据抽取_第5张图片
(2)比较计算介绍(Comparisons)

比较两个值的大小,返回为boolean值
Kettle巧用公式轻松实现数据抽取_第6张图片
(3)日期/时间计算介绍(Date/Time)

日期函数比较多,这里介绍通用的四个函数,具体说明如下所示:
Kettle巧用公式轻松实现数据抽取_第7张图片
Kettle巧用公式轻松实现数据抽取_第8张图片
(4)信息计算介绍(Information)

日期函数比较多,这里介绍通用的四个函数,具体说明如下所示:
Kettle巧用公式轻松实现数据抽取_第9张图片
Kettle巧用公式轻松实现数据抽取_第10张图片
(5)逻辑计算介绍(Logical)

逻辑函数比较多,这里介绍通用的三个函数,具体说明如下所示:
Kettle巧用公式轻松实现数据抽取_第11张图片
Kettle巧用公式轻松实现数据抽取_第12张图片
(6)数学计算介绍(Math)

数学函数比较多,这里介绍通用的四个函数,具体说明如下所示:
Kettle巧用公式轻松实现数据抽取_第13张图片
Kettle巧用公式轻松实现数据抽取_第14张图片
(7)文本计算介绍(Text)

数学函数比较多,这里介绍通用的四个函数,具体说明如下所示:
Kettle巧用公式轻松实现数据抽取_第15张图片
Kettle巧用公式轻松实现数据抽取_第16张图片

注意:想要学习通过kettle工具实现hive、hbase数据库抽取输出,和其他更多关于kettle的知识,请扫描以下二维码或者链接获取学习资料。
链接地址:
https://edu.51cto.com/sd/e80d0
二维码地址:
Kettle巧用公式轻松实现数据抽取_第17张图片
同时也欢迎各位看官关注本人公众号,本人将相关资料和学习视频上传到上面,供大家一起学习讨论:
Kettle巧用公式轻松实现数据抽取_第18张图片