Kettle 数据筛选(找出错误数据)思路

1、原表
NNXJH66/nnzy/dbo/t_gps_info

2、
新建一张表
NNXJH66/tempdb/dbo/t_gps_info   
新建表
NNXJH66/tempdb/dbo/t_gps_info_int 

3、备份数据
NNXJH66/nnzy/dbo/t_gps_info----->NNXJH66/tempdb/dbo/t_gps_info

4、清洗数据
NNXJH66/tempdb/dbo/t_gps_info----->NNXJH66/tempdb/dbo/t_gps_info_int

(数量级大约7112500 七百万,错误数据21296 两万

Kettle Spoon 去定位数据还是很好用的,七百万大约0.5-1h就能全部搞定

注意:装Kettle 之前先装 JDK)

Kettle 数据筛选(找出错误数据)思路_第1张图片

你可能感兴趣的:(kettle)