第五章 缺失值处理--填充缺失值

通过Kettle工具,使用平均值填充法对文件people_survey.txt中的缺失值进行填充。

打开Kettle工具,创建转换

 第五章 缺失值处理--填充缺失值_第1张图片

配置文本文件输入控件 

将people_survey.txt添加到“文本文件输入”控件中

第五章 缺失值处理--填充缺失值_第2张图片

 清除分隔符处的默认分隔符“;”,单击【Insert TAB】按钮,在分隔符处插入一个制表符;取消勾选“头部”复选框 

第五章 缺失值处理--填充缺失值_第3张图片

添加对应的字段名称,并指定数据类型

第五章 缺失值处理--填充缺失值_第4张图片

 配置过滤记录控件

第五章 缺失值处理--填充缺失值_第5张图片

配置替换NULL值控件 

 第五章 缺失值处理--填充缺失值_第6张图片

配置合并记录控件

 第五章 缺失值处理--填充缺失值_第7张图片

配置替换NULL值2控件

 第五章 缺失值处理--填充缺失值_第8张图片

配置字段选择控件 

 第五章 缺失值处理--填充缺失值_第9张图片

运行转换fill_missing_value并查看文件people_survey.txt中的缺失值是否已填充

 第五章 缺失值处理--填充缺失值_第10张图片

 

你可能感兴趣的:(kettle,java,mysql,数据库,etl)