5.2 缺失值处理

5.2.1 缺失值清洗策略

5.2 缺失值处理_第1张图片

5.2.2 去除缺失值

1.创建转换 

5.2 缺失值处理_第2张图片

2.配置文本文件输入控件

5.2 缺失值处理_第3张图片5.2 缺失值处理_第4张图片 

同样的,分隔符为一个tab

5.2 缺失值处理_第5张图片 

 

3.配置字段选择控件

5.2 缺失值处理_第6张图片

5.2 缺失值处理_第7张图片

4.配置过滤记录控件

5.2 缺失值处理_第8张图片

 5.配置excel输出控件

5.2 缺失值处理_第9张图片

6.运行转换

5.2 缺失值处理_第10张图片 

 7.查看文件file.xls

5.2 缺失值处理_第11张图片

5.2.3 填充缺失值

1.创建转换 

5.2 缺失值处理_第12张图片

2.配置文本文件输入控件

5.2 缺失值处理_第13张图片

 5.2 缺失值处理_第14张图片

5.2 缺失值处理_第15张图片 

3.配置过滤记录控件

 5.2 缺失值处理_第16张图片

 4.配置替换NULL值控件

5.2 缺失值处理_第17张图片

 5.配置合并记录控件

5.2 缺失值处理_第18张图片

6.配置替换NULL值2控件

5.2 缺失值处理_第19张图片 

 7.配置字段选择字段

5.2 缺失值处理_第20张图片

8.运行fill_missing_value

5.2 缺失值处理_第21张图片 

9.查看people_survey.txt文件中的缺失值是否已填充 

5.2 缺失值处理_第22张图片

成功! 

你可能感兴趣的:(ETL数据清洗,大数据)