数据分析之简易异常值去除

异常值处理:

在pandas读取excel文件的时候 首要安装pip install xlrd这一个库

1、读取数据

df=pd.read_excel(io='D:\Test\hr.xlsx')

2、了解列结构

数据分析之简易异常值去除_第1张图片

 

统计空值的个数

数据分析之简易异常值去除_第2张图片

对空值进行常数,均值填充

数据分析之简易异常值去除_第3张图片

数据分析之简易异常值去除_第4张图片

 

删除空值

 

 

数据分析之简易异常值去除_第5张图片

 

异常值查找:

数据分析之简易异常值去除_第6张图片

 

last_evaluation:最大值99  实际满意度应该<1

数据分析之简易异常值去除_第7张图片

薪水分为高中低3档次

剔除不需要的档次

数据分析之简易异常值去除_第8张图片

 

替换值:

数据分析之简易异常值去除_第9张图片

 

 

你可能感兴趣的:(菜鸟计划)