Black_Friday数据分析--缺失值

一、数据集简介

黑色星期五---通过消费者行为研究销售

数据集包含55万个零售商店在黑色星期五的销售记录,它包含不同种类的变量或数字或分类。它包含缺失的值。数据集来自Analytics Vidhya主办的竞赛。

二、数据导入

使用panda将数据导入为数据框类型,为 bf

Black_Friday数据分析--缺失值_第1张图片

 

三、处理缺失值

1.检查是否存在缺失值

Black_Friday数据分析--缺失值_第2张图片

Product_Category_2和Product_Category_3返回值为True,只有该2个字段存在缺失值。而User_ID 和Product_ID不存在缺失值,数据较为完整。


2.计算缺失值的比率

Black_Friday数据分析--缺失值_第3张图片

 

Product_Category_3的缺失值较高,约达70%

3.缺失值填充

Product_Category的取值为数字,可理解为表示商品属于该类别的程度(0-18),使用 0 填充。并检查是否替换成功。
Black_Friday数据分析--缺失值_第4张图片

缺失值处理完毕

 

未完待续。。。。。。

 

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(black_friday,python,缺失值处理,python与数据分析)