pandas-缺失数据-task2

学习笔记

1.可以查看缺失信息
df.info( )
pandas-缺失数据-task2_第1张图片
2.挑选所有非缺失值列
pandas-缺失数据-task2_第2张图片

问题与联系

1.【问题一】 如何删除缺失值占比超过25%的列?
答:可以计算每列缺失值占该列总数的比例,

df.isna().sum( )/len(df[colnums])

【问题二】 什么是Nullable类型?请谈谈为什么要引入这个设计?
目前还没看完,后期再修改

【问题三】 对于一份有缺失值的数据,可以采取哪些策略或方法深化对它的了解?
答:可以先了解缺失值的分布情况、缺失比例,缺失太高可以舍弃整条数据;以及了解数据的含义,采取合理的方法进行填充,有很多缺失值的填充方法,要结合特征的含义,选取合理的值进行填充

你可能感兴趣的:(pandas-缺失数据-task2)