学习笔记(4.29)

遇到问题:

暂无

学习内容

缺失值填充处理

houseprice['LotFrontage']=houseprice['LotFrontage'].fillna(0)   
复制代码

将该列中的空值或者NA填充为0

all_data.product_type[all_data.product_type.isnull()]=all_data.product_type.dropna().mode().values 
复制代码

如果该列是字符串的,就将该列中出现次数最多的字符串赋予空值,mode()函数就是取出现次数最多的元素。

houseprice['LotFrontage'].fillna(method='pad') 
复制代码

使用前一个数值替代空值或者NA,就是NA前面最近的非空数值替换

houseprice['LotFrontage'].fillna(method='bfill',limit=1) 
复制代码

使用后一个数值替代空值或者NA,limit=1就是限制如果几个连续的空值,只能最近的一个空值可以被填充。

houseprice['LotFrontage'].fillna(houseprice['LotFrontage'].mean())    
复制代码

使用平均值进行填充

houseprice['LotFrontage'].interpolate()
复制代码

使用插值来估计NaN 如果index是数字,可以设置参数method='value' ,如果是时间,可以设置method='time'

houseprice= houseprice.fillna(houseprice.mean()) 
复制代码

将缺失值全部用该列的平均值代替,这个时候一般已经提前将字符串特征转换成了数值。

转载于:https://juejin.im/post/5ccbf4516fb9a0322e73a0b7

你可能感兴趣的:(学习笔记(4.29))