今天在做特征工程时,考虑给某列的缺失值,填充为该列的众数。按照之前填补均值和最大最小值的方法:
import pandas as pd
df.Mer_min_discount.fillna(df.Mer_min_discount.mode(), inplace=True)
结果发现缺失值怎么都填充不上,查阅资料后,恍然大悟,原来由于众数可能存在多个,所以pandas返回的是一个Series,而不像mean()返回的是一个值:
IN: print(type(df.id.mode()))
IN: print(type(df.id.mean()))
解决办法:
df.Mer_min_distance.fillna(df.Mer_min_distance.mode()[0], inplace=True)
默认取第一个众数。