SimpleImputer函数详解

 废话不多说,直接上代码.

import numpy as np
from sklearn.impute import SimpleImputer

imp_mean = SimpleImputer(missing_values=np.nan, strategy='mean')
x = [[7, 2, 3], [4, np.nan, 6], [10, 5, 9]]
data = [[np.nan, 2, 3], [4, np.nan, 6], [10, np.nan, 9]]

Fit = imp_mean.fit(x)
new_data = imp_mean.transform(data)

print(Fit)
print(data)
print(imp_mean.transform(data))

 SimpleImputer函数详解_第1张图片

在上面的例子里,首先创建了函数对象imp_mean用于插值,fit函数提供了用平均数,中位数等插值方法的数据x,data是真正要处理的数据.最后即取x与data每列的平均值填补data的缺失值.

在实际操作中,经常使用fit_transfrom()函数,即要处理的数据和提供用于处理的数据都是同一个data.

 

你可能感兴趣的:(SimpleImputer函数详解)