sklearn.impute.SimpleImputer

官方:link

class sklearn.impute.SimpleImputer(*, missing_values=nan, strategy='mean', fill_value=None, verbose=0, copy=True, add_indicator=False)

用于缺失值插补的转换器。

参数:
missing_values:number, string, np.nan (default) or None缺失值的占位符。所有出现missing_values的情况都将被估算。对于具有缺失值的可空整数类型的pandas数据框,missing_values 应将其设置为np.nan,因为pd.NA将转换为np.nan。

strategy: string, default=’mean’
插补策略

  • 如果是“mean”,则使用每列中的平均值替换缺失值。只能与数字数据一起使用。
  • 如果为“median”,则使用每列中的中位数替换缺失值。只能与数字数据一起使用。
  • 如果为“ most_frequent”,则使用每一列中的众数替换缺失值。可以与字符串或数字数据一起使用。
  • 如果为“constant”,则将缺失的值替换为fill_value。可以与字符串或数字数据一起使用。

0.20版中的新功能:对于固定值插补,strategy =“ constant”。

fill_value: string or numerical value, default=None
当strategy ==“ constant”时,fill_value用于替换所有missing_values出现的情况。如果保留默认值,则在填充数字数据时fill_value将为0,而对于字符串或对象数据类型则为“ missing_value”。

你可能感兴趣的:(sklearn,python,pandas)