数据预处理-用sklearn解决数据中出现缺失值

机器学习和数据挖掘中所使用的数据,永远不可能是完美的。很多特征,对于分析和建模来说意义非凡,但对于实际收集数据的人却不是如此,因此数据挖掘之中,常常会有重要的字段缺失值很多,但又不能舍弃字段的情况。因此,数据预处理中非常重要的一项就是处理缺失值。

数据预处理-用sklearn解决数据中出现缺失值_第1张图片
数据预处理-用sklearn解决数据中出现缺失值_第2张图片
在这里,我们使用从泰坦尼克号提取出来的数据,这个数据有三个特征,一个数值型,两个字符型,标签也是字符
型。从这里开始,我们就使用这个数据给大家作为例子,让大家慢慢熟悉sklearn中数据预处理的各种方式。
class sklearn.impute.SimpleImputer (missing_values=nan, strategy=’mean’, fill_value=None, verbose=0,
copy=True)

数据预处理-用sklearn解决数据中出现缺失值_第3张图片
数据预处理-用sklearn解决数据中出现缺失值_第4张图片
数据预处理-用sklearn解决数据中出现缺失值_第5张图片
数据预处理-用sklearn解决数据中出现缺失值_第6张图片

数据预处理-用sklearn解决数据中出现缺失值_第7张图片

你可能感兴趣的:(机器学习)