头歌平台(EduCoder)—— 数据挖掘算法原理与实践:数据预处理

        数据挖掘,就是从数据中学习到规律,再将学习到的规律对未知的数据进行预测。但是我们最开始获取的数据其中绝大多数是“有毛病”的,不利于后期进行分析,所以我们在分析前需要进行数据的预处理。sklearn.preprocessing包提供了几个常用的函数和转换类,用它们将一个原始的特征向量转化为一个更适于数据分析的表示形式。一般来说,学习算法收益于数据集的标准形式。如果数据中存在异常点,稳健的数据规范或转换是更适合的。 本实训的目的是掌握好sklearn中的数据预处理方法。

第1关:标准化

头歌平台(EduCoder)—— 数据挖掘算法原理与实践:数据预处理_第1张图片

第2关:非线性转换 

头歌平台(EduCoder)—— 数据挖掘算法原理与实践:数据预处理_第2张图片

第3关:归一化 

头歌平台(EduCoder)—— 数据挖掘算法原理与实践:数据预处理_第3张图片

第4关:离散值编码

头歌平台(EduCoder)—— 数据挖掘算法原理与实践:数据预处理_第4张图片

第5关:生成多项式特征 

头歌平台(EduCoder)—— 数据挖掘算法原理与实践:数据预处理_第5张图片

第6关:估算缺失值

头歌平台(EduCoder)—— 数据挖掘算法原理与实践:数据预处理_第6张图片

你可能感兴趣的:(头歌平台(EduCoder),数据挖掘,算法,sklearn,python,机器学习)