笔记Day3

数值型 归一化 标准化 类别 one-hot编码

缺乏归一化导致部分数据占较大权重,但实际上所有特征都是同等重要

求平方差是会导致尺度较大的数据的影响力进一步提升

Outliers会导致模型向异常方向偏移  

标准化 减去平均数 除以标准差 数据的稳定性

有助于取消异常点

标准化对异常值鲁棒性高 适合现在嘈杂环境

插补缺失值 通过平均值 中位数可以按行和列来填补 一般以列也就是特征来填补

奇怪,我怎么记得1才是列S

你可能感兴趣的:(python,开发语言)