数据预处理

机器学习输入的特征数据进行训练时需要进行标准化、归一化,使数据的分布符合正态分布模型(生活中多数数据都是此模型),或者与与参数相符合的模型分布,一般是把数据缩放到[0,1]或者[-1,1]之间,如果数据有缺失,还需要填补缺失的数据。详情请见:数据预处理最要使用的方法有几大类:

  • 绝对值最大值法
    (找出参数的最大值,然后使用参数集合中的数除以此最大值)
  • 最小最大值法
  • 参数编码法
  • 数据降维(PCA和SVD分解)

你可能感兴趣的:(数据预处理)