1. 数据预处理-数据归一化和数据规范化

1. 数据归一化

1.1. 作用

  • 把数据映射到[0,1]的区间中
  • 把有量纲形式变成无量纲形式

1.2. 算法

1.2.1. 最小-最大归一化

Y=XXminXmaxXmin

把X的值映射到[0, 1] 的区域中,因为必有X < Xmax,所以分子(X - Xmin) < 分母(Xmax - Xmin),所以Y在[0,1]之间


1.2.2. 对数函数归一化

Y=log10(X)

1.2.3. 反余切函数归一化

Y=arctan(x2π)




2. 数据规范化

1.1. 作用

使数据按照一定的比例进行缩放,通过缩放,使得数据映射到特定的空间里面。

1.2. 算法

1.2.1. 最小-最大规范化

Y=XXminXmaxXmin(XnewmaxXnewmin)+Xnewmin

把X的值映射到[Xnewmin, Xnewmax] 的区域中。


1.2.2. Z分数(z-score)规范化(零均值规范化)

Y=Xμσ

这种方法最大的优势在于,不需要知道数据集的最大值,最小值。离群点对结果影响较低。


1.2.3. Sigmoid函数

Y=11+ex

Sigmoid函数是一个具有S形曲线的函数,当数据趋向于正无穷和负无穷的时候,映射出来的值就会无限趋向于1和0,


1.2.4. 小数定标规范化

Y=X10n(n使Ymax<1)

通过移动小数点的位置,进行规范化


1.2.5. 模糊量化规范化

Y=12+12sin[πXmaxXmin(XXmaxXmin2)]

你可能感兴趣的:(机器学习-数学基础,机器学习数学基础)