归一化

一般的三种归一化方法:
1、线性函数转换,表达式如下:

    y=(x-MinValue)/(MaxValue-MinValue)  归一化至[0 1]

       y=2*(x-MinValue)/(MaxValue-MinValue)-1  归一化至[-1 1]

  2、对数函数转换,表达式如下:

    y=log10 (x)

  3、反余切函数转换 ,表达式如下:

    y=arctan(x)*2/PI

归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。归一化是为了加快训练网络的收敛性,可以不进行归一化处理

归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1–+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算,首先基本度量单位要同一,神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预测的,归一化是同一在0-1之间的统计概率分布;SVM是以降维后线性划分距离来分类和仿真的,因此时空降维归一化是统一在-1–+1之间的统计坐标分布。

当所有样本的输入信号都为正值时,与第一隐含层神经元相连的权值只能同时增加或减小,从而导致学习速度很慢。为了避免出现这种情况,加快网络学习速度,可以对输入信号进行归一化,使得所有样本的输入信号其均值接近于0或与其均方差相比很小。

归一化是因为sigmoid函数的取值是0到1之间的,网络最后一个节点的输出也是如此,所以经常要对样本的输出归一化处理。所以这样做分类的问题时用[0.9 0.1 0.1]就要比用要好。

但是归一化处理并不总是合适的,根据输出值的分布情况,标准化等其它统计变换方法有时可能更好。

主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速,应该归到数字信号处理范畴之内。 归一化方法(Normalization Method)

1。把数变为(0,1)之间的小数 主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速,应该归到数字信号处理范畴之内。

2 。把有量纲表达式变为无量纲表达式归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。

比如,复数阻抗可以归一化书写:Z = R + jωL = R(1 + jωL/R) ,复数部分变成了纯数量了,没有量纲。

标准化方法(Normalization Method)

    数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。由于信用指标体系的各个指标度量单位是不同的,为了能够将指标参与评价计算,需要对指标进行规范化处理,通过函数变换将其数值映射到某个数值区间。
//求均值,8082553是最大值,min=0,(avg-0)/(max-min):归一化,left(a,6):保留6位有效数字,包括小数点
SELECT Q.service_user SU, AVG(Q.SEVERITY) S, AVG(Q.ALARM_NUM) A, AVG(Q.LOSSRATE) L, left(AVG(Q.MEDIARATE)/8082553.0,6) M, left(AVG(Q.VSTQ)/50,6) V, AVG(Q.MOS_VALUE) MOS from QY_Nanjing_qoe1_repair Q GROUP BY Q.SERVICE_USER //将归一化的东西保存在新建的表中 create table QY_Nanjing_qoe1_repair_standard as select * from ( //上面那个select出的东西 )B //把两张字段相同的表合并到一张里, //insert into1名(field1,field2,..) select field1,field2,... from2INSERT into QY_Nanjing_qoe1 ( SERVICE_USER, severity, alarm_num, lossrate, mediarate, vstq, mos_value, start_time, end_time, class ) SELECT SERVICE_USER, severity, alarm_num, lossrate, mediarate, vstq, mos_value, start_time, end_time, class FROM QY_Nanjing_qoe1_repair;

你可能感兴趣的:(mysql,机器学习)