数据集预处理

1)数据归一化: 

 

                 1.逐样本均值递减(若数据服从同一分布,则各维度都减对应维度的均值,使得数据去中心化,这样数据就不容易拟合了(特征值x比较大的时候,会导致W*x+b的结果也会很大,这样进行激活函数(如relu)输出时,会导致对应位置数值变化量太小))

数据集预处理_第1张图片

 

                              2. 特征标准化(数据集所有特征服从正太分布,减均值除标准差)

数据集预处理_第2张图片

                             3.像素缩放(例如,同除255)

                             4.PCA(白话):原理:抛弃携带信息量较少的维度,保留主要的特征信息来对数据进行降维处理

                                                     目的:去掉数据之间的相关联度和令方差均一化(由于图像中相邻像素之间具有很强的相关性,所以用于训练时很多输入是冗余的)

                                                    作用:1.减少特征之间的相关性

                                                                2.特征具有相同的方差(协方差阵为1)

 

 

                                         

 

你可能感兴趣的:(实习)