深度学习图像数据标准化与归一化

附上一段pytorch代码:

__imagenet_stats = {'mean': [0.485, 0.456, 0.406],
                   'std': [0.229, 0.224, 0.225]}
def scale_crop(input_size, scale_size=None, normalize=__imagenet_stats):
    t_list = [
        transforms.ToTensor(),
        transforms.Normalize(**normalize),
    ]
    #if scale_size != input_size:
    #t_list = [transforms.Scale((960,540))] + t_list

    return transforms.Compose(t_list)

可以看到这段代码用到Normalize(标准化)操作,中文文档这么解释,

深度学习图像数据标准化与归一化_第1张图片
,通过标准化后,实现了数据中心化,数据中心化符合数据分布规律,能增加模型的泛化能力。
参考: http://www.sohu.com/a/243383119_823210

神经网络中的归一化作用:
归一化不改变图像信息,只是把像素从0-255变成0~1的范围,加快训练网络的收敛性,可以不进行归一化处理;归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1--+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算,首先基本度量单位要同一,神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预测的,归一化是同一在0-1之间的统计概率分布;当所有样本的输入信号都为正值时,与第一隐含层神经元相连的权值只能同时增加或减小,从而导致学习速度很慢。为了避免出现这种情况,加快网络学习速度,可以对输入信号进行归一化,使得所有样本的输入信号其均值接近于0或与其均方差相比很小。

归一化是因为sigmoid函数的取值是0到1之间的,网络最后一个节点的输出也是如此,所以经常要对样本的输出归一化处理。所以这样做分类的问题时用[0.9 0.1 0.1]就要比用[1 0 0]要好。

但是归一化处理并不总是合适的,根据输出值的分布情况,标准化等其它统计变换方法有时可能更好。
本段引用自:https://blog.csdn.net/u010555688/article/details/25551255

你可能感兴趣的:(深度学习图像数据标准化与归一化)