关于神经网络权重初始值的设置的研究

关于神经网络权重初始值的设置的研究

    • 一、权重初始值
    • 二、权重初始值会影响隐藏层的激活值分布
    • 三、Xavier初始值
    • 四、He初始值
    • 五、基于MNIST数据集的权重初始值的比较

一、权重初始值

权值衰减—抑制过拟合、提高泛化能力。

所谓权值衰减,即,以减小权重参数的值为目的进行学习。

所以说人们一开始,就想把权重初始值设置的比较小。

关于神经网络权重初始值的设置的研究_第1张图片

那如果权重初始值全设为0或者一样的值呢?那可不行,如果输入层权重为0,那么第二层神经元都到的全是0,如果第二层是乘法节点,拿上图举例子,x=y=0,所以返回来的两个梯度是一个样的。就没意义了。所有权重共同进退有何意义?权重共同进退,术语叫做权重均一化。

二、权重初始值会影响隐藏层的激活值分布

先看斯坦福大学做的一个实验:

你可能感兴趣的:(学习笔记,机器学习,神经网络,初始值)