几种优化算法的比较(BGD、SGD、MBGD、指数加权平均、momentum、NAG、RMSprop、Adam)
对于神经网络而言,初始化参数不是全0而是随机是非常重要的:假设神经网络的前一层输出的维度是m,经过当前层之后输出维度是n,那么当前层的参数初始化如下:w=np.random.randn(m,n)*0.01一般权重矩阵初始化比较小,He初始化:np.random.randn(m,n)*np.sqrt(2/n)b=np.zeros((m,1))一般偏差初始化为0几种优化算法下面主要讲解BGD、SGD、