学习笔记(一)什么是梯度?为什么要正则化?偏差(Bias)和方差(Variance)的关系?为了更小的误差(error),如何选择模型?

一、什么是梯度?

答:▽ L就是梯度(如图),三角形符号倒过来(▽ )是梯度算子(在空间各方向上的全微分)

学习笔记(一)什么是梯度?为什么要正则化?偏差(Bias)和方差(Variance)的关系?为了更小的误差(error),如何选择模型?_第1张图片

二、为什么要正则化?

答:我们希望得到一个平滑的function,这个function受到噪点数据的影响就会变小。对异常数据就不会那么敏感,可以提升模型的容错率。所有在Loss Function中加入了参数的平方和项

学习笔记(一)什么是梯度?为什么要正则化?偏差(Bias)和方差(Variance)的关系?为了更小的误差(error),如何选择模型?_第2张图片

学习笔记(一)什么是梯度?为什么要正则化?偏差(Bias)和方差(Variance)的关系?为了更小的误差(error),如何选择模型?_第3张图片

三、偏差(Bias)和方差(Variance)的关系?

答:模型越复杂,对真实数据就模拟得更加准确,期望值就接近真实值,所以偏差(Bias)就越小;但样本数据就会更加分散,方差(Variance)会增大。相反,模型越简单,就不一定包含真实函数模型,偏差(Bias)就会较大;但样本数据就会更加集中,方差(Variance)会变小。终上所述,模型要选择一个适中,让偏差(Bias)尽可能小的情况下方差(Variance)也小。

如果偏差(Bias)很大,叫欠拟合(underfitting);如果方差(Variance)很大,叫过拟合(overfitting)

学习笔记(一)什么是梯度?为什么要正则化?偏差(Bias)和方差(Variance)的关系?为了更小的误差(error),如何选择模型?_第4张图片

解决方法:

学习笔记(一)什么是梯度?为什么要正则化?偏差(Bias)和方差(Variance)的关系?为了更小的误差(error),如何选择模型?_第5张图片

学习笔记(一)什么是梯度?为什么要正则化?偏差(Bias)和方差(Variance)的关系?为了更小的误差(error),如何选择模型?_第6张图片

四、为了更小的误差(error),如何选择模型?

学习笔记(一)什么是梯度?为什么要正则化?偏差(Bias)和方差(Variance)的关系?为了更小的误差(error),如何选择模型?_第7张图片

五、如何防止过拟合?

1.增加训练数据量

标题数据量少,过拟合

                         

数据量增多,过拟合有所改善

                 

2. L1,L2,L3,L4......正则化

损失函数加入参数惩罚项

3. Dropout使神经网络没办法过度依赖某几项参数权重

Dropout训练时随机丢掉一些权重参数

4.简化神经网络

 

 

 

 

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(机器学习,深度学习)