机器学习 day32(神经网络如何解决高方差和高偏差)

  1. 解决高偏差和高方差的新方法
  • 图一
  • 之前,我们需要通过选取多项式次数以及正则化参数λ,来平衡高方差和高偏差
  • 图二
  • 只要训练集不是特别大,那么一个大型的神经网络总能很好的适应训练集,即Jtrain很低
  • 由此可以得出,若要减小Jtrain,可以增大神经网络,即增加隐藏层的层数或增加单层隐藏层中的神经元
  • 而若要降低Jcv,可以增大训练集。最终,只有Jtrain和Jcv均很小,此模型才算解决了高方差和高偏差
  • 此方法的局限性:首先,更大的神经网络,意味着更昂贵的计算成本。其次,有时训练数据只有这么多,无法增加
  • 图三
  • 一个大型的神经网络如果进行适当的正则化后,不会增大Jcv,反而它的性能通常比小型神经网络模型要好或一样好
  • 图四
  • 通常我们不会对参数b进行正则化,因为无论是否正则化b都对结果没什么影响

你可能感兴趣的:(学习,机器学习)