神经网络训练中,Epoch、Batch Size和iteration的名词理解

在我们进行深度学习时,会设置epoch,Batch size、iteration等参数,这些参数的概念与理解至关重要。这里详细解释下。
参考链接:
http://www.dataguru.cn/article-12193-1.html
https://medium.com/towards-data-science/epoch-vs-iterations-vs-batch-size-4dfb9c7ce9c9

  1. Epoch

当一个完整的数据集通过了神经网络一次并且返回了一次,这个过程称为一个 epoch。然而,当一个 epoch 对于计算机而言太庞大的时候,就需要把它分成多个小块。
为什么要使用多于一个 epoch?
我知道这刚开始听起来会很奇怪,在神经网络中传递完整的数据集一次是不够的,而且我们需要将完整的数据集在同样的神经网络中传递多次。但是请记住,我们使用的是有限的数据集,并且我们使用一个迭代过程即梯度下降,优化学习过程和图示。因此仅仅更新权重一次或者说使用一个 epoch 是不够的。


神经网络训练中,Epoch、Batch Size和iteration的名词理解_第1张图片
在这里插入图片描述

随着 epoch 数量增加,神经网络中的权重的更新次数也增加,曲线从欠拟合变得过拟合。

那么,几个 epoch 才是合适的呢?
不幸的是,这个问题并没有正确的答案。对于不同的数据集,答案是不一样的。但是数据的多样性会影响合适的 epoch 的数量。比如,只有黑色的猫的数据集,以及有各种颜色的猫的数据集。

  1. batch size
    一个 batch 中的样本总数。记住:batch size 和 number of batches 是不同的。
    BATCH 是什么?
    在不能将数据一次性通过神经网络的时候,就需要将数据集分成几个 batch。

正如将这篇文章分成几个部分,如介绍、Epoch、Batch size 和迭代,从而使文章更容易阅读和理解。

  1. iteration
    理解迭代,只需要知道乘法表或者一个计算器就可以了。迭代是 batch 需要完成一个 epoch 的次数。记住:在一个 epoch 中,batch 数和迭代数是相等的。

比如对于一个有 2000 个训练样本的数据集。将 2000 个样本分成大小为 500 的 batch,那么完成一个 epoch 需要 4 个 iteration。

你可能感兴趣的:(神经网络训练中,Epoch、Batch Size和iteration的名词理解)