深度学习验证集和测试集的区别

实际上验证集和测试集在大部分情况下没有太多区别,对于深度学习模型来说的话,超参数的影响可能不会有传统机器学习那么大了,所以在深度学习领域验证集没有很多人谈到。

区别是这样的:

模型在初步的训练结束后,还想要尝试调整不同的超参数组合(比如:隐藏层的大小,学习率,dropout之类的),这个时候我们把数据分割成训练集,验证集和测试集。

我们使用训练集进行训练每个超参数组合下的模型,这样模型虽然是同一类的但是其参数不一,然后对每一个超参数组合都是用验证集来查看模型的准确率,并且最终选择验证集准确率最高的超参数组合,然后把训练集和验证集的数据组合,作为新的训练集训练最优超参数组合的模型。

在训练过程中使用测试集来获得准确率以此来作为最终的准确率。

另外一个场景

比如Kaggle的数据竞赛,我们手头有的数据:只有有label的训练数据,和没有label的等待预测的数据。这个时候需要把训练数据分割出来一部分作为验证集来查看模型在训练过程中的表现。因为此时的测试集是没有label的,所以我们没办法通过测试集来获得模型的准确率。

你可能感兴趣的:(深度学习知识,深度学习)