训练集、验证集、测试集-知多少

因为论文反馈得知概念错误,因此,特此记录,希望这样的根本性错误能够少犯一点!
本文主要内容转自以下博客:https://blog.csdn.net/kieven2008/article/details/81582591
https://www.cnblogs.com/crazyacking/p/6737955.html
训练集:顾名思义,用来训练数据,以估计模型。
验证集:其存在的意义,在于调整参数,以选择最合适的模型。
测试集:测试集被用来计算模型的泛化能力。
在一些知识体系中认为,验证集和测试集是不可混淆而谈的。但是在我看来这一点取决于,数据量的大小。
比如,在监督学习的案例中,需要带有标签的数据,而标签就需要人为进行判读,这样是十分浪费时间和精力的。
因此,此时的样本数据集是比较小的,因此,我们采用交叉验证的方法。将样本集划分为训练集和测试集,在此基础上反复地进行训练、测试以及模型选择。

你可能感兴趣的:(训练集、验证集、测试集-知多少)