训练集、验证集、测试集的作用

Python数据分析中的

训练集、验证集、测试集

● 选择题

以下说法错误的是:

A 训练集用于训练模型

B 验证集与测试集作用类似

C 验证集通常配合训练集进行超参数调优和模型评估

D 测试集通常在训练后测试模型的泛化能力

● 问题解析

1.三种集合的概念。数据集在训练模型时一般被划分为训练集、验证集、测试集。机器学习的过程是:

首先用训练集训练出模型,然后用验证集验证模型,根据情况不断调整模型,选出其中最优的模型,之后记录最好的模型的超参数,最后用测试集评估最终的模型。

(1)训练集:用来训练模型。

(2)验证集:用于调整模型的超参数,用于对模型的能力进行初步评估。通常用来在模型迭代训练时,用于验证当前模型泛化能力,最终决定是否停止继续训练。验证集来自训练集的再划分,因此验证集与训练集最好是不交叠的,这样选择模型的时候,才可以避免被数据交叠的因素干扰。同时,验证集在训练过程中还可以监督模型是否发生过拟合,当验证集随着迭代次数增加,反而训练结果表现越来越差时,就表示发生了过拟合,应当停止迭代,所以验证集也可以用来判断何时停止训练。

(3)测试集:用来评估模最终模型的泛化能力。但测试集不能参与调参过程,否则就无法保证模型在未观测的数据上表现的可靠性。

2.理解三种集合。打个比方,使得读者更好的理解:训练集、验证集、测试集

比喻:我们可以认为训练的结果是高考考出好成绩:

(1)训练集可以认为是平时的作业以及测验;

(2)验证集可以认为是高考前的模拟考试;

(3)测试集就是最后高考的卷子。

Python数据分析中的 训练集、验证集、测试集 - 知乎 

你可能感兴趣的:(人工智能,python,深度学习)