为什么有的人并不用验证集,只用训练集和测试集,他们不需要调超参数吗?

有时候,一些人确实只使用训练集和测试集而不使用验证集。这可能是因为他们认为数据量不足以进一步划分,或者他们使用了其他方法来调整超参数。以下是一些可能的原因:

数据量有限:如果数据集很小,将其划分为训练集、验证集和测试集可能会导致每个子集的样本量不足。在这种情况下,他们可能会选择使用交叉验证(如k-折交叉验证)方法来调整超参数,而不是划分出一个单独的验证集。

使用预设的超参数:有时候,他们可能会选择使用预设的超参数值(例如,根据经验或从其他研究中获得),而不是在当前数据集上进行调整。这种情况下,他们可能不需要一个单独的验证集。

使用默认的超参数:对于某些算法,库中的默认超参数值可能已经足够好,他们可能不需要进一步调整。在这种情况下,他们可能选择省略验证集。

使用嵌入式方法:一些模型,如LASSO回归和Elastic Net,具有内置的特征选择和超参数调整功能。在这种情况下,他们可能不需要一个独立的验证集来调整超参数。

虽然在某些情况下可以省略验证集,但在大多数情况下,为了获得更可靠的性能评估和避免过拟合,建议使用训练集、验证集和测试集三者进行模型训练、调优和评估。

你可能感兴趣的:(机器学习,机器学习,人工智能,深度学习)