R 编程中的 LOOCV(留一法交叉验证)

LOOCV(Leave One Out Cross-Validation)是一种交叉验证方法,其中每个观察被视为验证集,其余(N-1)个观察被视为训练集。在 LOOCV 中,模型的拟合完成并使用一个观察验证集进行预测。此外,将每个观察结果重复 N 次作为验证集。模型已拟合,模型用于预测观察值。这是K 折交叉验证的一种特殊情况,其中折数与观察数相同(K = N)。这种方法有助于减少偏差和随机性。该方法旨在降低均方误差率并防止过拟合。在R 编程中执行 LOOCV 非常容易。

LOOCV 涉及每个观察一次,即每个观察本身都扮演验证集的角色。(N-1) 个观察值扮演训练集的角色。使用最小二乘线性,单个模型的性能成本与单个模型相同。在 LOOCV 中,在实现 LOOCV 方法的同时可以避免模型的重新拟合。MSE(均方误差)是通过拟合完整数据集来计算的。

R 编程中的 LOOCV(留一法交叉验证)_第1张图片

在上面的公式中,h i表示一个观察对其自身拟合的影响有多大,即在 0 和 1 之间惩罚残差,因为它除以一个小数。它使残差膨胀。

R中的实现
数据集:

Hedonic 是波士顿人口普查区价格的数据集。它包括犯罪率、25,000平方英尺住宅用地比例、平均房间数、1940年以前建造的业主单位比例等共15个方面。它预装了 R 中的Eclat包。

# Install

你可能感兴趣的:(R语言大学作业,r语言,开发语言,数据挖掘)