机器学习中小知识集锦

0.总结

  • LawsonAbs的认知与思考,不一定准确,还请各位读者怀批判思维阅读。
  • 持续更新~

1. train dev test

我们将数据划分为训练集、验证集和测试集。
在训练集上训练模型,在验证集上评估模型,一旦找到的最佳的参数,就在测试集上最后测试一次,测试集上的误差作为泛化误差的近似。关于验证集的划分可以参考测试集的划分,其实都是一样的,这里不再赘述。
可以简单地将上述三者对应学习过程:
训练集看成是家庭作业;
开发集看出是小测试;
测试集看成是期末考试。

你可能感兴趣的:(ML,机器学习)