7.开发和测试数据集多大合适 翻译自 吴恩达新书-Machine Learning Yearning
更多好玩的机器学习教程:进入袋马学院领一份,全部免费.为了检测出不同算法之间的差异,开发数据集应该足够大。比如,分类算法A的准确率为90.0%,分类算法B的准确率为90.1%,如果开发数据集中只有100个样本,那你无法检测出这0.1%差在哪儿。100个样本的开发数据集实在时太小了。通常,我们会在开发数据集通中,放入1000到10,000个样本。对于10,000个样本来说,找到这0.1%并改进它,就