19.总结:基本误差分析 翻译自 吴恩达新书-Machine Learning Yearning

更多好玩的机器学习教程: 进入袋马学院领一份 ,全部免费.

  • 当你开始一个新项目时,特别是如果你在一个你不是专家的领域,很难正确地预测最有效的工作方向。
  • 因此,不要一开始就尝试设计和构建完美的系统。相反,尽可能快地建立基本的系统(也许在几天之内)。然后使用误差分析帮助你识别最有有效的方向并迭代地改进你的算法。
  • 从开发样本集中,选择分类错误的100个样本进行进行误差分析,评估出主要的错误类别。利用这些信息确定不同类别错误的修复优先级。
  • 将开发数据集分成人工观测数据集和模型调参数据集。即用于人工处理的人工观测数据集和机器处理的模型调参数据集。如果人工观测数据集上的性能远远优于模型调参数据集,说明你在人工观测数据集上已经发生了过拟合,此时应该加入更多数据到人工观测数据集中。
  • 人工观测数据集应该足够大,这样你的算法就会有足够多的错误样本供你进行误差分析。对于很多实际的应用来说,1000-10000个样本是模型调参数据集理想的数量。
  • 如果你的开发样本集数量不够大,不足使用这种分割的方式,那么只需使用一个人工观测数据集来手动进行误差分析、模型选择和超参数调优。

更多好玩的机器学习教程: 进入袋马学院领一份 ,全部免费.

你可能感兴趣的:(吴恩达-YEARNING)