「Jeremy Jordan」Notes on Machine learning Project Management Guidelines(机器学习项目管理指南)

Sina Weibo:小锋子Shawn
Tencent E-mail:[email protected]
http://blog.csdn.net/dgyuanshaofeng/article/details/82722050

我读到一篇不错的博文,介绍机器学习项目管理,来自Jermemy Jordan。
项目生命周期 机器学习项目具有高度迭代性,即在机器学习生命周期中,你在某环节迭代到某个满意的水平,你继续下个任务。通过与现实世界交互,你重新定义下一次迭代开发的目标。如图1所示,为机器学习开发生命周期。
「Jeremy Jordan」Notes on Machine learning Project Management Guidelines(机器学习项目管理指南)_第1张图片
1、计划、项目启动

  • 定义任务、琢磨需求
  • 决定项目可行性(数据、模型、市场)
  • 讨论大致的模型折中(准确率vs速度)
  • 建立项目代码库
    2、数据收集和标注
  • 定义金标准(创建标注文档)
  • 建立数据摄取管道(如何收集/爬虫数据)
  • 验证数据质量
  • 回顾第1步,确保数据是充足的
    3、模型调研
  • 使用初始数据管道,开始简单模型
  • 让简单模型过拟合训练数据
  • 决定和执行简单baseline
  • 在早期阶段,保持机智,尝试许多并行/独立的想法
  • 如果存在世界一流模型,那么寻找到,并复现结果,接着应用你们的数据集,作为第二个baseline
  • 回顾第1步,确保可行性
  • 回顾第2步,确保数据质量是足够的
    4、模型优化

你可能感兴趣的:(「Jeremy Jordan」Notes on Machine learning Project Management Guidelines(机器学习项目管理指南))