15.在并行的错误分析中评估多个想法 翻译自 吴恩达新书-Machine Learning Yearning

更多好玩的机器学习教程: 进入袋马学院领一份 ,全部免费.

你的团队有几个关于改进猫咪检测器的想法:

  • 解决你的算法中,把狗识别为猫的错误。
  • 解决你的算法中,把大型猫科动物(比如狮子,美洲豹等)识别为宠物猫咪的错误。
  • 改进系统对模糊图像识别的性能。

你可以有效地并行评估所有这些想法。我通常会在浏览100个错误样本的时候,创建一个表格。我也记下了一些评注帮助我记住具体的例子。为了说明这个过程,让我们看一看在这个应用中可能会用到的一个表格:

15.在并行的错误分析中评估多个想法 翻译自 吴恩达新书-Machine Learning Yearning_第1张图片

上面的图3,同时进行大型猫科动物和模糊图片检测。此外,一张图片样本有可能与多个类别相关联。

你可以先定义不同的类别(狗,大猫,模糊)然后对所有的样本进行手动分类。实际上,一旦你开始浏览这些样本,你很可能会发现,其他错误分类方法可能更好。比如说,你在浏览你的Instagram(照片分享软件)中的照片时,发现照片的分组有一些错误。你可能会添加一个新的分组,并整理之前的照片。手动查看算法的错误分类样本,并且问想想,人类是否可以正确地给图片贴上标签,这么做通常可以让你提出新的错误分类方案。

最有帮助的错误分类方案是可以让你算法性能获得提升方案。例如,如果你想到使用“撤销”操作来恢复原始图片,那么对你的Instagram分类将会是最有帮助的。但是,你不需要把自己局限于你所知道的错误分类。这个过程的目标是建立你对最有潜力的领域的直觉,并专注于此。

误差分析是一个迭代过程。如果你一开始对分类一无所知,不要担心。在查看了一些图片之后,您可能会对错误类别开始有了一些想法。在动手对一些图像进行分类之后,您可能会想到新的类别并重新检查这些图片,加入新的分类方案。在再次检查期间,你可能又会有新的分类想法,以此类推。

假设您完成了100个出错样本的误差分析,并得到以下几点:
15.在并行的错误分析中评估多个想法 翻译自 吴恩达新书-Machine Learning Yearning_第2张图片

你现在知道,在一个项目中解决关于狗的识别的问题,最多可以消除8%的错误。针对大型猫科动物或模糊图像上的工作可以帮助消除更多的错误。因此,您可以在后两种类型中首先选择一个,并专注于这个方向。如果你的团队中有足够多的人可以并行执行多个方向,你也可以两个方向都做,邀请一部分工程师处理关于大型猫科动物的工作,另一些工程师处理模糊图像的工作。

误差分析并没有产生一个严格的数学公式来告诉你什么是具有最高优先级的任务。此外,你还须平衡性能提升和所需的工作量。

更多好玩的机器学习教程: 进入袋马学院领一份 ,全部免费.

你可能感兴趣的:(吴恩达新书,吴恩达新书中文版,吴恩达新书中文版全,吴恩达新书中文版1-52章,Machine,Learning,Yearning,中文版,吴恩达-YEARNING)