目标检测之锚点与锚框


导读:目标检测模型使用锚框去预测物体的位置框,它对于目标检测任务具有关键意义。理解并仔细地微调模型的锚框是对于提升检测性能非常重要,特别是数据集具有不规则的物体时。

锚框与目标检测任务

目标检测,不同于图像分类任务。通常一副图片中具有多个相同或者不同类别的物体,目标检测任务,需要准确地确认并定位到所有物品。
目标检测之锚点与锚框_第1张图片
此图展示了一个目标被检测到的结果,既需要给出object class的置信度,又需要给出位置框的坐标(x1,x2,y1,y1,此处用了四个数去描述位置框)。目标检测模型处理此任务通过将预测分为两部分来解决:通过回归预测边界框;通过分类来预测类标签。

什么是锚框?

为了预测和定位一幅图片中多个目标,多数领先的检测模型如EfficientDet和YOLO都以锚框作为先验,然后开始调整。一般来说,使用边界框按照以下顺序:

  • 在图像中形成数千个候选锚框;
  • 对于每个锚框,预测该框的一些量,并作为候选框;
  • 基于真实标注的边界框,计算损失函数;
  • 计算给定偏移框与真实对象重叠的概率;
  • 如果该概率大于0.5,将该预测纳入损失函数;
  • 通过逐渐奖励与惩罚预测框,推动模型走向预测正确的方向。

如果你只是轻微训练模型,将会看到预测框出现在各处。如下图所示:

如果你在自己的数据集上训练YOLO,可能需要自定义设置这些锚框。但YOLOv5能够基于训练集自动学习锚框分布,每次训练时,自适应的计算不同训练集中的最佳锚框值。
当然,如果觉得计算的锚框效果不是很好,也可以在代码中将自动计算锚框功能关闭。
在代码中描述为:

parser.add_argument('--noautoanchor', action='store_true', help='disable autoanchor check')

关闭自动计算锚框功能,即train.py中这一行代码,设置成False,每次训练时,不会自动计算。

你可能感兴趣的:(Computer,Vision,目标检测,计算机视觉,深度学习)