YOLO系列检测器优化策略之Match positive samples和Eliminate grid sensitivity

目标检测任务中,代码中的grid是什么?

YOLO系列检测器优化策略之Match positive samples和Eliminate grid sensitivity_第1张图片

grid可以从两个角度理解:

  • grid真实的代表是预测特征层,每一个grid cell就代表特征层上的一个像素点。
  • 在输入图像中打上grid网格,就代表每一个grid cell(预测特征层的像素点)对应原始图像上的感受野,也就是等比例缩放后的大小。

因此:

  • 想要得到预测特征层的输出(bbox、cls和conf),只需要在grid上先通过一个3×3卷积,再通过一个1×1卷积即可。最后一个1×1卷积层的卷积个数为4+1+num_cls。这里的4代表4个bbox的预测值,1为置信度预测值,num_cls为类别预测值。特征层通过3×3卷积后,将特征进行整合,随后,1×1卷积则可以通过滑动的方式对每一个grid cell最终能看到

你可能感兴趣的:(视觉检测图像分割干货,yolov5,优化策略,yolov4,yolov3)