YOLOv5基础知识点——目标框回归与跨网格预测策略

目标框PASCAL VOC标注格式

 

 x,y,w,h做了归一化处理

目标框的回归

Anchor给出目标宽高的初始值,需要回归的是目标真实宽高与初始宽高的偏移量 

预测框中心点相对于对应网格(grid cell)左上角位置的相对偏移值

为了将边界框中心点约束在当前网格中,使用sigmoid函数处理偏移值,是预测偏移值在(0,1)范围内

蓝色是预测框,虚线是先验框anchor,每一个黑色小网格(cx,cy)就是一个标准锚框

YOLOv5基础知识点——目标框回归与跨网格预测策略_第1张图片

YOLOv5基础知识点——目标框回归与跨网格预测策略_第2张图片

原始的yolo/darknet框方程式存在严重缺陷。宽度和高度完全不受限制,因为他们只是out-exp,这很危险,因为他可能导致时空的梯度、不稳定、NaN损失并最终完全失去训练。

对于yolov5,确保通过sigmoid所有模型输出来修补此错误,同时还要确保中心点保持不变1=fcn(0),因此模型的标称零输出将导致使用标称锚框大小(无偏移,tx=0,ty=0,代入公式bx=cx+0.5,0.5即为锚框中心)。当前的方程式将锚点的倍数从最小0限制为最大4,并且锚框-目标匹配也已更新为基于宽度-高度倍数,标称上限阈值超参数为4.0(σ取值0-1,代入公式即b的范围0-4)。

YOLOv5基础知识点——目标框回归与跨网格预测策略_第3张图片

 

12. 12YOLOv5目标框回归与跨网格预测策略._哔哩哔哩_bilibili

你可能感兴趣的:(机器视觉,目标检测,深度学习,人工智能)