Yolov5 学习记录

img

(1)输入端Mosaic数据增强、自适应锚框计算,自适应图像缩放 主要是训练阶段的增强
(2)Backbone融合其他模型的思想 Focus结构,CSP结构
(3)NeckFPN+PAN结构
(4)Prediction输出和之前类似主要 损失函数GIOU_Loss 和预测框损失 DIOU_nms 

Mosaic数据增强则采用了4张图片,随机缩放随机裁剪随机排布的方式进行拼接,形成一张大的图片,可以丰富数据集的同时极大的提升网络的训练速度。

针对不同的数据集,都会有初始设定长宽的锚框。

初始锚框的基础上输出预测框,进而和真实框groundtruth进行比对,计算两者差距,再反向更新,迭代网络参数。

输出端

1)Bounding box损失函数

Yolov5中采用其中的GIOU_LossBounding box损失函数

2)nms非极大值抑制

针对很多目标框的筛选,通常需要nms操作Yolov4DIOU_Loss的基础上采用DIOU_nms的方式,而Yolov5中仍然采用加权nms的方式。

你可能感兴趣的:(深度学习,html5,html)