YOLOV5学习笔记(三)——网络组件详解

目录

1 各模块的作用

1.1 Focus:减少运算量

​编辑 1.2 CSPNet跨阶段局部网络

1.3 SPP空间金字塔池化

1.4 PANet

2 损失函数

2.1 类别预测

2.2 定位损失

2.2.1 GIOU LOSS

2.2.2 DIOU LOSS

2.2.3 CIOU LOSS

2.2.4 目标框回归


1 各模块的作用

1.1 Focus:减少运算量

YOLOV5学习笔记(三)——网络组件详解_第1张图片

YOLOV5学习笔记(三)——网络组件详解_第2张图片 1.2 CSPNet跨阶段局部网络

YOLOV5学习笔记(三)——网络组件详解_第3张图片

1.3 SPP空间金字塔池化

最大池化一般会导致特征图的减小,需要填充使特征图大小一样,最后拼接。可以增加感受野。

YOLOV5学习笔记(三)——网络组件详解_第4张图片

1.4 PANet

不同尺度进行融合时,最大和最小比较难融合,所以有个上采样和下采样,比较好融合。

YOLOV5学习笔记(三)——网络组件详解_第5张图片

2 损失函数

分类损失

定位损失

置信度损失

总的损失函数:classification loss+ localization loss + confidence loss

YOLOv5使用二元交叉熵损失函数计算类别概率和目标置信度得分的损失

YOLOv5使用CIOU loss作为bounding box回归的损失

2.1 类别预测

YOLOV5学习笔记(三)——网络组件详解_第6张图片

2.2 定位损失

2.2.1 GIOU LOSS

YOLOV5学习笔记(三)——网络组件详解_第7张图片

2.2.2 DIOU LOSS

考虑到框中心点的距离

YOLOV5学习笔记(三)——网络组件详解_第8张图片

损失函数可以表达为1-IOU+惩罚项

 YOLOV5学习笔记(三)——网络组件详解_第9张图片

DIOUloss定义如下

 YOLOV5学习笔记(三)——网络组件详解_第10张图片

2.2.3 CIOU LOSS

CIOU加入了一项宽高比的吻合度v

YOLOV5学习笔记(三)——网络组件详解_第11张图片

CIOU考虑的集合更多,yolov5默认采用CIOU

2.2.4 目标框回归

回归策略

VOC标注格式

YOLOV5学习笔记(三)——网络组件详解_第12张图片

yolo格式是基于中心点和目标框的宽高,并且归一化

YOLOV5学习笔记(三)——网络组件详解_第13张图片

Anchor给出了目标宽高的初始值,需要回归的是目标真实宽高与初始宽高的偏移量,偏移值是0时候,得到的就是预先设定的框。

YOLOV5学习笔记(三)——网络组件详解_第14张图片

 跨网格的匹配策略

可以得到更多的正样本anchor加速收敛

YOLOV5学习笔记(三)——网络组件详解_第15张图片

你可能感兴趣的:(计算机视觉,深度学习,人工智能)