YOLO-V4 论文学习+唐宇迪博士课程学习笔记

论文主要贡献:
1.利用单GPU即可训练一个目标检测器.
2.验证了Bag-of-Freebies 和 Bag-of-Specials方法在训练目标检测器当中的作用。
3.对包括CBN、PAN、SAM在内的现有方法进行了改进。

数据增强:
1.Mosaic数据增强
参考CutMix将四张图像(每张各自进行数据增强)拼接成一张进行训练:
YOLO-V4 论文学习+唐宇迪博士课程学习笔记_第1张图片
2.SAT数据增强(Self-adversarial-training自对抗训练)

损失函数:
1.IOU Loss:实际和预测框无相交即IOU=0时无法进行梯度计算,且相同的IOU对应多种框的相对位置,无法反应实际情况。
2.GIOU:引入了最小封闭形状C可以把A和B包括在内,优点在于在A框B框不重叠的情况下可以使得预测框向真实框逼近,缺点不足在于A和B重叠情况下GIOU又无法评价好坏了。
YOLO-V4 论文学习+唐宇迪博士课程学习笔记_第2张图片
YOLO-V4 论文学习+唐宇迪博士课程学习笔记_第3张图片

3.DIOU:式中分式分子为预测框与真实框的中心点欧式距离,式中分母为可以覆盖A和B两框的最小BOX对角线长度。优点在于直接利用距离计算,速度更快解决了GIOU的问题。
YOLO-V4 论文学习+唐宇迪博士课程学习笔记_第4张图片
YOLO-V4 论文学习+唐宇迪博士课程学习笔记_第5张图片

4.YOLO V4选用CIOU作为损失函数:损失函数必须考虑重叠面积、中心点距离与长宽比,用v代表长宽比用α代表权重参数。
在这里插入图片描述

SAM空间注意力机制

在原始SAM基础上,把经过池化再卷积的过程改为一次卷积。
YOLO-V4 论文学习+唐宇迪博士课程学习笔记_第6张图片

PAN:

原有特征融合都是加法操作,现在改为拼接操作,虽然特征更多但可以提升精度。
YOLO-V4 论文学习+唐宇迪博士课程学习笔记_第7张图片

Mish激活函数:
相比Relu激活函数,计算量增加,效果提升一点
YOLO-V4 论文学习+唐宇迪博士课程学习笔记_第8张图片

公式:
在这里插入图片描述

整体网络架构:

YOLO-V4 论文学习+唐宇迪博士课程学习笔记_第9张图片

你可能感兴趣的:(目标检测,深度学习,深度学习,计算机视觉,人工智能,目标检测,神经网络)