YOLOv5 解读版本1——2020.8.20

YOLOv4 vs. YOLOv5

data augmentation

传统增强+

  1. CutOut
    在CNN第一层随机扔掉某一块
  2. Hide and seek
  3. MixUp
    按权重把两张图加一起
  4. CutMix
    cutout的区域加入另一张图的目标,应对遮挡问题,识别堆叠的目标物体
  5. Mosaic马赛克
    四张图片随机拼接成大图,缩放识别小物体缓解;batch压力

class label smoothing

引入均匀分布的噪声,平滑label,把类间距离放得更远了(原本只关注类内,不关注类间)

对比

YOLOv3 使用FPN

YOLOv4 使用PAN

使用SPP,(ROI Pooling的前身),但是是针对全图的,且输出三种固定的尺寸(ROI pooling是针对RPN的输出的)
PANNet
FPN特征金字塔;把高分辨率的浅层特征再加到深层部分,增强深层的位置信息(深层本来是丢失很多位置特征的)

CSP Net
网络变小时如何提高学习能力
是DenseNet升级
concat代替resnet中的add操作,特征复用,减少网络结构中的参数。带来的问题是梯度下降时特征重用,学习能力降低
csp解决方式,把每层卷积分成两部分,进行了一些复杂的组合,使梯度组合最大。

Mish激活函数
小于0是更加平滑

YOLOv5 使用

LeakyRelu+Sigmoid激活函数

Dropout更适应于全连接层,对卷积层Dropout影响小。(只去掉一个点,对卷积结果影响较小)
升级为DropBlock,随机对某个区域的2x2都丢弃,(而不是按一个点的随机去丢弃)

各种Loss,以IOU为基础的各种loss
577赞的知乎

你可能感兴趣的:(目标检测,深度学习,论文翻译笔记,深度学习,YOLO,目标检测)