yolo笔记

目录

  • 输入端
    • Mosaic数据增强
    • 数据增强Copy-paste
    • 数据增强- MixUp
    • 数据增强- Albumentations
    • 数据增强- Augment HSV (Hue, Saturation, Value)色度、饱和度、浓度
    • 数据增强- Random horizontal flip
    • 自适应锚框计算
    • 自适应图片缩放
  • Backbone
    • Focus结构
    • CSP结构
    • CSP结构
    • Neck
  • 损失函数
    • IOU_Loss
    • GIOU_Loss
    • DIOU_Loss
    • CIOU_loss
  • 训练策略
  • 消除Grid敏感度

输入端

参考:https://zhuanlan.zhihu.com/p/172121380

Mosaic数据增强

随机的仿射变换

数据增强Copy-paste

有分割数据集时
yolo笔记_第1张图片

数据增强- MixUp

yolo笔记_第2张图片
按一定的透明程度混合生成一张图片;

数据增强- Albumentations

参考:https://blog.csdn.net/weixin_45942927/article/details/124529291
空域滤波
为图像平滑(去噪声)和图像锐化(突出轮廓)
均值滤波:图像去噪的同时也破坏了图像的细节部分
中值滤波:可以保护图像尖锐的边缘,选择适当的点来替代污染点的值,所以处理效果好,对椒盐噪声表现较好,对高斯噪声表现较差。
yolo笔记_第3张图片

直方图均衡化
可提高图像的对比度
yolo笔记_第4张图片

以及改变图片质量等等

数据增强- Augment HSV (Hue, Saturation, Value)色度、饱和度、浓度

数据增强- Random horizontal flip

随机水平翻转

自适应锚框计算

自适应图片缩放

yolo笔记_第5张图片

Backbone

在这里插入图片描述

Focus结构

yolo笔记_第6张图片
将Focus模块替换成了6x6的普通卷积层。
两者功能相同,但后者效率更高。
yolo笔记_第7张图片
yolo笔记_第8张图片

CSP结构

yolo笔记_第9张图片

CSP结构

yolo笔记_第10张图片

Neck

yolo笔记_第11张图片

损失函数

yolo笔记_第12张图片
yolo笔记_第13张图片
小目标
中等目标
大目标
小型目标更难预测,所以将小型目标的超参设置大一些

参考:https://zhuanlan.zhihu.com/p/143747206

IOU_Loss

yolo笔记_第14张图片
当预测框和目标框不相交时,IOU=0,无法反应两个框距离的远近,此时损失函数不可导,IOU_Loss无法优化两个框不相交的情况。

GIOU_Loss

yolo笔记_第15张图片
yolo笔记_第16张图片

DIOU_Loss

yolo笔记_第17张图片
yolo笔记_第18张图片

CIOU_loss

yolo笔记_第19张图片

训练策略

➢Multi-scale training(0.5~1.5x) 320大小图片会缩放为0.5到1.5倍
➢AutoAnchor(For training custom data)

➢Warmup and Cosine LR scheduler
学习率从一个非常小的值慢慢增长到设置的初始的学习率
用cos的方法去降低学习率

➢EMA(Exponential Moving Average)
将学习率加上一个动量

➢Mixed precision
混合精度训练
➢Evolve hyper- parameters

消除Grid敏感度

yolo笔记_第20张图片
yolo笔记_第21张图片
梯度爆炸
yolo笔记_第22张图片

匹配正样本

yolo笔记_第23张图片
anchor_t最大为4(缩放因子设置为0~4)
在0.25~4的区间内就算匹配成功

yolo笔记_第24张图片

你可能感兴趣的:(单目标跟踪,笔记)