YOLO5的数据增强和权重设置hyp.scratch-med.yaml文件解读,degrees角度旋转和水平、垂直翻转解释

在新的YOLO5代码中,其中的超参数设置文件已经变成了5个,如下:放在data文件夹下得hyps文件夹中。

YOLO5的数据增强和权重设置hyp.scratch-med.yaml文件解读,degrees角度旋转和水平、垂直翻转解释_第1张图片

 作者对于这些文件的解释如下:

YOLO5的数据增强和权重设置hyp.scratch-med.yaml文件解读,degrees角度旋转和水平、垂直翻转解释_第2张图片

这是什么意思呢?可以翻译为中文看看:

YOLO5的数据增强和权重设置hyp.scratch-med.yaml文件解读,degrees角度旋转和水平、垂直翻转解释_第3张图片

这样是不是就比较清楚了。

这个文件的调用命令在train.py里面,如下:

 YOLO5的数据增强和权重设置hyp.scratch-med.yaml文件解读,degrees角度旋转和水平、垂直翻转解释_第4张图片

那么我们接下来看看这个 hyp.scratch-med.yaml超参数设置文件里面都有些什么内容吧。

#YOLOv5  by Ultralytics, GPL-3.0 许可证
#用于从头开始进行中等增强 COCO 训练的超参数
# python train.py --batch 32 --cfg yolov5m6.yaml --weights '' --data coco.yaml --img 1280 --epochs 300
#请参阅超参数演变 https://github.com/ultralytics/yolov5#tutorials 教程

lr0: 0.01 # 初始学习率 (SGD=1E-2, Adam=1E-3)
lrf: 0.1 # 最终 OneCycleLR 学习率 (lr0 * lrf)
momentum: 0.937 # SGD 动量/亚当贝塔1
weight_decay:0.0005#优化器重量衰减5e-4
warmup_epochs: 3.0 # 预热纪元 (分数确定)
warmup_momentum: 0.8 # 预热初始动量
warmup_bias_lr: 0.1 # 预热初始偏差 lr
box: 0.05 # 箱体损耗增益
cls: 0.3 # cls 损失增益
cls_pw: 1.0 # cls BCELoss positive_weight
obj: 0.7 # obj 损耗增益(带像素的比例)
obj_pw: 1.0 # obj BCELoss positive_weight
iou_t:0.20 # IoU 训练阈值
anchor_t: 4.0 # 锚点多重阈值
# anchors:每个输出层 3 个锚点(0 个忽略)
fl_gamma:0.0 # 焦散伽玛(有效检测默认伽玛=1.5)
hsv_h: 0.015 # 图像 HSV 色调增强 (分数)
hsv_s: 0.7 # 图像 HSV-饱和度增强 (分数)
hsv_v: 0.4 # 图像 HSV-值增强(分数)
degrees: 0.0 # 图像旋转 (+/- 度)
translate:0.1 # 图像翻译(+/- 分数)
scale:0.9 # 图像比例(+/- 增益)
shear: 0.0 # 图像切变 (+/- 度)
perspective:0.0 # 图像透视(+/- 分数),范围 0-0.001
flipud: 0.0 # 图像上下翻转(概率)
fliplr: 0.5 # 图像左右翻转 (概率)
mosaic: 1.0 # 图像马赛克 (概率)
mixup:0.1 # 图像混淆(概率)
copy_paste:0.0 # 段复制粘贴(概率)

文件的前面为学习率和模型上的一些参数设置:

lr0: 0.01 # 初始学习率 (SGD=1E-2, Adam=1E-3)
lrf: 0.1 # 最终 OneCycleLR 学习率 (lr0 * lrf)
momentum: 0.937 # SGD 动量/亚当贝塔1
weight_decay:0.0005#优化器重量衰减5e-4
warmup_epochs: 3.0 # 预热纪元 (分数确定)
warmup_momentum: 0.8 # 预热初始动量
warmup_bias_lr: 0.1 # 预热初始偏差 lr

中间是一些损失权重的定义:

box: 0.05 # 箱体损耗增益
cls: 0.3 # cls 损失增益
cls_pw: 1.0 # cls BCELoss positive_weight
obj: 0.7 # obj 损耗增益(带像素的比例)
obj_pw: 1.0 # obj BCELoss positive_weight
iou_t:0.20 # IoU 训练阈值
anchor_t: 4.0 # 锚点多重阈值

最后面是一些数据增强的语句,如旋转,翻转等等,常用的就是修改后面的数据增强的数值,前面的基本不用修改。

# anchors:每个输出层 3 个锚点(0 个忽略)
fl_gamma:0.0 # 焦散伽玛(有效检测默认伽玛=1.5)
hsv_h: 0.015 # 图像 HSV 色调增强 (分数)
hsv_s: 0.7 # 图像 HSV-饱和度增强 (分数)
hsv_v: 0.4 # 图像 HSV-值增强(分数)
degrees: 0.0 # 图像旋转 (+/- 度)
translate:0.1 # 图像翻译(+/- 分数)
scale:0.9 # 图像比例(+/- 增益)
shear: 0.0 # 图像切变 (+/- 度)
perspective:0.0 # 图像透视(+/- 分数),范围 0-0.001
flipud: 0.0 # 图像上下翻转(概率)
fliplr: 0.5 # 图像左右翻转 (概率)
mosaic: 1.0 # 图像马赛克 (概率)
mixup:0.1 # 图像混淆(概率)
copy_paste:0.0 # 段复制粘贴(概率)

后面是概率的这种设置的数值在0-1之间,表示启用这个增强方式的概率。在有的时候可能会遇到需要修改旋转角度的问题,即degrees这个参数,这个的设置范围在0-180之内,0表示不启用,180表示随机旋转,0-180之间的则表示旋转多少度,应该是安装顺时针旋转那样来旋转角度的。

你可能感兴趣的:(python,深度学习,数据挖掘,人工智能,目标检测)