Yolov5_DOTA_OBB源码学习

yolov5旋转框的版本地址:https://github.com/hukaixuan19970627/YOLOv5_DOTA_OBB

一、配置文件
B站学习地址:https://www.bilibili.com/video/BV1Pq4y1S7Q4?p=73

在项目的model文件夹下有各个版本的yolov5的yaml配置文件,从s-m-l-x网络依次变大,下面是yolov5m.yaml的代码内容。
运行:项目读取配置文件后解析文件配置模型每一层的内容
特点:v5配置文件比v3版本的配置文件更简洁,可读性强,易于修改(只需要修改小部分能起到v3修改大部分的效果)

# parameters
nc: 16  # number of classes
depth_multiple: 0.67  # model depth multiple
width_multiple: 0.75  # layer channel multiple

# anchors coco:24,9, 37,12, 52,15 64,23, 81,19, 98,29 137,27, 199,41, 342,65
anchors:
  - [10,5, 21,10, 38,16]  # P3/8
  - [65,23, 75,53, 167,33]  # P4/16
  - [178,93, 493,80, 486,271]  # P5/32

# YOLOv5 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Focus, [64, 3]],  # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, BottleneckCSP, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 9, BottleneckCSP, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, BottleneckCSP, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 1, SPP, [1024, [5, 9, 13]]],
   [-1, 3, BottleneckCSP, [1024, False]],  # 9
  ]

# YOLOv5 head
head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],  # cat backbone P4
   [-1, 3, BottleneckCSP, [512, False]],  # 13

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],  # cat backbone P3
   [-1, 3, BottleneckCSP, [256, False]],  # 17 (P3/8-small)

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14], 1, Concat, [1]],  # cat head P43
   [-1, 3, BottleneckCSP, [512, False]],  # 20 (P4/16-medium)

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],  # cat head P5
   [-1, 3, BottleneckCSP, [1024, False]],  # 23 (P5/32-large)

   [[17, 20, 23], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5)
  ]

其中,较为重要的参数是:

nc
depth_multiple
width_multiple

nc:number of class 根据检测的需要确定类别的个数

depth_multiple 模型深度参数。
在一个block有多个模块,每一个模块需要重复多次, [-1, 9, BottleneckCSP, [512]这个
BottleneckCSP模块需要重复(9×depth_multiple = 9*0.67)次
当number为1不做乘积操作,只对非1的模块进行乘积操作。

width_multiple 模型通道参数
[-1, 1, Focus, [64, 3],这个Focus模块能得到64×width_multiple = 64*0.75 = 48个特征图。

anchor 不同规格的候选框,可修改

backbone 特征提取模块
head 预测输出

[from, number, module, args]
from:当前层的输入,-1表示上一层的输入
number:模块重复个数
module:模块名
args:通道和卷积和的个数。

你可能感兴趣的:(目标检测,深度学习)