yolov3详解

目录

1.anchor的计算机制

2.anchor对应机制

3.网络结构

4.训练过程

5.测试过程 


1.anchor的计算机制

yolov3详解_第1张图片

yolov3详解_第2张图片

yolov3详解_第3张图片

  • 锚框anchor是真值框和预测框之间的桥梁:预测框在锚框基础上,预测出框的大小,锚框和实际框通过IoU进行关联
  • 网络直接预测的是特征图中当前单元格相对于锚框的偏置tx,ty,tw,th,然后通过下面关系式计算得到bx,by,bw,bh(真值标签也是bx,by,bw,bh四个值,从而计算loss)

yolov3详解_第4张图片

 上式中:

  • (b_{x},b_{y},b_{w},b_{h})即为预测的边界框bounding box在feature map中的中心点坐标和长宽;
  • (t_{x},t_{y},t_{w},t_{h})即为网络学习的相对于先验框(prior,anchor)的offsets;
  •  (c_{x},c_{y})是各个单元格的左上点坐标(即先验框中心点的参考点为单元格的左上顶点);p_{h},p_{w} 即为先验框(prior,anchor)相对于特征图尺度的长和宽

若我们需要得到预测框相对于原图的坐标实际值,则只需要将(b_{x},b_{y},b_{w},b_{h})乘以该特征图的降采样倍数,如8,16,32等。

anchor的调整可视化

以13x13特征图大小为例,如下图所示,各个点为单元格的顶点,左图是以黑色顶点为中心的三个anchor,右图是三个anchor调整后的结果,即三个预测框,红点为三个预测框的中心点。

yolov3详解_第5张图片

2.anchor对应机制

  • 一个单元格有3个锚框,在计算Loss时并不是三个锚框对应的预测框都与真值框进行比较,而是只采用1个预测框进行计算diff,即:采用与真值框之间IOU最大的锚框所对应的预测框进行计算,忽略另外2个预测框

yolov3详解_第6张图片

3.网络结构

yolov3详解_第7张图片

yolov3详解_第8张图片

  • ResUnit与Resnet18类似,依次为1x1卷积3x3卷积,然后相加add
  • ResX中第一个CBL为stride=2的卷积,进行降采样操作

4.训练过程

yolov3详解_第9张图片

5.测试过程 

yolov3详解_第10张图片

参考:目标检测YOLO系列

江大白:YOLOV3(下)

睿智的目标检测26—Pytorch搭建yolo3目标检测平台

你可能感兴趣的:(计算机视觉,深度学习,深度学习,人工智能,机器学习)