目标检测:YOLOV4

CVPR2020年发表,并不是原来YOLO系列的作者

相对于YOLOV3有比较大的提升,但相对于YOLOV3-SPP提升比较少。

一、相对于YOLOV3的网络结构改进:

目标检测:YOLOV4_第1张图片

1、引入CSP结构:DARKNET53->CSPDARKNET53

作者认为CSP的作用:

1)增强CNN网络的学习能力;

2)移除计算的瓶颈;

3)降低内存开销。

CSP模块如下图:

目标检测:YOLOV4_第2张图片

目标检测:YOLOV4_第3张图片

2、引入SPP结构:解决多尺度问题,这个与YOLOV3-SPP的一样

目标检测:YOLOV4_第4张图片

3、引入PAN结构:

目标检测:YOLOV4_第5张图片

原始特征的PANET特征融合是element-wise相加,而YOLOV4这里是concat操作。

目标检测:YOLOV4_第6张图片

4、CSPDARKNET53的总体网络结构

目标检测:YOLOV4_第7张图片

一、相对于YOLOV3优化策略的改进:

目标检测:YOLOV4_第8张图片

1、消除GRID网格敏感程度:

目标检测:YOLOV4_第9张图片

当目标中心点恰好在GRID上时,σ(tx) 或σ(tx)为0或1,tx或ty要为±∞,这种极端的数值网络通常没法达到。作者的方法是乘上一个缩放因子,通常缩放因子取值2,如下图:

目标检测:YOLOV4_第10张图片

则此时偏移已经被扩到-0.5~1.5之间,如果要实现在0~1之间,tx和ty只要在下图的虚线之间即可达到。

目标检测:YOLOV4_第11张图片

2、Mosaic数据增强:同YOLOV3-SPP,多张图片拼接,送入网络训练的过程

目标检测:YOLOV4_第12张图片

3、正样本IOU阈值:

目标检测:YOLOV4_第13张图片

之前的YOLOV3正样本做法是:每个GT和所有的anchor template去比对。用GT和anchor template的左上角重合,然后去计算它的IOU。之后通过设置阈值比如IOU>0.3的,都置为正样本。图中只有第二个满足条件。接下来再将GT映射到GRID网格中(或着说预测特征层上),GT的中心点再哪个grid cell中,那么这个grid cell的anchor template 2就是正样本。如果GT与多个anchor template的IOU都大于阈值,那么在当前指定grid cell中对应的多个anchor template都视为正样本。这样会扩充样本的数量。实践发现,这样效果会好一些。

YOLOV4中,如下图中三个grid cell对应的AT2都视为正样本。因为有了消除GRID网格敏感程度操作,当前样本的中心点都在上方和左方grid cell的-0.5~1.5之间。这样能进一步增加正样本数量。

目标检测:YOLOV4_第14张图片

更多的五种情况:

目标检测:YOLOV4_第15张图片

4、anchor模板优化

针对512*512尺寸,重新优化了一下,是否有更好的不知。

目标检测:YOLOV4_第16张图片

5、采用CIOU

与YOLOV3-SPP中的相同。

你可能感兴趣的:(人工智能,目标检测,计算机视觉)