Yolo v2、v3理论详解

yolo v2:yolo 9000,检测目标种类超过9000

Yolo v2、v3理论详解_第1张图片

Yolo v2、v3理论详解_第2张图片

 1.Batch Normalization

在每个卷积层后都添加了BN层,不再使用dropout

2.高分辨率分类器

从224*224——>448*448,更大的输入尺寸

3.使用anchor box

4.anchor聚类,K-means算法

5.目标边界框预测的改进,每个anchor只负责预测网格区域内的目标

6.更底层的信息,低层特征与高层特征融合

7.多尺度训练方法:416*416  480*480 每迭代10轮,就随机选择一个尺寸

BackBone:DarkNet-19  (19个卷积层)

YOLOv3:An Incremental Improvement(一种递增的提高)

Yolo v2、v3理论详解_第3张图片

yolo v3模型

 在三个预测特征层上进行预测的

每个预测特征层会使用三种尺度

 这个1是confidence score

在预测特征层1上预测大目标 在3上预测小目标

yolov3 目标边界框的预测

Yolo v2、v3理论详解_第4张图片

 正样本选取:只选与bounding box重合度最大的

不是最大的,但是超过阈值的,就丢弃

 yolov3 spp

Mosaic图像增强

之前的图像增强方法:随机裁剪 随机水平翻转 色度饱和度

 

 在yolo v3第一个预测特征层之前插入了spp结构

你可能感兴趣的:(人工智能)