【目标检测】------yolov1-yolov5改进总结

YOLO系列总结

1. yolov1

【目标检测】------yolov1-yolov5改进总结_第1张图片
yolov1框架讲解
1.将image划分为77个网格,每个网格预测2个bbox的位置(X、y、W、h)、置信度( confidence为交并比)、 类别概率;
2.输出维度为7
7*(25+20 );
3.测试时,将条件类概率和预测框的置信度乘起来,表示每个box包含某类物体的置信度,这个分数可以将box中的类别可能性和预测精确度同时表示出来
4.基本网络模型为GoogLe Net ,但未使用它的inception模块,而是交替使用1
1和33卷积层
5.预训练分类网络,输入图像大小为224
224
6.目标检测网络,输入图像大小为448*448
7.损失函数(平方和损失函数)包括4部分:框中心位置x,y损失+框宽高w,h损失+置信度confidence分类损失

YOLO V1优点
<1>速度快
<2>对图像有全局理解。用整个图像的特征去预测bbox
<3>候选框的数量少很多,仅772=98个
<4>每个网格只预测2个bbox ,限制了模型预测物体的数量

YOLO V1缺点
<1>每个网格只预测2个bbox ,限制了模型预测物体的数量
<2>多次下采样,边界框预测使用的特征是相对粗糙的特征

2. yolov2

你可能感兴趣的:(目标检测,目标检测,计算机视觉,深度学习)