yolo物体检测系列实战1:yolo-v1整体思想与网络架构

1、物体检测经典方法

  • two-stage(两阶段):Faster-rcnn Mask-Rcnn系列
  • one-stage(单阶段):YOLO系列
yolo物体检测系列实战1:yolo-v1整体思想与网络架构_第1张图片 yolo物体检测系列实战1:yolo-v1整体思想与网络架构_第2张图片
  • 最核心的优势:速度非常快,适合做实时检测任务!
  • 但是缺点也是有的,效果通常情况下不会太好!

2、机器学习分类任务评价指标

机器学习 分类任务 评价指标

3、yolo-v1简介

  • 经典的物体检测算法
  • You Only Look Once,名字就已经说明了一切
  • 把检测问题转化为回归问题,一个CNN就搞定了
  • 可以对视频进行检测,应用领域非常广

只需要一个起始位置坐标,加上长和宽,就能把一个物体框出来了,这就是转化为回归问题
yolo物体检测系列实战1:yolo-v1整体思想与网络架构_第3张图片

yolo算法,在当时15、16年等了很久,因为Faster R-CNN精度高,但是太慢了,速度在当时比精度更重要

4、yolov1预测流程

yolo物体检测系列实战1:yolo-v1整体思想与网络架构_第4张图片

  1. 把图像分词S*S个格子
  2. 遍历每个格子,如果哪一个物体的中心点落在了这个格子,那么这个格子就负责预测这个物体
  3. 得到了若干个格子,遍历每一个格子
  4. 根据当前的格子都生成两个候选框,找出一个接近的框
  5. 现在有了一个这个物体的位置,需要调整框的长宽来得到最终结果
  6. 在调整的过程中会得到很多个候选框,每个候选框都会得到一个confidence值(即置信度,这个置信度表示了当前框住的部分是否是一个我们需要检测的物体)
  7. 置信度低的框会被过滤掉(因为目标格子可能会有多个,但是不一定都符合)

总结:
首先输入就是一个S*S个格子,每一个格子都产生两个候选框,产生两个候选框进行微调,但是不是所有候选框都进行微调,需要切实有物体的,什么时候有物体,通过执行度来判断

5、整体网络架构

yolo物体检测系列实战1:yolo-v1整体思想与网络架构_第5张图片
输入图像是一个448*448,是一个固定值,这个固定值是通过openCVresize到固定值得,里面的物体会进行缩放,最后的框会映射到一个完整的原始图像中

你可能感兴趣的:(yolo物体检测系列,cnn,深度学习,YOLO,物体检测,计算机视觉)