yoloV5(一)目标检测概述

目录

    • 机器视觉要解决哪些问题?
      • 机器视觉主要解决的问题有图像分类问题、目标检测问题、图像分割问题。
    • 目标检测发展
      • 冷兵器时代的智慧和深度学习力量下的一种技术美学
      • 目标检测分为两类:单阶段和两阶段。

机器视觉要解决哪些问题?

yoloV5(一)目标检测概述_第1张图片

机器视觉主要解决的问题有图像分类问题、目标检测问题、图像分割问题。

        图像分类:识别出图像中的物体的类型。例如上图中第一个图,输入图片识别出图片中的物体为猫,而不需要确定猫的位置,则此任务为一个图像分类问题。输入图像输出类别

        目标检测:若图像中只有单一物体,我们不但要预测图像中物体的类型,还需要将物体的位置找出来,属于分类和定位,也是目标检测的特殊一种类。若图像中含有多个物体,每一个物体使用矩形框框出来,并且识别出框中的类别,叫做目标检测。输入图像输出多个类别和多个矩形框框

        图像分割:更细粒度获取像素级别的分类。图像分割分为两类,语义分割:把每一个像素类别输出,并不区分不同物体的像素;实例分割:区分统一类别不同物体的像素。

目标检测发展

冷兵器时代的智慧和深度学习力量下的一种技术美学

        2012年之前的早期的目标检测算法大多是基于手工特征构建的。由于当时缺乏有效的各种计算加速技术资源和有效的图像表示,只能设计复杂的特征表示,精度和速度有很大的局限性。

        2012年之后卷积神经网络出现,卷积神经网络通过一些策略,降低了模型的复杂度,让模型训练成为了可能。卷积神经网络采用原始图像作为输入, 可以有效的从大量样本中学习到相应地特征, 避免了复杂的特征提取过程。目标检测开始以前所未有的速度发展。

yoloV5(一)目标检测概述_第2张图片

目标检测分为两类:单阶段和两阶段。

        两阶段:先从图像中提取若干候选框,再逐一对这些候选框进行分类和甄别,调整坐标最后得出结果。

        单阶段:不提取候选框,直接将图片作为输入,直接放入模型中,直接输出目标检测的结果。是统一的端到端的系统。

        单阶段和两阶段各有优缺点,单阶段比较快,但对于小目标、密集目标识别效果不好。两阶段比较准确,但是比较耗时,不能满足实时任务的需求。

        推荐一篇目标检测综述: Object detection in 20 years: A survey. 虽然是2019年的,但是对于了解目标检测很有帮助。

你可能感兴趣的:(目标检测,计算机视觉,图像处理,机器学习)