CV的四大任务

引言

学习的过程总是磕磕绊绊的,最近准备去学一下目标检测,还没开始去学,一个问题就在我的脑海中产生了,那就是图像识别和目标检测有什么区别,我怎么总感觉他们好像是一个东西?带着这个疑问,我去百度了一波,现在总算把这个问题搞定了

CV四大任务

图像识别和目标检测都是计算机视觉(CV)领域的一个分支,当然CV不只有图像识别和目标检测这两个任务,它还包括其他两个方面的任务。下面我就以一张图片为例,简单解释一下CV四大任务

1、分类(解决"what")

识别这个图片整体所属的类别,解决的是"what"问题,给这个图片打上相应的标签,在这里标签就是演唱会,其他类型的图片也都有它们自己的标签,然后把这些打上标签的图片带进去训练,那么这个过程就是图像分类

2、定位(解决"where")

识别图片中各个物体所在的位置,解决的是“where”问题,比如说在这张图片中,我们要识别出主唱和乐器的位置在哪里,那么这就是定位

3、检测(解决"what"和"where")

当一张图片中有很多我们感兴趣的目标物体,我们不仅想要知道这些物体所属的类别,还想知道他们所在的具体位置,比如这张图片有3个人,有架子鼓,有吉他等等,我们不仅要检测出这些物体所在的位置,还要检测处在这个位置的物体所属的类别,这就是目标检测。

4、分割(实例分割和语义分割)

图像是由一个个像素点构成的,分割研究的是图像中每一个像素点具体所属的实例或类别

最后附上一张在网上看到的图片,这个图片很形象的展示了CV的四大任务

CV的四大任务_第1张图片

你可能感兴趣的:(深度学习)