计算机视觉——目标检测、实例分割(语义分割)、人体关键点检测

计算机视觉————目标检测、实例分割

  • 1、目标检测
  • 2、实例分割
  • 3、人体关键点检测

1、目标检测

计算机视觉——目标检测、实例分割(语义分割)、人体关键点检测_第1张图片

一张图片中有多个类别目标,要求不仅仅是对图像目标进行分类,还要准确的标记出目标的位置信息,以提取目标。比如车牌检测,不仅要确定有车牌,还要车牌的准确位置,才能对车牌的文本信息做提取。还有人脸识别,要先确定脸的位置,再对脸做识别。
重要应用场景:质检、自动驾驶车道检测

2、实例分割

计算机视觉——目标检测、实例分割(语义分割)、人体关键点检测_第2张图片

实例分割要得到的目标不再是一个位置框,他要得到的目标是像素级别的,要准确的描绘出目标的轮廓。
也就是说每个像素点我们都要预测它的类别,比如上面的图片,我们要把所有像素点预测成四类:猫,狗,鸭子,背景。然后才能得到轮廓。进行分割。
重要应用场景:自动驾驶、机器人、机械手臂抓取物品(工业分拣)
要检测出摄像头捕捉到的具体的位置,你有目标检测那样的位置不行。要更精准。

3、人体关键点检测

虽然叫人体关键点检测,但是绝对不仅限于人体,他所做的做种目的就是提高分类任务的准确性,以及模型的鲁棒性。看图:对具体的行为进行分类。
计算机视觉——目标检测、实例分割(语义分割)、人体关键点检测_第3张图片
对这张图具体的行为进行分类,如果有一张与其及其相似的躺着休息的图片进行分类,就很慢判断正确,但是关键但检测,检测的是局部的点位置信息,会提高准确性。
同时,可以对图像进行旋转,旋转后也不回有影响。就提高了模型的鲁棒性

还有一个重要的应用场景:以图搜图
先检测出图片类别的关键点,在对具体的位置进行对比,就对应了上边讲的,图片翻转也没有问题。


上面所提到的三种任务,加上图像分类任务,就是计算机视觉的四大基本任务。

你可能感兴趣的:(计算机视觉,计算机视觉,人工智能)