机器视觉能力

给机器装上“眼镜”,就是传统意义上将的机器视觉,而机器视觉有离不开目标物体的检测和识别。今天简单记录一下这方面的个人理解。
一、目标检测概念

目标检测的实质是多目标的定位,即要在图片中定位多个目标物体。例如下图,既要定位各个目标,还需要将不同目标用不同颜色的框表示。


image.png

目标检测解决的是从背景中找出我们关心的物体的问题(既框出),祛除了背景中不相关的信息。

  1. 首先,采取平滑去噪、调整对比度与尺寸空间的方式将图片进行预处理,使其可以被检测到并适合局部应用。
  2. 然后,将每块文字、图像分检出来交给识别模块识别。
  3. 再次,将图像分割成若干个特定、具有独特性质的区域,进而寻找出感兴趣的目标。

目标检测技术关键在于动态复杂场景中背景模型的建立、保持与更新。当背景发生动态变化或被遮挡时,检测难度会大大增加。

二、目标检测和识别的区别

1、目标检测和识别的区别在于:

1)目标识别:图像中描述的是哪个物体?

输出:图像中目标的位置和标签(名称)。

例如:对于一幅图像中的物体,在确定其类别的基础上,进一步确定这个目标是谁(比如:小明,短脚猫等)

2)目标检测:该目标在图像中什么位置?

输出:图像中有没有目标。

例如:对于一幅图像,确定图像中目标的位置、大小以及类别(是哪一类:比如人,猫等)

2、目标检测的最佳模型

  • Yolo
  • Faster RCNN

总而言之,当前人脸等视觉应用已经非常普及,我们能够看到AI在视觉辅助方面,能够帮我们更容易地享受生活。

你可能感兴趣的:(机器视觉能力)