计算机视觉初步认识

计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就像人类和许多其他类生物每天所做的那样。

从计算机视觉领域可以衍生出大量有用的应用程序。下面是计算机视觉应用程序的一些用途:

游戏和控制:在游戏领域使用立体视觉的一个有影响力的商业产品是微软的Kinect。

图像检索:谷歌图像利用基于内容的查询来搜索相关的图像。它们的算法分析查询图像中的内容,然后根据最匹配的内容返回结果。

生物特征识别:虹膜、指纹和人脸匹配是利用计算机视觉技术进行生物特征识别的常用方法。监视:监控摄像头在许多公共场所,主要用于检测任何可疑行为。

人脸识别: Snapchat和Facebook等应用程序利用人脸检测算法来应用滤镜并识别照片中的人物。

智能汽车:视觉是这些汽车检测交通信号,灯光和其他视觉参数等多种元素的主要信息来源。

计算机视觉领域可以分为对象检测、图像分类、语义分割、对象追踪、影像重建、实例分割几个研究方向。

对象检测

使用计算机视觉技术对图像中的存在的对象进行分辨,划分并标记对象的边界框,对对象进行分类和统计可以大大减少手动统计所花费的时间,提高工作效率。

图像分类

是对图像中的物体进行准确的分类,来确定图像内各种物体的区别进行准确的分类,但是因为现实情况的复杂性有许多的困难。现在研究人员通过一些图像的特征对图像进行区分,但不能进行进行广泛的分辨。

语义分割

使将图像分解维一个个像素段,去分析每一个像素段在图像中的含义,然后对图像进行标记和分类,真的将图像与图像进行分割,确定物体之间的边界。

对象追踪

就是对一些动态运动的物体进行跟踪,在自动驾驶汽车中有较为广泛的运用

影响重建

就是对一些有破损或老旧的照片进行修复。

实例分割

就是对不同的实例进行分类,比如用不同的颜色去标记不同的汽车,对重叠物体进行分离、分类、识别。

你可能感兴趣的:(计算机视觉,人工智能)