计算机自动提取和储存图像特征,浅述计算机视觉中的图像特征及提取方法

姜文泽

04f83538d2d03cc7a29b70ef18f15133.png

摘要:计算机视觉是人工智能领域中的一个重要分支,更是人工智能的基础。人工智能领域中的信息多种多样,其中图片信息即视觉信息比其他信息如触觉、听觉信息要重要得多。该文将简要概述计算机视觉领域中图像操作所要进行的第一步——图像特征提取时的图像特征以及提取过程中所用到的方法。

关键词:计算机视觉;图像特征;特征提取方法

中图分类号:TP3        文献标识码:A

文章编号:1009-3044(2019)16-0185-02

开放科学(资源服务)标识码(OSID):

1  提取方法

1.1  直方图

直方图(Histogram)作为一个统计手段,具有一定的统计作用,同时其不仅可以表示一般数据的分布,也可以对图像的数据或特征进行统计,生成图像特征分布的直方图,譬如灰度、颜色、梯度(边缘)、形状、纹理、局部特征点等。

直方图本质上是对图像的原始特征或数据进行降维,通过对其特征进行处理、对其数据分布进行建模,使数据具有一定的总结性,同时可以有效节省存储空间、简化运算量,更易于查看和分析,为进一步图像处理或分析做准备。

1.2  聚类

聚类(Clustering)是一种可以取代直方图的特征提取方法,该方法可以通过基于数据的无监督训练得到更稳定的值。其目标是找到混合样本集中存在的内在的群组关系,即对对象集合分割分块或分组为不同的子集或类,使得类内关联性高,类间关联性差。

常用的聚类方法有K-means聚类、均值漂移聚类、基于密度的聚类(DBSCAN)、基于高斯混合模型的最大期望聚类(EM)、凝聚层次聚类和图团体检测等方法。

2  图像特征

2.1  颜色特征

颜色特征是图像特征中的一种全局特征,它直观地描述了图像中物体的表面性质。但颜色对图像区域的方向、大小等变化不敏感,故颜色特征不能很好表述图像中的局部特征。

颜色特征主要的提取方法有量化颜色直方图和聚类颜色直方图,两种方法的适用颜色空间不同,前者适用于RGB和HSV等均匀颜色空间,后者适用于Lab等非均匀空间。

量化颜色直方图的操作简单,计算高效,但存在量化问题,如果颜色相对单调还容易产生分布稀疏的问题。

对于Lab等非均匀空间,使用K-means聚类算法对所有像素点的颜色向量进行聚类,直方图的区间单元由聚类中心代表。

2.2  几何特征

常见的几何特征有边缘(Edge)、角点(Corner)以及斑点(Blob)。

边缘是指梯度、亮度、颜色交界处以及面与面相交、线与线相交等像素有明显变化的区域,即图像中某一特性在某一方向上分布的不连续处。对于复杂图片,可以先将彩色图像转化为灰度图像,再对其某一方向的灰度值函数求一阶导数,得到的一阶导数的高于某个阈值的极值区域即边缘区域。该阈值也是一个超参数,若阈值设置过低,边缘提取不精确,导致得到的边缘区域信息量过大,进而可能会导致计算量过大;若阈值设置过高,提取到的边缘区域过少,则会导致信息质量较低。边缘提取时一阶导数对噪声极为敏感,故应先进行高斯去噪,再使用一阶导数获取极值。

角点是一种显著点,即在某方面属性特别突出的点。在本文中,角点区域被定义为在任何方向上移动某个框形区域(小观察窗),导致大的像素变动的区域,可以简单表示为以下数学模型:

对计算得到的角点响应值[E(u,v)]进行阈值化得到局部最大点。Harris角点响应值相对于边缘提取是更高一层的特征值,它不受光照、平移、旋转这些尺度的影响。

斑点(Blob)可以理解为圆斑,通常可以利用拉普拉斯梯度求极值来计算斑点。同样的,斑点对噪声极其敏感,需要先做高斯去噪再进行进一步计算。先进行高斯滤波再进行拉普拉斯滤波相当于直接对其进行二阶高斯导数(LoG)滤波。公式表示为:

公式左侧为先进行高斯滤波,再进行拉普拉斯滤波;公式右侧为二阶高斯导数滤波。

2.3  纹理特征

纹理特征作为一种全局性的特征,具有可以反映物体表面的特性。纹理特征与角点类似,具有旋转不变性;但又区别于角点,具有良好的抗噪性能,同时有可能会受到光照或反射的影响。纹理特征的常用提取方法有方向梯度直方图(HOG)、局部二值模式(LBP)和Gabor滤波器组。

基于局部方格单元的方向梯度直方图通常适用于图像中的人体检测,图像中的几何和光学的变化不会影响图像提取的结果。该方法的优点是简单高效且不需要做高斯模糊。

局部二值模式一般应用于人脸特征的分析。它所计算出的二进制模型简单直观。只需将图像中每个像素点与周围的像素点进行比较阈值化即可得到LBP编码。

以某个像素点为中心,画出半径为r的圆,在圆周上均匀采样p个点,与中心像素点进行比较,将数值大小量化为0或1,当小于中心像素点时量化为0,反之量化为1,将得到的多位bit按照顺(逆)时针组成一个数,该数即中心像素点的LBP编码,同时该数值可以作为直方图的一个bin,遍历操作所有像素点,每有一个相同的bin,该区间上的数值增加1,最终可以得到一个描述图像纹理特征的直方圖。如图2-9所示,以中心像素点为圆心,绘制了一个半径为2的圆,均匀采样8个点,通过比较具体数值可以量化为图2-10,从中心像素点正上方的像素点按照顺时针进行编码,得到二进制编码00001101,即为其中心像素点的8bits的LBP编码。

Gabor滤波器组在二维空间中本质上是高斯核函数和正弦平面波的乘积,因此其具有高斯核的特性。与人类的视觉系统类似,可以用多个滤波器捕捉多尺度多方向多频率的信息。

3  总结

计算机视觉作为人工智能的基础,特征提取更是当中的一个重要概念,即将图像中具有不同特征的像素点划分为不同的子集,使每个子集都具有不同的特性。随着时代的发展和提取方法的改进与优化,提取到的图像特征也越发精细准确,为图像处理的后续操作提供了更多的可能性。

参考文献:

[1] 张锡英,车鑫.图像颜色特征提取及其分类研究[J].安徽农业科学,2014,42(07):2196-2198.

[2] 李姗姗.彩色图像边缘检测相关算法研究[D].西北大学,2018.

【通联编辑:代影】

你可能感兴趣的:(计算机自动提取和储存图像特征)