总体设计方案:
本文将采取基于特征的方法对图像进行聚类与检索。基于特征对图像进行聚类与检索的基本方法是在建立图像库时 , 对输入的图像先进行图像分析 , 提取图像或目标的特征向量并根据特征向量及匹配算法等将图像进行聚类。在进行图像检索时 , 对每一幅给定的查询图 , 进行图像分析并提取该图的特征向量。通过将该图特征向量与特征库中的特征向量进行匹配并根据匹配结果到图像库中搜索就可提取出所需要的检索图像来。
由上述工作原理可以知道基于特征的图像聚类与检索有四个关键 , 一是要从图像中抽取分类和检索的特征 , 二是确定建立在相应特征基础上的图像相似性度量 , 三是要利用聚类算法对图像库中的图像进行聚类,四是要利用匹配算法在图像库中检索相应的图像。
1 .从图像中抽取分类和检索的特征
我们知道,一幅图像是以矩阵的形式存储在计算机中的,具体地讲,矩阵上某一点的值代表了图像在该点的颜色信息,正是许多这样的点的组合、排列呈现在我们的眼中才使得缤纷五彩的世界得以在计算机的屏幕上显示出来。然而对于图像聚类和图像检索来说,将全部这些点作为数据进行分析处理是没有必要也是不切实际的。例如在汽车车型识别中,图像中的道路和行人以及其他建筑物都属于无用信息,对于识别车型来说没有任何意义,应该将其去除,否则在识别时会产生不利影响。
所谓特征是从模式中得到的对分类有用的度量或属性,应该能够反映不同类别之间的本质差别。正如我们每个人具有高、矮、胖、瘦各不相同的特征一样,不同的图像之间也存在着互相得以区分的特征。在图像聚类与检索中,这些特征一般表示为一组数字,这些数字构成一个矢量,称为特征矢量。抓住关键特征,忽略其它信息是一种通用的、有效的方法。颜色和纹理是图像的两个最重要的特征,本文将对颜色和纹理的聚类与检索进行探讨。
l 颜色
在图像的自动分析检索中,颜色是一种能够简化目标提取和分类的一种重要描述符,最早在基于内容的图像检索中得到应用。颜色特征定义比较明确,抽取也相对容易,所以在图像处理中得到广泛的重视和应用,并已提出了很多成熟的算法。对颜色特征的表达方式有很多种,如直方图法,累积直方图法,局部累加直方图法,颜色布局法,中心矩法等。由于颜色的信息量比较大,所以各种方法的共同的一点就是要用较有效和紧凑的办法来表达颜色信息。
l 纹理
纹理是另一个用于描述图像的常用的概念。纹理通常被看作图像的某种局部特性,或是对局部区域中图像间关系的一种度量。另外,纹理信息也可以用来对图像中的空间信息进行一定程度的定量描述。基于纹理的图像检索也有很多成果。
2. 确定建立在相应特征基础上的图像相似性度量
获取了图像的特征为我们接下来的工作奠定了良好的基础,我们的目标是图像的聚类和检索,从根本上说就是将特征相近的图像找出来。这里的“特征相近”只是一个直观上的概念,何谓“相近”,不同的情况下有着不同的解释。因此,我们很有必要定义一个具体的数学描述符定量的体现两幅图片间“相近”的程度,这就是相似性度量。显然,我们的目标就是找到相似度最小的图像。
3.利用聚类算法对图像库中的图像进行聚类
人类的分类识别能力不是与生俱来的,而是后天经过不断的实践和学习而逐渐具有的功能,例如对语言的学习,对文字的学习。
在图像检索的过程中我们同样面临着分类的任务,具体地讲就是图像的聚类。所谓图像聚类就是将未知类别的一组图像分成若干类的过程,也称无监督学习或无教师学习。聚类分析的思路比较直观,根据各个待分类图像特征的相似程度来进行分类,将在特征空间中聚集在一起的样本点划分为一类。选择合适的聚类算法对图像库中的图像进行聚类,是我们的核心任务之一。
4.利用匹配算法在图像库中检索相应的图像
匹配可理解为结合不同的、已经存在的表达而建立他们的解释之间的联系的技术与过程。从广义上讲,匹配是要研究如何把知识模型与从图像获得的描述信息对应起来,从而达到识别目标,理解图像,认知世界的过程。而具体到基于内容的图像信息检索,就是要将从查询要求通过分析而得到的描述与需要检索的图像数据库中个体的描述进行比较,以便提取出视觉效果或语义内容最为接近/相似的个体。
通俗地讲,我们就是要根据用户需要检索的图像的特征,到图像库中与现存的图像特征进行比较,根据一定的算法,找出相似度最小的一个或一组图像,完成一个匹配过程,将用户最希望得到的图像信息检索出来。
小结:
通过从图像中抽取分类和检索的特征 , 确定建立在相应特征基础上的图像相似性度量 , 利用聚类算法对图像库中的图像进行聚类,利用匹配算法在图像库中检索相应的图像这四个步骤,我们基本提出了一个可行的图像聚类与检索的方案,接下来探讨一些具体的关键技术与实验。