今天大概了解了一下图像搜索原理。
目前,在多媒体网络中,有两类图像搜索引擎技术正在研究和应用之中。
①采用传统的基于关键字的图像检索技术;
②采用基于内容的图像检索技术。
(以下论文转自《基于WWW的图像搜索引擎》)
使用传统的基于关键字的搜索引擎进行图像搜索,其原理与搜索普通信息一样,差别只是搜索的关键词不同,或者分类类别不同而已,包含图片、图像、照片。传统的图像专用搜索引擎工作原理也是如此,其通用工作过程大致分为三步,首先派出搜索机器人Robots 对网上站点内的图片及页面信息进行自动搜索,并将文档页面与图片信息返回搜索引擎数据库。然后对搜索引擎返回的信息进行加工,抽取关键词、图像低层特征或者进行加工分类,进行数据库内图像信息的索引。最后通过Web 页面访问接受用户的查询请求,按照相关性给出用户的需求数据。传统图像搜索引擎大致有四个部分构成: 搜索机器人、搜索控制器、图像搜索引擎数据库和用户查询服务界面。搜索机器人Robots 是通过HTTP 协议的Get 、Post 、Head 读取页面并自动分析页面的超链,在WWW 上自动进行漫游的程序。它在网际漫游,具有识别分析文档中图像的功能,并对图像进行分类。搜索控制器是整个搜索引擎的核心,协调各个Robots
的工作,自动分析得到的网页,并将分析后的图像数据添加到图像搜索引擎数据库。图像搜索引擎数据库用于存放采集到的网页、抽取的描述信息,以及用于Robots 搜索状态记录的临时数据,包括网页的全部内容,或者图像的地址、标题、关键词、摘要等。用户查询服务界面用来接受用户的查询请求,并将检索结果图像按相关度返回给用户。通常包括关键词主题检索和分类目录检索方法
基于内容的图像搜索引擎工作原理
基于内容的图像搜索引擎,是建立在基于内容的图像检索技术之上的图像搜索工具,可以为在Web 上浏览过的图像建立索引信息,能够进行图像分析和判别,为图像加注释,存储抽取出的索引信息并建立索引库。基于内容的图像检索技术,可谓目前最流行的检索技术之一。它在特征匹配时,几乎不需要用户的参与,而主要利用图像自身的特征(如颜色、纹理、形状等) 来完成,具有较强的客观性和直观性。利用这一特点,可以用来抽取各类图像库中所有图像文件的特征。在检索过程中,用户一般只需提供一个示例图像,系统首先抽取该示例图像的特征,然后根据图像特征的相似性匹配算法,与图像库中相应的特征进行比较,最后将与示例特征相似的图像返回给用户,以达到一个完整的图像检索过程。
图像搜索引擎的框架:
用图像搜索引擎搜billgates和google的效果:
在俺看来,基于内容的图像搜索的关键问题在于:
1、特征构造
2、相似度度量
3、检索速度
图像搜索会朝社么方向发展呢?咱可以思量一下:
1、更复杂的特征以及具针对性的特征
目前采用的特征都是通用型的(比如颜色,纹理,形状,角点等);通用型的特征都会比较简单,不会考虑各个不同物体间的特性;针对具体的对象将会出现分类细致的特征描述;
2、针对具体领域的图像搜索
就跟通用搜索与垂直搜索样;图像搜索领域也会出现垂直的图像搜索;
3、抽象的文字/图像结合搜索
可以说成是与文字搜索相结合,也可以说成是与高层语义相结合。核心都是,用户以文字或图像描述特征,系统推测用户的意图,根据这个推测的意图来进行搜索。
4、自学习功能
根据用户的反馈来提升搜索的准确性。