图像检索概述

一、概述
图像检索,简单的来说就是,用一个图片去和数据库中的图片一一匹配,然后检索出满足条件的图片,图像检索技术根据描述图像内容方法的不同主要分为两类:
1. 基于文本的图像检索技术,简称(TBIR)
2. 基于内容的图像检索技术,简称(CBIR)

1、基于文本的图像检索技术(TBIR)
就是利用文本描述图像的内容等方式来检索图片,最开始的话都是人工标注图片,再应用于检索,但是这种方式劳民伤财,效果也不是特别好的。

2、基于内容的图像检索技术(CBIR)
(1)主要是利用图片的颜色、纹理、图片包含的物体、类别来检索图片。
(2)包括相同物体的图像检索和相同类别图像检索。

3、图像检索技术的步骤
主要包下面几个步骤:输入图片、特征提取、度量学习、重排序
(1)输入图片:
这里不多说了,但是有一点要注意,那就是要求的图片类型,图片尺寸大小,有时候可能需要对输入图片进行修改。
(2)特征提取:
也就是对图片数据进行降维,提取数据的判别性信息,一般就是将一张图片降维为一个向量。
(3)度量学习:
一般利用度量函数,计算图片特征之间的距离,作为loss,训练特征提取网络,使得相似图片提取的特征相似,不同类的图片提取的特征差异性较大。
(4)重排序:
利用数据间的流形关系,对度量结果进行重新排序,从而得到更好的检索结果。
其实再简单点也可以把图像检索大致看成两步:特征提取、计算相似度

4、深度学习与图像检索
基于深度学习的图像检索技术,主要是将深度学习方法应用在图像检索中的特征提取模块,利用卷积神经网络提取图片特征。主要步骤即给定一张图片,通过卷积神经网络对图片进行特征提取得到表征图片的特征,利用度量学习方法如欧式距离对图片特征进行计算距离,对图片距离进行排序,得到初级检索结果,再根据图片数据的上下文信息和流形结构对图像检索结果进行重排序,从而提高图像检索准确率,得到最终的检索结果。

个人研究方向:
我主要想研究的是基于内容的图像检索,现在比较热门的就是用深度学习提取图像特征,关于相似度计算,主要有:**欧式距离、汉明距离、Triplet等方法。**在现有的深度学习图像检索模型中,主要是利用卷积层提取相关特征,全连接层或者池化层负责分类,则这里可以看出,一般都是提取前几层卷积层的输出,然后再计算相似度。
如果有感兴趣的小伙伴,可以一起学习!

你可能感兴趣的:(图像检索)