项目三:基于内容的图像检索

一、图像检索

图像检索两个框架:基于文本基于内容

1.基于文本

 常规的图像检索框架,图像由文本注释,然后通过文本在图像数据库中检索。

  • 缺点:
    人工注释需要相当大的人力开销
    由于人类的主观性会导致文本的注释不准确

  • 为克服基于文本检索框架的缺点,在20世纪80年代引入了基于内容的图像检索。

2.基于内容

 基于内容的图像检索(CBIR)系统,使得用户能够在系统中找到与查询图像类似的图像。
 图像内容:例如颜色,纹理,形状等

二、项目介绍

 本项目是采用keras深度学习框架,在MNIST数据集上实现基本的图像检索功能。

基于内容的图像检索的框架:

基于内容的图像检索.png
1.图像特征提取

 基于内容的图像检索的关键是特征提取。

  • 手工特征提取:
    颜色直方图定义颜色
    方向梯度直方图限定形状

  • CNN特征提取:
    使用为分类而训练的CNN来提取图像特征,如VGG16、ResNet等。
    但这种方法仍然需要标记数据来训练神经网络,打标签的工作成本非常高。

  • 去噪自动编码器提取
    无监督的深度学习方法

2.去噪自动编码器

 去噪自动编码器是用于图像去噪的神经网络,它可以学习到图像上的重要特征,即提取图像的本质。

  • 去噪自动编码器结构
去噪自动编码器.png

你可能感兴趣的:(项目三:基于内容的图像检索)