毕业设计-基于深度学习的图像检索

目录

前言

课题背景和意义

实现技术思路

一、基于深度学习的图像检索研究主题

二、基于深度学习的图像检索算法

三、基于深度学习的图像检索模型

实现效果图样例

最后


前言


    大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。

对毕设有任何疑问都可以问学长哦!

选题指导: https://blog.csdn.net/qq_37340229/article/details/128243277

大家好,这里是海浪学长毕设专题,本次分享的课题是

基于深度学习的图像检索研究

课题背景和意义

深度学习是机器学习中一种对数据进行表征学习的方法,是机器学习的子集,相对于浅层学习具有更多的非线性操作的层级数,旨在利用多个变换阶段分层,组合低层特征形成更加抽象的高层表示,由此将图像像素级信息逐层提取为抽象的语义概念,加速图像内容理解。基于内容的图像检索系统利用深度学习,通过底层识别图像边缘,多层网络识别特定形状,最终得到层次化的特征表示,从而使图像分类、识别和检索的性能显著提升。由于这种深层体系结构自动地从数据的多层抽象中学习特征,尤其是作为计算机视觉领域最成功的一种深度学习模型—卷积神经网络(CNN)提取的特征表示具有一定的通用性,因此基于卷积神经网络的图像分类、图像表示等已广泛应用在语音识别、自然语言处理等诸多领域。特别地,基于深度学习的图像检索在物体识别、医学图像、遥感图像等领域获得了更大关注,深度学习算法在图像检索领域中逐步成为新兴分支。

实现技术思路

人工智能、神经网络及计算机视觉与模式识别等相关技 术带动且引领基于深度学习的图像检索的发展,因此对基于深度学习的图像检索相关文献进行梳理和统计。可以发现, 国内和国外对该领域的研究几乎同时起步,与论文变化趋势均呈上升态势。

毕业设计-基于深度学习的图像检索_第1张图片

一、基于深度学习的图像检索研究主题

基于深度学习的图像特征表示
最早指出基于内容的图像检索(CBIR ) 性能受到图像表示数据库的约束,最常用的视觉内容特征颜 色、纹理、形状不能满足实际应用需求。为了使特征表达更为准确 。 使用从OverFeat网络中提取的图像特征作为通用的图像表示,处理图像分类、细粒度识别等各种任务,确定卷积神经网络在深度学习中的重要地位。 最新提出利用深度网络学习高级视觉特征表示,利用合成图片训练神经网络。

OverFeat的这种设计,在测试过程中,也用这种全卷积适应不同尺度的图像输入。在OverFeat分类器中(即后三层卷积),统一使用5*5的卷积核实现操作

毕业设计-基于深度学习的图像检索_第2张图片

 这些整合冲破了传统图像表示的约束,而且缩小了图像的概念表示与高级语义感知之间的距离,有效的改善用户体验。

基于深度学习的图像分类 
图像分类是 CBIR 预处理至关重要的一部分,传统方法是特征描述及检测。 利用高度优化的卷积神经网络模型,大幅度提高了图像分类精准度。为了达到更好的准确性, ConvNet 架构的参数进行修正,添加卷积层深度,并使用较小的卷积 滤波器,不仅在图像分类和识别任务上具有准确性,而且还 适用于其它的图像识别数据集。
CNN 由许多神经网络层组成。卷积和池化这两种不同类型的层通常是交替的。网络中每个滤波器的深度从左到右增加。最后通常由一个或多个全连接的层组成:
毕业设计-基于深度学习的图像检索_第3张图片

基于深度学习的图像识别

图像识别除了给定类的信息外,还需识别判断图像中的实例位置、形状等。 深度卷积神经网络在图像识别领域已取得巨大成功,但目前为止面临的两大挑战仍然是类内多样性和类间相似性。解决了深度神经网络中产生的退化问题, 后提 ResNet 为后续分 类网络及图像识别奠定了基础。

毕业设计-基于深度学习的图像检索_第4张图片

对象识别是图像识别的重要内容之一,对象识别的数量会根据图像的不同而发生变化,例如人脸识别 、视觉搜索引擎等。

基于深度学习的图像标注
基于深度学习的图像标注是图像检索的核心技术,其本质是利用图像集自动学习语义概念空间和视觉特征空间的映射模型。

二、基于深度学习的图像检索算法

深度学习优化算法
深度学习算法, 发展到现在主要分为四种,分别是卷积神经网络,受限玻尔兹曼机器,自动编码和稀疏编码。 其中卷积神经网络对图像检索领域做出了巨大贡献,其权值共享结构大幅减少了参数量,防止过拟合的同时又降低模型的复杂度。虽然卷积 神经网络在语义层面的全局特征表达方面性能优异,但忽 略了局部区域的细节表达,影响检索准确性。因此对其优 化研究集中在卷积层、池化层和全连接层。卷积算法示例:

毕业设计-基于深度学习的图像检索_第5张图片

深度哈希算法

利用深度哈希算法研究多层语义问题,通过CNN得到紧凑哈希码,以此确保语义的敏感性 。使用深度哈希算法前主要通过手工 方式提取特征,无法保证语义的相关性,而深度哈希算法则 利用卷积层获取图像特征 从全连接层得到哈希编码 ,并针 对目标函数求导迭代。

毕业设计-基于深度学习的图像检索_第6张图片

 深度哈希算法的发展进一步增强了哈希算法在图像检索的优势,有效提高图像检索的精准度和效率。

三、基于深度学习的图像检索模型

基于内容的图像检索模型
图像检索按照描述图像内容方式的不同,可以分为基于文本和基于内容的图像检索。基于文本的图像检索采用文本标注方式形成图像内容的关键词,但大规模的图像数据采用这种方式会耗费大量资源。基于内容的图像检索分析图像内容找到相似的图像。
基于深度学习的图像检索模型
在大数据时代,基于内容的图像检索与深度学习算法相结合逐渐成为主流。AlexNet 模型 使用非线性激活函数,提升特征的丰富性。VGG 模型通过加深网络结构提升性能,其不足是必须有足够的数据才能更好地刻画出模型在空间上的分布。
1)AlexNet模型

使用ReLU作为CNN的激活函数,并验证其效果在较深的网络超过了Sigmoid,解决了Sigmoid在网络较深时的梯度弥散问题。虽然ReLU激活函数在很久之前就被提出了,但是直到AlexNet的出现才将其发扬光大。训练时使用Dropout随机忽略一部分神经元,以避免模型过拟合。Dropout虽有单独的论文论述,但是AlexNet将其实用化,通过实践证实了它的效果。在AlexNet中主要是最后几个全连接层使用了Dropout。

毕业设计-基于深度学习的图像检索_第7张图片

2) VGG 模型

VGG-16的网络结构,3层全连接层。VGG网络的设计严格使用3 × 3 3\times 33×3的卷积层和池化层来提取特征,并在网络的最后面使用三层全连接层,将最后一层全连接层的输出作为分类的预测。 由于卷积核比较小,可以堆叠更多的卷积层,加深网络的深度,这对于图像分类任务来说是有利的。VGG模型的成功证明了增加网络的深度,可以更好的学习图像中的特征模式。

毕业设计-基于深度学习的图像检索_第8张图片

基于深度学习的哈希图像检索模型

哈希算法(散列算法或者消息摘要算法)是信息存储和查询所用的一项基本技术,它是一种基于Hash函数的文件构造方法,可实现对记录的快速随机存取。它把给定的任意长关键宇映射为一个固定长度的哈希值,一般用于鉴权、认证、加密、索引等。其主要优点是运算简单,预处理时间较短,内存消耗低,匹配查找速度比较快,便于维护和刷新,支持兀配规则数多等。

毕业设计-基于深度学习的图像检索_第9张图片

哈希算法具有计算效率高、搜索速度快等优点,深度学习架构具有有效的图像表示特征,因此构建基于深度学习的哈希图像检索模型可以实现更好的性能。

实现效果图样例

基于深度学习的图像检索应用实践
1)医学图像检索
医学图像中的病变和器官太复杂 ,无法通过简单的方程或模型准确地表示,因此机器学习在医学成像领域的作用逐渐增大。医学图像检索胸部 X 光片:

毕业设计-基于深度学习的图像检索_第10张图片

2)智能系统图像检索

计算机视觉领域是人工智能发展的战略要点,而图像检索是计算机视觉领域的关键研究问题。 例如手机淘宝、美团 App 的智能推荐, 以图搜图等功能。

毕业设计-基于深度学习的图像检索_第11张图片

我是海浪学长,创作不易,欢迎点赞、关注、收藏、留言。

毕设帮助,疑难解答,欢迎打扰!

最后

你可能感兴趣的:(深度学习,特征提取,机器学习毕业设计,课程设计)