毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割

目录

前言

课题背景和意义

实现技术思路

一、理论基础与相关技术

二、图像预处理与局部图像策略

三、基于 U-net 网络的血管分割方法

实现效果图样例

最后


前言


    大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。

对毕设有任何疑问都可以问学长哦!

选题指导: https://blog.csdn.net/qq_37340229/article/details/128243277

大家好,这里是海浪学长毕设专题,本次分享的课题是

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割

课题背景和意义

人工智能技术作为近年来发展迅速的一门新兴技术,在医疗、教育等关乎民生的领 域就得到了一系列应用。“AI+医疗”的发展模式将对我国的医疗资源匮乏与浪费等问 题提供新的解决思路。随着深度学习算法的发展,通过构建深度神经网络模型,从医疗 诊断数据中挖掘潜在规律,模拟人类医生进行疾病诊断的人工智能疾病诊断技术已经能 够达到空前的精度。人类健康水平与医疗科技的发展密不可分,智能医疗是提升我国医疗水平,解决医 疗资源浪费及合理配置医疗资源的重要途径,也是我国近年来大力发展的新兴技术。而 眼底视网膜血管网络作为目前唯一可以直接进行无创观测的人体血管网络,对于判断人 体的健康状况具有重要意义。眼底视网膜影像可以反应出许多眼部疾病及全身性疾病的 早期症状,这对于疾病的早期诊断具有重要意义。医学影像分割可以为疾病诊断提供一 定参考,在计算机辅助诊断中具有重要地位,也是近年来热门的研究方向之一。

实现技术思路

一、理论基础与相关技术

计算机视觉作为深度学习的一个重要应用领域取得了一系列突破,主要应用在图 像的分类、检测与分割。具体的发展体系历程如图所示,本文所涉及的视网膜血管 分割问题属于图像分割,能够按照图像中血管所在的具体位置将血管从背景中分割出 来。

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第1张图片

卷积神经网络

1、卷积层

卷积层由一系列卷积核(filter)与偏差值(bias)组成。所涉及到的超参数包括卷积 核个数 N,卷积核大小 F,卷积步长(stride)S,边缘填充(padding)P。卷积的具体过 程是每次将卷积核与输入矩阵的一部分对应相乘后相加得到输出矩阵对应位置的值,再 通过滑动窗口操作,将卷积核在输入矩阵上按照卷积步长设定的步幅滑动得到其他位置 对应的值,具体操作如图所示。

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第2张图片

 2、池化层

池化层在卷积神经网络中非常常见,池化层实际上是一种降采样过程,通过模拟生 物视觉对图像数据进行降维,使用更深层的特征去表达图像的较浅层特征。在卷积神经 网络中引入池化层主要有 3 个作用:减小参数数量、提升模型的尺度不变性与旋转不变性、防止过拟合。常见的卷积类型包括最大池化与平均池化,最大池化是对输入矩阵的 一块区域取最大值,平均池化则是取平均值,池化层不包含参数,因此不需要学习。池 化的具体操作如图所示。

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第3张图片

3、全连接层

如图所示的就是一个全连接神经网络,全连接层的特点是全连接层的每一个神 经元都与上一层的每一个神经元连接,即密集型连接。全连接层的实质是计算前一层所 有神经元特征的加权和,在卷积神经网络中可以起到分类器的作用。例如在许多分类任 务中,神经网络的最后两层或三层均为全连接层,作为分类器对提取到的特征进行最终分类。

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第4张图片

4、激活函数

绝大多数的计算机视觉问题都是非线性的,因此卷积神经 网络通过引入激活函数的概念为模型增加非线性建模能力。所有的激活函数都是非线性 函数,它们通常紧跟在卷积层与全连接层之后,使线性卷积层与全连接层获得了非线性 建模能力。常见的激活函数包括 ReLU、Sigmoid 与 Tanh。

5、损失函数

损失函数(lossfunction)又称代价函数(cost function),损失函数定义了模型预测 结果好坏的衡量方法。模型效果越好,则模型的预测结果与真实结果越接近,反之模型 效果越差,模型预测结果与真实值差距越大,而损失函数正是反映了模型预测结果与真 实结果的不一致程度,损失函数越小则模型越鲁棒。

6、神经网络的反向传播

反向传播算法是一种建立在梯度下降法的基础上,适用于深层神经网络的学习算法。 反向传播算法主要包含前向传播、误差计算与参数更新三个环节,三个环节不断循环迭 代,直到网络输出能够达到预期要求。

7、优化算法

神经网络参数训练的目的是使模型的预测结果越准确越好,也就是通过模型参数的 不断更新使损失函数的值越来越小。

8、归一化

 在神经网络梯度下降的学习过程中,归一化(Normalization)是一种常见技术。通 过归一化可以避免很多不必要的数值问题,并且可以加速神经网络的训练过程。归一化 包括两个步骤,第一步是零均值化,先计算所有数据的均值 μ,再减去均值得到零均值 化后的数据。归一化过程的具体表达式如式所示。

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第5张图片

 如图左图所示,在二维情况下,未经归一化的损失函数在 各个参数维度上的变化不均匀,损失函数等高线图呈椭圆形,在这种椭圆形损失函数情 况下,梯度下降的过程较为复杂,训练耗时较长。而如图右图所示的是经过归一化 后的损失函数形状,明显可以看出在经过输入的归一化后损失函数变得更加接近圆形, 这代表损失函数在各个维度上的变化更加均匀,梯度下降的过程相对于为归一化时更容 易寻找到最优解,同时减少了迭代次数,加速了神经网络的训练。

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第6张图片

图像语义分割与全卷积网络

图像的语义分割,从字面意思上理解,就是通过计算机编程使得程序能够根据图像 中的语义信息来对图像进行分割。所谓语义信息,是从语音识别领域引用至计算机视觉 领域,本来意思是一段语音序列所表达的意思。在图像分割领域,语义是指图像所包含 的内容及对图像内容的理解,如图:

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第7张图片

 全卷积化(Fully Convolutional) 如图所示是一个用于识别猫的卷积神经网络的全卷积化过程示意图,通过去 掉卷积神经网络最后的三个全连接层,改为使用卷积层来解决逐像素(pixel-wise)的预 测问题。这样保留了二维图像的相对空间位置信息,实现了任意大小的图像输入,且输 出的大小与输入的大小保持一致。

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第8张图片

 注意力机制

注意力机制(Attention Mechanism)顾名思义,就是一种模仿人类注意力系统的模 型。它的实质是模型关注点的改变,从全局关注转化为局部重点关注。注意力机制原理图

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第9张图片

 二、图像预处理与局部图像策略

图像预处理

1、灰度转换

所使用的眼底视网膜血管图像是通过彩色眼底摄影法获得,原图为 RGB 三通 道彩色图像。RGB 三通道图像信息量巨大,理论上相对于单通道灰度图像在计算量上增加了 2 倍,大大降低了神经网络的运行速度。文预处理的第一步是图像灰度转换,将彩色图 像转换为灰度图像,处理效果如图 所示:

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第10张图片

2、标准化

图像预处理的第二步是灰度图像的标准化。神经网络的本质是通过大量的训练样本 使模型对数据分布进行充分拟合,若在训练过程中训练集数据与测试集数据有较大出入 会导致神经网络的泛化能力比较差。标准化的表达式如式所示:

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第11张图片

3、限制对比度自适应直方图均衡

在经过灰度转换与图像标准化后,存在因对比度过低而导致的图像显示效果不清晰 问题。为了解决这个问题,图像预处理的第三步采用直方图均衡化的方法提高图像对比 度,进而使得图像显示更加清晰,同时对于神经网络来说可以增强细小血管的局部细节, 提升预测效果。

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第12张图片

4、Gamma 值校正

Gamma 值校正是一种针对图像灰度值的非线性操作,具体的表达式如式所 示,输入灰度值与输出灰度值之间呈指数关系,指数值即为 Gamma。

神经网络的局部图像训练策略

在神经网络的训练过程中,数据增广是一种常见的扩充数据样本量的方法。神经网 络需要大量的数据支持,数据量过小会导致模型严重过拟合,进而使得模型的泛化能力 下降。常见的数据增广方法包括旋转,镜像,高斯噪声,椒盐噪声及剪裁等方法,如图所示。

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第13张图片

三、基于 U-net 网络的血管分割方法

当模型训练至收敛后模型训练阶段完成,可以使用模型进行性能测试,在模型的测 试阶段,算法流程图如图所示。

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第14张图片

 U-net 是一种编码器-解码器(Encoder-Decoder)结构的全卷积网络。U-net 包含输入 层、隐藏层与输出层三个部分,其中隐藏层的前半部分为降采样部分,隐藏层的后半部 分为升采样部分。降采样部分作为编码器,升采样部分作为解码器,通过编码器-解码器 结构将使输出的特征图大小与输入图片尺寸大小一致,实现图像的语义分割。U-net 网 络结构如图所示。

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第15张图片

 如图所示,医学影像边界相对比较模糊,梯度比较复杂,较多的浅层高分辨率 信息有利于目标的精准分割。同时由于人体内部构造相对固定,所需要分割的目标在医 学影像中的分布有一定规律性,对于这些语义信息比较简单的部分可以利用深层低分辨 率信息对其进行目标的识别。

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第16张图片

U-net 网络结构

在本方法中,采用局部图像策略后神经网络的实际输入尺寸为 48×48,U-net 网络 深度过大会导致过拟合,因此本方法 U-net 网络采用两次降采样结构,结构图如图所示。

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第17张图片

实现效果图样例

视网膜血管医学影像分割:

毕业设计-基于机器视觉的视网膜血管医学影像分割-语义分割_第18张图片

我是海浪学长,创作不易,欢迎点赞、关注、收藏、留言。

毕设帮助,疑难解答,欢迎打扰!

 

最后

你可能感兴趣的:(毕设选题教程,机器视觉毕业设计,图像识别毕业设计,课程设计,计算机视觉,算法,深度学习,卷积神经网络)