文章地址:https://www.journals.elsevier.com/information-processing-and-management
DOI: https://doi.org/10.1016/j.ipm.2020.102411
期刊ISSN:0306-4573(二区)
影响因子(IF):4.041
发布时间:2020年10月19日
肺炎是一种导致儿童高死亡率的全球性疾病。由于新型冠状病毒COVID-19的爆发,目前已有983,907人死亡。随着感染的进展,感染病毒的人会出现发烧、咳嗽和肺炎等症状。及时发现是公众达成的共识,有助于可能的治疗,从而遏制COVID-19的传播。x线作为一种的成像技术,已被广泛应用于COVID-19等病毒引起的肺炎的检测。为了方便肺炎的诊断过程,本文开发了一个深度学习框架,用于二元分类任务,根据作者提出的CGNet将胸部x线图像分为正常和肺炎。
在本文的CGNet中,主要包括三个部分:特征提取、基于图的特征重构和分类。首先使用迁移学习技术训练最先进的卷积神经网络(CNNs)进行二值分类,同时使用训练过的CNNs为两个组件生成特征。然后,通过部署基于图的特征重构,作者通过图来组合特征去重构特征。最后,用一种名为GNet的浅层神经网络(一种单层图神经网络)将x线胸片图像分为正常胸片和肺炎胸片。模型在包括5,856张胸片的公共肺炎数据集上获得了最佳的精度为0.9872,灵敏度为1,特异性为0.9795。为了评估提出的方法对COVID-19肺炎的检测性能,作者还在一个公共COVID-19 CT数据集上测试了提出的方法,在精确度为0.99,特异性为1和灵敏度为0.98的情况下,作者获得了最高的性能。
肺炎是一种由病毒和细菌引起的常见但严重的肺部疾病。虽然在大多数情况下可以治疗,但及时发现仍然是诊断和治疗的关键。新冠肺炎疫情发生以来,病毒核酸技术和影像学技术被广泛应用于新冠肺炎的快速诊断。有报道称VNATs的灵敏度较高,但与基于图像的检测方法相比,假阳性率相对较高。正如作者在Fang等人指出的,在51例数据集上,采用实时聚合酶链反应(RT-PCR)的VNAT的敏感性为71%,而胸部计算机断层扫描(CT)显示的敏感性为98%。
胸部x光成像也被广泛用于检测由新冠肺炎引起的肺炎,与迷走神经刺激术相比,胸部x光成像更准确和方便,这使得胸部x光成为最流行的诊断肺炎的技术。
还有,与CT相比,X线更受欢迎,因为它成本低,成像方便。然而,由于复杂性和人为因素,数字化图像的人工判读是一项耗时的任务,对放射科医师来说仍然是一项具有挑战性的工作。因此,能够帮助放射科医生理解图像的自动系统要求很高,并且将极大地有助于减缓新冠肺炎的传播。
深度学习是机器学习的一个快速发展的分支,在图像分类和检测方面显示出巨大的潜力。与严重依赖手工制作特征的经典最大似然方法相比,最典型的最大似然方法模型——深度卷积神经网络在大量基于图像的任务(如检测、分类和分割)上取得了引人注目的成功。
通常在数百万幅图像上训练的DL模型比传统的ML模型学习更抽象的特征,传统的ML模型侧重于学习更简单但不太具代表性的特征。因此,相对于传统的最大似然模型,最大似然模型在准确性、灵活性方面表现出了巨大的优势。在某些领域,DL模型的表现甚至超过了该领域的专家。鉴于上述优势,数字图书馆技术已经被嵌入到许多计算机辅助设计系统中。对于DL系统,如何有效地将有用的信息嵌入到系统中决定了系统的最终性能。关于信息嵌入有大量的研究工作。
本研究提出了一种新的基于特征重构方法的数据链模型CGNet框架。基于所提出的框架,开发了一个新的高性能肺炎检测系统。在提出的CGNet框架中,有三个模块,包括特征提取和基于图的特征重构和分类。
对于特征提取,作者用了最先进的网络,并用肺炎数据集进行了训练。高级特征是进一步分类的粗略特征,然后可以通过训练的网络获得。
基于提取的特征,作者提出在单个图像之间集成图形表示,以提高后续分类器的精度,分类器具有与人工神经网络(ANN)相同的结构,但性能大大优于ANN。
与传统的单独分析图像的ANN不同,作者提出的神经网络可以利用图像之间的潜在关系来提高分类性能,从而同时分析多幅图像。
GNet的体系结构被设计得很浅,以避免过拟合问题和整个系统不必要的过度复杂。每幅图像的特征被视为图中的一个节点,而节点之间的边被分配给与该节点距离最短的前k个邻居。
为了验证根据新提出的框架设计的模型,作者在公共x光肺炎数据集和公共计算机断层图像新冠肺炎数据集上评估了模型的性能。如实验中所示,开发的系统在具有5000多幅图像的公共肺炎数据集上显示出比较好的结果,而开发的系统在公共新冠肺炎数据集上达到0.99的精确度。像肺炎引起的其他细菌和病毒会引起炎症和气囊,或肺泡在肺部,新冠肺炎引起的肺炎显示类似的症状。因此,我们相信所开发的系统可有助于将来诊断由新冠肺炎和其他原因引起的肺炎。
特征重构已被证明能有效提高前向深度神经网络的性能。当考虑特征重建问题时,目标特征矩阵
可以用下面共同来表示:
主成分分析(PCA)是一种广泛应用的特征降维和重构技术。
给定一组特征Fi(i是Nis组中特征的数量),则平均特征可以表示为:
协方差矩阵C由下式给出
在计算特征值和特征向量之后,特征Fi可以通过选择对应于第一最大k个特征值的第一k个特征向量来重构。
DL在不同领域得到了快速发展和广泛应用,尤其是在过去几年。此外,许多用于图像分析的计算机辅助设计系统已经使用了数字线技术,因为数字线具有优异的性能。因此,将特征重构与数字图像处理技术相结合,探索性能更好的图像分析系统是一种很有启发性的方法。自新冠肺炎疫情爆发以来,计算机科学界的专家一直在努力开发用于检测新冠肺炎肺炎的计算机辅助设计系统,这有助于检测新冠肺炎。
在这些作品中,迁移学习因其优点而被广泛使用。通常,从头开始训练一个深度CNN需要很长时间,而训练后的CNN的表现可能远远不能令人满意。因此,迁移学习,一种为新任务重用现有分辨率的技术,可以更有效地用于建立CNN模型。在迁移学习中,基本网络是在不同数据集上训练的网络,通常在图像网上。基础网络的体系结构被相应地调整以满足特定的图像分析任务。然后可以通过感兴趣的数据集来训练调整后的网络。
==此外,基本网络可以用作特征提取器,为分类器提供提取的特征。鉴于转移学习的优势,转移学习已被用于肺炎的检测。==例如,提出了一个名为切斯特网的深度转移学习模型,用于检测包括肺炎在内的多种胸腔疾病。
作者使用ResNet架构作为主干,在x光图像上实现了每类0.7810的曲线下平均面积。该模型在CAFFE框架(link)下实现,同时在高性能配置上进行训练。
作者认为,深度学习对于提取图形特征用于新冠肺炎诊断具有重要意义,因为所提出的模型在外部数据集上显示出73.1%的总体准确性。
利用计算机辅助设计系统检测肺炎的一个常见问题是缺乏大规模的公共数据集。虽然许多工作报告了高性能,但测试数据集中的图像数量太少,无法形成令人信服的结果。此外,许多工作只是将最先进的CNNs转移到分类任务,而没有进一步探索结构优化,而报告的性能严重依赖于预定的参数和硬件。为了解决上述问题,作者提出了基于大规模公共x光数据集的肺炎检测CGNet框架。对公共新冠肺炎引起的肺炎CT数据集的评估也支持所提出的方法。在提出的框架中,我们首先将最先进的神经网络用于特征提取,而不是直接分类。提取的特征的图形表示是基于特征的相似性构建的,相似性是通过特征之间的欧氏距离来度量的。然后将每个特征作为图中的一个节点,当根据欧几里得距离发现节点是邻居时,节点之间的边被连接。组合的特征由我们的神经网络用于分类,神经网络是一个简单的图形神经网络。在公共胸部x光图像数据集上的实验表明,在CGNet框架下实现的系统在灵敏度极高的同时,超过了大多数先进的方法。
在一般的分类任务中,传统的最大似然方法首先提取数据特征,然后由分类器进行分类。在作者提出的CGNet框架中,主要有三个独立的部分,分别对应于特征提取、特征重构和最终分类。然而,与严重依赖手工特征的传统最大似然方法不同,作者的框架通过在第一步转移最先进的CNNs来提取高级抽象特征。然后根据特征的欧几里得距离深入研究图形表示。最后,用嵌入图形表示特征训练分类器。CGnet框架下提出的模型的数据流程图如图1所示。
在图1中,左侧显示了获取训练过的CNNs的步骤。迁移的CNNs和训练过的CNNs中显示的深绿色层是取代CNNs原始顶层的新顶层。橙色和蓝色的箭头表示训练集和测试集。当在CGNet框架下实现本文的肺炎检测模型时,作者选择在测试集上表现最好的CNNs作为特征提取器。GNet以结合图形表示的特征作为输入,最终将图像分为正常和肺炎。作者将对每个组件进行如下详细说明。
与传统的利用手动设计的算法来执行特定任务的最大似然方法不同,作者使用基于深度学习的算法,这些算法在泛化能力上具有更高的优势。特征提取在分类任务中起着关键作用,它直接决定了后续分类器的整体性能。首先,作者通过部署迁移学习技术来实现特征提取。在特征提取阶段,通过用新的层替换顶层,最先进的网络首先被迁移到二进制分类任务。用训练集训练后,可以提供初步结果和特征的CNNs。一般来说,CNNs是在图网络(ImageNet)上进行训练,给出1000个类别的分类结果。CNNs的总体结构如图2所示。在迁移了最先进的网络后,我们选择了在测试集上给出最佳结果的CNN作为跟踪GNet的特征提取器。
为了迁移在图网络(ImageNet)上预先训练的CNNs,我们首先移除CNNs的顶层,然后添加新的层,包括一个dropout层、一个具有256个通道的过渡全连接层和用于分类的最后两个通道全连接层。加入dropout层是为了防止训练过程中的过拟合问题。如果特征的尺寸迅速缩小,特征的信息将遭受重大损失。因此,在dropout层的顶部放置一个过渡的全连接层,以防止严重的信息丢失。
图3显示了迁移的CNNs的详细结构,其中FC256和FC2分别代表两个完全连接的层,具有256和2个通道。最终汇集层和Softmax层之间的连接被最终汇集层和新添加的脱离层之间的连接所取代。在用有限数量的时期的肺炎数据集训练迁移的网络之后,CNNs内的参数被微调为给出数据集的更好表示的期望参数。
图三:迁移CNNs的架构。FC256和FC2分别代表具有256和2个通道的全连接层。
算法1给出了基于特征的获取方法,算法1包括网络传输和特征提取两种状态,并对提取的特征进行了分析,以实现底层图形的表示。
作者使用从特征中提取的图形信息来重建特征。这样做的原因是,当由相邻特征重建时,个体特征将被增强。这里的特征是指经过训练的CNNs提取的特征。为了构建特征图,从每幅图像中提取的每个特征被作为图的节点。为了提高计算效率,特征被分成多个批次。
给定特征F,其中,D表示数据集中的要素数量,M表示要素的维数。假设批次大小为N,那么批次数量n可以表示为:
那么F可以改写为:
具体来说,fj是前一个组件提取的特征。
对于每一个Fi,可以建立一个相应的图Gi,它通过成对的变量(Vi,Ei)来表示节点之间的潜在关系。Vi代表由批中每个特征fj组成的节点,而Ei是节点之间的边。作者认为当找到k个最小欧氏距离时,每个节点与其最近的k个邻居之间存在边。Ei以邻接矩阵Ai的形式表示。
给定一个节点fj和它的邻居fj+1,Ai的位置(j,j+1)处的值被设置为正数,表示两个节点是相关的。因此,建立Gi的关键是计算邻接矩阵Ai 。图生成的过程可以在算法2中看到。
当为每一批特征Fi构建图形Gi时,首先计算每一个特征与该批中其余特征之间的距离。通过这样做,可以得到距离矩阵Distance,在按升序对获得的距离的每一行进行排序之后,对应的索引矩阵Index,用于记录可产生分拣之前批次Fi中最近k个特征的索引。对于Ai的每一行,当该位置的邻居被发现是最近的k个邻居之一时,该行中一个位置的值被设置为1。
人工智能采集的伪代码可以在算法3中找到:
在初始化阶段,四个变量被初始化为:
具体而言,Distance根据以下公式计算:
在计算出Ai之后,批量Fi中的每个特征fj根据下式重建:
它是归一化邻接矩阵Ai。
因此,重构的特征批次可以表示为:
考虑归一化Ai时,首先计算一个度矩阵D
也就是说:
然后,通过以下方式对Ai进行规范化:
I是单位矩阵,在
之后然后重建特征批次用于分类。
对于肺炎检测任务,重建的特征批次被输入到所开发的系统中的所提出的全球导航卫星系统。
当实现肺炎检测系统时,作者将他们的分类器命名为神经网络,因为所提出的神经网络是单层图神经网络,其中输入是图中的节点和图的图表示。在更一般的情况下,传统的分类器包括人工神经网络和SVM支持向量机可以用于基于提取的特征进行分类。
GNet的特征重构过程和体系结构如图4所示。在特征重构中,特征是指由训练好的神经网络提取的特征。在本研究的场景中,与传统ANN具有相同结构的神经网络在输入上不同于传统ANN,传统ANN通常使用提取的特征,而无需后处理。作者不引入更多隐藏层的主要原因是,额外的隐藏层将引入甚至更多的参数,这也可能触发过拟合问题。此外,作者通过重建获得了最具代表性的特征,因此只引入了一个隐藏层。输入通道数为256。
其中θ是动量率。
则可以根据链式法则计算。
通过迭代去更新
然后作者有一个训练好的神经网络来完成我们的二元分类任务。
此后,输入每个批次特征用于分类。通过汇总所有批次的所有预测类别,作者将收到测试集中数据的分类结果。作者提出的框架的伪代码可以在算法4中找到。
1、ImageNet上加载预先训练好的CNNs
2、删除顶层并为分类任务添加新的顶层;
3、在训练数据集上训练修改后的神经网络;
4、通过一个输出大小为1000的全连通层从训练好的神经网络中获取特征;
5、将特征分成相同大小的批次;
6、在每一批特征中建立图形;
7、根据图形信息重构特征;
8、用重构特征训练神经网络;
9、通过在测试集上重复步骤4至步骤7来获取测试集的特征;
10、用重构的测试特征测试训练好的神经网络。
为了测量所提出的模型的性能,作者像许多其他工作一样,使用包括灵敏度、特异性、准确性、精确度和F1分数的通用度量来测量我们所提出的分类器的性能。为了计算度量,引入了真阳性、真阴性、假阳性和假阴性。
TP和TN越高,能够检测出真实肺炎图像和正常图像的分类器性能越好;FP和FN越低,将正常图像误分类为肺炎图像的分类器的错误越少,反之亦然。灵敏度与TP的关系如下:
特异性意味着分类器对正常图像的识别能力,可以用TN和FP表示为:
分类器的整体性能通过精确度来衡量:
精确度测量所有预测肺炎图像中真实肺炎图像的百分比:
F1表示分类器的分类能力:
在这一节中,将简要介绍本研究中使用的数据集的细节,然后是实验设置,给出了实验配置的细节。在进入第4.4节中的批量N和邻居数k的探索之前,已给出了转移网络的性能。第4.5节和第4.6节分别给出了特征重建的有效性和特征重建方法的比较。通过将作者提出的方法与第4.7节中最先进的方法进行比较来结束这一节。
在本研究中,作者在来自两种不同模态的两个公共数据集上验证了他们提出的特征重建方法。作者使用了一个已经确诊为由细菌引起的肺炎的队列,我们将其命名为数据集1。在(2020年胸部x光图像(肺炎))公开发布的数据集1中,共有5856张正常和肺炎x光图像。为了给不同的系统提供一个公平的比较平台,训练集、验证集和测试集都是预先划分好的。图5中可以看到正常和肺炎样本的例子:
表1显示了数据集1的详细信息:
我们还在另一个基于公共CT的肺炎数据集上检验了我们提出的方法,其中肺炎是由引起的,我们将该数据集命名为数据集2。一些样本图像如图6所示。三通道RGB图像的大小从720 ×541 ×3到725 ×551 ×3不等。
与通过x光仪器获得的图像相比,CT肺图像在图像分辨率和细节细节方面显示出更多的优势。表2显示了数据集2的详细组成:
本研究的配置是一台16 G RAM,GPU GTX1050的个人笔记本电脑。因为作者必须按顺序训练转移网络和后面的神经网络和神经网络,所以有两组不同的参数。采用Mathworks提供的深度学习工具箱作为框架。对于迁移网络,他们接受20个时期的培训,而初始学习率为104。批处理大小为8,以防止因内存问题导致系统崩溃。作者使用随机动量梯度下降作为优化方法。此外,每5个迭代将学习率减半,以确保趋同。当用训练集训练传输的网络时,训练集中的图像在每个时期都是无序的。详细设置见表3,在两个数据集上的网络训练过程中保持不变。
当构造用于重建的图时,应该仔细选择每一批的大小N和每一批内的邻居k的数量,以确保可以实现GNet的最佳性能。当用从转移网络中提取的特征训练神经网络时,作者将训练时期增加到40,而其他参数保持不变。如果没有其他规范,作者在整个实验中使用相同的参数。然后改变N和k来探索N、k和神经网络性能之间的关系。详情将在以下章节中介绍。
为了找出可以转移到分类任务中的性能最好的最先进的网络,作者训练了包括AlexNet 、GoogLeNet、Squeenet、VGG16 、ExceptionNet、ResNet18、ResNet101、InceOptionv3。所有这些网络都是在ImageNet上为1000个类别的分类任务预先培训的。为了在所有网络之间进行公平的比较,包括FC256和FC2在内的顶层被插入到Softmax层和dropout层之间。因此,原始的Softmax层和分类层被新的Softmax层和分类层取代。表4列出了引入的网络的可学习参数的数量。
在用数据集1训练之后,不同网络的结果被组织在表5中,而ROC曲线被显示在图7中。
奇怪的是,在数据集1上,XceptionNet 在所有传输的网络中表现最好,尽管它不是最深的也不是最新的。
XceptionNet表现最好的原因可能有两个。一个是XceptionNet的结构比较新颖。在XceptionNet中,除了深度可分卷积之外,还使用了快捷连接技术,该技术也在ResNet和DenseNet中得到应用,大大减少了网络中训练参数的数量。另一个可能的原因是输入的大小。请注意,XceptionNet的输入大小为299 ×299 ×3,而其他网络的输入大小不大于227 ×227 ×3。然而,图像的原始尺寸大于1000 ×1000 ×3。因此,XceptionNet经历了更少的信息丢失,这允许提取更多的代表性特征。有趣的是,网络的深度越深,网络的性能就越差,这也需要更长的训练时间。考虑到这一点,作者选择 XceptionNet作为在这个分类任务中的特征提取器,尽管性能仍然远远不能令人满意。
同样,作者在数据集2上改编并训练了相同的最先进的网络。验证集和测试集的结果分别如表6和表7所示。ROC曲线如图8所示。
在验证集和测试集上,DenseNet201在所有最先进的网络中表现最好。从表4可以看出,DenseNet201中可学习参数的数量不是最大的,但是DenseNet201的层数比网络的其他部分的层数多得多。因此,DenseNet201可以受益于层间的高密度连接,这允许学习更多的代表性特征。由于x光和计算机断层扫描的成像模式不同,在数据集1上表现最好的XceptionNet在数据集2上表现不佳。因此,在数据集2上实现GNet时,作者使用DenseNet201作为特征提取器。
对于数据集1,在通过XceptionNet提取特征后,作者根据生成的图重建特征。然而,特征的批量N和被考虑的相邻特征的数量k是与所提出的GNet的性能相关的两个参数。因此,作者探索了不同的N和k集合来优化GNet的性能。
在表8中,我们显示了当N为32,而k在4到28之间变化时的GNet结果。在图9中,显示了不同构型的GNet的ROC曲线。可以看出,所有的GNets都表现出了高于0.96的AUC,达到了0.99的高AUC。有趣的是,当k等于24时,GNet的性能似乎饱和于当k等于28时的GNet。
从表8中,可以得出这样的结论:随着所考虑的邻居的增加,全球导航卫星系统的性能也在增加。为了探索批量N对GNet性能的影响,我们考察了当N为64、96、128和156,而k保持变化时的性能。
从表9、表10、表11和表12中,分别显示了当N为64、96、128和156时,GNet的性能。相应的ROC曲线分别如图10-13所示。
在图14中给出了显示数据集1上的批量N和邻居k的数量之间的关系的图。从图14可以看出,当N较小时,精度随k增加。然而,当N相对较大时,尽管K增加,精度似乎是饱和的,然而,值得注意的是,准确性随着K比N的比率增加而增加。
按照类似的模式,我们选择在dataset2上表现出最佳性能的经过训练的网络(在本场景中是DenseNet201)作为特征提取器。
然后,我们改变k和N,以指定建议的GNet的最佳配置,其中N ∈[32,64,96],k从N的四分之一增加到接近N的数的4的整数倍。表13和表14分别显示了当N =32时,验证集和数据集2的测试集的GNet结果。ROC曲线如图15所示。
作者还评估了当N为64,而k在8到56之间以4的整数倍变化时,GNet的性能。关于数据集2的验证集和测试集的结果的细节可以在表15和16中看到,而ROC曲线显示在图16中。
由于数据集2上的验证集中的图像数量有限,因此数据集1上的最大N被选择为96,而不是128。当N =96时,验证集和测试集上的GNet的详细结果显示在表17和18中,而相应的ROC曲线显示在图17中。
可以看出,GNet在验证集和测试集上的最佳配置是截然不同的。当k和N不是最优时,GNet的性能波动。此外,由于图像数量有限,更多的N并不能保证高性能。然而,从图18中可以得出一个粗略的结论,即当k/N大于或接近0.8时,可以发现整体更高的性能。类似的结论可以在图14中找到。
为了评估所提出的方法在检测肺炎方面的性能,作者直接用数据集1训练XceptionNet ,并将训练后的XceptionNet 用作特征提取器与作者的神经网络结构相同的神经网络被用作分类器。为了验证数据集1上特征重构的有效性,作者还检验了当输入最初是由XceptionNet 提取的特征时神经网络的性能。此外,引入了SVM和决策树这两个经典的监督分类器来与作者提出的模型进行比较。为了避免混淆,将由原始特征训练的ANN命名为ANNraw.两个网络用相同的训练参数训练。表19给出了两个训练网络的分类结果。
括号中的参数表示给定的参数用于训练GNet。可以看出,用重构特征训练的网络比用XceptionNet 提取的原始特征训练的网络性能好得多。尽管批次大小N和k不同,但与ANNraw给出的结果相比,准确度显示出一致的增益。当涉及到训练两个网络的计算开销时,由于特征重构过程中的图构造和图特征组合过程,GNet需要较长的时间。
然而,作者提出的神经网络在预测阶段变得更加有利,因为网络允许对多幅图像进行同时分类。考虑到笔记本电脑的计算能力,成本仍然是权宜之计。因此,作者相信所提出的特征重构方法也可以移植到其他机器上。作者相信他们的重构方法对于改善ANN的性能是有效的。
在数据集2上,DenseNet201在所有最先进的网络中表现最佳。因此,神经网络和神经网络的输入是由DenseNet201提取的特征。在进行比较时,采用了神经网络和神经网络的相同结构。如表20所示,GNet的性能明显高于ANN和SVM。
在这一节中,作者将他们提出的特征重建方法与基于主成分分析的特征重建方法进行了比较。特征值和特征向量按降序计算和选择。对于两个数据集,确保所选组件能够解释超过98%的所有可变性。因此,来自两个数据集的特征的维数分别从256降低到152和131。然后根据主成分分析重构的特征,训练神经网络、SVM和决策树等分类器。此外,基于图知识重构方法,从两个数据集重构特征。为了简单起见,作者选择N为32,而k保持为16。
从表19和21可以看出,ANN的性能略有下降,而SVM和决策树的性能有所提高。从表22中可以得出一个矛盾的结论,即SVM和决策树的性能更差,而ANN的性能得到了显著提高。因此,可以粗略地得出结论,基于主成分分析的重建方法和作者的方法都不能显著提高SVM和决策树的性能,但是作者的方法确实将特异性提高到1。
在数据集2上,作者只是重复了相同的过程,并分别在表23和24中给出了结果。请注意,ANN的输入大小已相应调整为131。可以看出,当使用主成分分析时,SVM的性能保持不变,而作者的方法损害了SVM的性能
对于决策树,两种方法都提高了决策树的性能。基于两个数据集的结果,作者相信他们的特征重构方法在提高ANN的性能方面显示出很大的优势,而如何利用作者的方法提高SVM和决策树的性能还有待探索。
大量的工作集中在设计用于检测肺炎的高精度系统。为了提供公平的比较,作者将他们的方法与在相同数据集上验证的方法进行了比较。对于常见细菌和病毒引起的肺炎,不同方法的性能见表25。
敏感性衡量建议的方法对作为患者的病人做出正确诊断结果的能力。与高特异性相比,高敏感性的意义更大,因为被误诊为病人的健康人比被误诊为健康人的患者遭受的风险低得多。可以看出,作者的方法超越了大多数最先进的方法,达到了最高的灵敏度,这意味着作者的方法显示出更强的检测肺炎图像的能力。
(灵敏度越高,所提出的方法在检测真实肺炎图像上的性能越好)
为了与基于胸部CT图像的方法进行公平的比较,我们还将我们的方法与最先进的方法进行了比较。详细结果见表26。
本文提出了一种新的基于x光和计算机断层图像的肺炎检测分类器。所提出的特征重构方法以简单的结构极大地提高了神经网络的性能。在向所有模型输入图像之前,应用预处理方法来使图像适应模型。由于数据集中图像的大小可能会有所不同,因此会针对不同的网络调整图像的大小,以满足输入的大小要求。此外,当图像的原始高度和宽度大于1000像素时,图像不是方形的。
因此,可能由于图像大小调整而引入失真。不过ExceptionNet在所有CNN中表现最好,但是,当涉及到dataset1时,可能是更大的输入图像允许提取更多的特征。
在datatset1中,图像是单通道灰度图像。因此,数据集中的图像被转换为三通道RGB图像。对于数据集2中基于CT的图像,DenseNet201可以受益于各层之间的丰富连接,在所有网络中表现最佳。除上述程序外,不涉及其他数据增加方法。对于图生成过程中的相似性度量,可以应用许多其他方法。然而,欧几里德距离是量化特征之间差异的最直接的方法。重构特征时,待重构特征可以通过找到的前k个最近邻进行重构。但是,特征在同一批中的分布会显著影响重建的性能。
因此,作者选择将原始特征作为前k个最近邻之一,从而减轻特征分布带来的影响。图形构造和图形-特征组合是特征重构过程中最重要的两个步骤。然而,这两种方法在训练和预测阶段都不会带来显著的计算成本。通常,验证集用于验证所提出的分类器的性能。然而,所涉及的数据集中的验证集太小,不能作为有用的验证集。因此,建议对数据集进行重新分区,以形成真正有用的验证集。
本文提出了一种新的深度学习模型,通过集成图形知识进行特征重构来检测肺炎。作者假设,如果特征由邻居重构,它们将更具代表性。在此基础上,作者提出了一种基于图的重建方法,该方法简单而有效。如果我们把重构看作是下一个神经网络的一个组成部分,那么所提出的神经网络就变成了一个只有一层的简单的图形神经网络。在大数据集上的实验表明,所提出的特征重构方法和模型具有较高的性能,其性能超过了现有的方法。在公共新冠肺炎计算机断层图像数据集上的结果也支持该结论,其中我们达到了99%的准确性。
然而,这项研究的一些局限性仍然存在,并将被列为我们未来的工作。数据集的规模仍然很小,无法产生更令人信服的结果。图的构造和特征的重构是我们方法的重要组成部分。然而,还有更多细节有待探索。例如,在所有实验中,我们选择了一个小于人工神经网络输入维数的批量。如果我们选择一个比输入维数更大的N呢?此外,过渡全连接层的设计和人工神经网络体系结构的优化还有待进一步探索。然而,人工神经网络显示出比其他分类器如SVM和决策树更高的优先级。尽管如此,这些细节将在我们今后的工作中得到落实。