001一种儿童癫痫发作的非通道广义癫痫检测方法-2021

A channel independent generalized seizure detection method for pediatric epileptic seizures-2021

摘要:

背景和目的:癫痫是一种中枢神经系统疾病,据世界卫生组织估计,全世界约有5000万人患有癫痫。脑电(EEG)是分析和研究癫痫发作期间大脑神经元活动的细微变化的最常见和非侵入性的方法之一。可以分析这些变化,以开发一个自动化系统,断言即将发生癫痫发作的可能性。由于癫痫发作的多变性影响患者的正常生活,因此,开发新方法的进展将提高生活质量,并为医疗部门提供帮助。该方法的目的是避免EEG通道的选择,利用所有输入的EEG通道特征来设计一个通用的癫痫发作检测框架。

方法:在本工作中,我们提出了一个(LSTM)长短时记忆网络,该网络并不复杂,并且能够从无创和有创的脑电记录中有效地检测癫痫发作。所提出的框架简单而有效,并且设计成可以使用原始脑电信号来检测癫痫发作。此外,还遵循了一种与通道无关的通用方法,使得所提出的体系结构可以有效地检测属于大脑任何半球的EEG信号。

结果:在波士顿-麻省理工学院儿童医院数据集上,自动癫痫检测系统达到了99.9%的高癫痫检测灵敏度,每小时0.003的低假阳性率。而在Inselspal Bern数据集上的大学神经学系睡眠-觉醒-癫痫中心,敏感度为99.4%,假阳性率为每小时0.006。该模型的收敛分析为癫痫发作的有效检测提供了大量的可靠性和正确性。

结论:对非侵入性和有创性脑电信号的评估表明,该框架适用于不同类型的脑电记录,因为不同的度量给出了令人满意的结果。由于该结构简单,不需要任何额外的参数优化技术,在不影响精度的情况下减少了处理开销。因此,它可以作为监测癫痫发作的一种有效方法。

1. Introduction

        癫痫的基础介绍

        通常,癫痫发作的发作是普遍表现的异常电活动,表现为正常大脑活动[6]的明显变化。尖波和慢波[7,8]标志着这些变化,被认为是癫痫发作[19]的标志性特征。为了分析这些显著的变化,医生用于研究大脑活动的最广泛接受的非侵入性技术是通过提供了值得称赞的时间分辨率的EEG。

        通过脑电图可以精确地捕捉癫痫事件,并且可以很容易地将不同的发作期和发作间期与正常事件区分开来[1 1]。脑电图记录的视觉评价需要神经科专家的介入。由于对大量脑电图记录进行物理分析既耗时又费力,因此癫痫发作事件的自动诊断越来越受关注。自动癫痫发作检测系统[14,22]将为更容易、更快地诊断癫痫发作事件铺平道路,使误判和错误最小化。尽管一项致力于提供癫痫发作前持续时间[20]及其形态的关键方面的研究仍缺乏实质性证据,但癫痫发作检测系统的发展将改变患者的治疗和管理[15,4]。制定检测策略是一项具有挑战性的任务,因为癫痫发作是患者特异性的,每一次癫痫发作都有独特的特征。为了实现精确的癫痫检测,整合广泛的时间和空间信息是必要的。由于患者需要长时间的药物治疗,因此,在癫痫发作前制定预警策略将有利于人类的快速干预[17,18]。

        在过去的几十年里,研究人员致力于使用不同类型的算法进行有效的癫痫检测[23]。自动癫痫检测主要由两个主要步骤组成[22]。第一步是对相关特征的信号进行分析和处理。频域、时域、时频域和非线性方法主要用于从EEG信号中提取特征[13]。第二阶段包括使用提取的时间和空间特征对信号进行分类。传统的分类器通常遵循自动癫痫分类的两个阶段。

癫痫发作的检测主要依赖于两种不同的方法[24]。在一种方法中,发作前和发作间记录被认为是对状态进行分类和区分,而在第二种方法中,阈值被认为是不同特征的阈值,当超过阈值时,导致产生警报。

        虽然两阶段方法比较复杂,需要对信号进行一定的某些处理,但取得了较好的效果。机器学习的进步和深度学习的突破为设计能够自动学习特征的模型铺平了道路。[25]使用基于神经网络的ScoreNet模型研究了长时间脑电图记录中的发作发作和发作偏移。ScoreNet使用相邻时期评分技术来识别发作时期,然后将它们组合成一个组。分析各期的预测值,以确定癫痫发作的开始和结束。另外,基于骰子相似度的一个不同的代价函数(log-dice loss)[25]被作者用来模拟他们提出的方法的损失函数。虽然变异[26]常被用作特征来观察癫痫发作时脑电图信号的变化,但癫痫患者的信号频谱变化并不均匀。正常事件和癫痫发作期间的能量差异在子带间变化不均匀。因此在[26]中,除了方差,还考虑了脑电图信号的功率谱密度来计算子带能量.

        [28]利用异常生成对抗网络(AnoGAN)利用时频方差来学习脑电信号发生事件的频谱变化。AnoGAN是一种具有视觉信息学习能力的深度卷积生成对抗网络。Wen等人[27]使用自编码和深度CNN从脑电图信号中提取最优特征。采用自编码器提取特征,可以提高深度学习模型的收敛速度,从而缩短模型的训练时间。

        稀疏去噪自动编码器已被用于以非监督方式从不同EEG通道学习特征,用于有效识别大脑异常。为了避免对脑电信号进行预处理,采用了具有多个卷积块的CNN来学习脑电信号的相关特征。这些提取的特征然后被用作嵌套LSTM模型的输入,以理解和探索EEG信号的固有特征[30]。使用滑动窗口将每个EEG信号分解成具有固定采样点的段。对EEG信号进行分段是为了评估每个分段对信号的影响以及它如何影响他们提出的方法的识别能力。

        在[31]中,作者将多个卷积层与最大池化层和全连接层结合起来,从EEG信号中提取特征,以区分正常、发作前和发作期。Tsiouris等人[32]在他们的工作中使用了与时域、频域、相关和图论相关的各种特征。在用于LSTM分类器之前,已经使用了5秒的片段来提取每个特征技术。不同的LSTM构型已经在一种针对患者的方法中进行了测试,以区分发作前和不同的发作间期亚组。Hossain等人[33]使用深度CNN模型提取了频谱和时间特征,用于自动癫痫发作检测,并理解癫痫发作的细微差别,从而使开发的模型不易受EEG信号变化的影响。可视化技术有助于绘制有助于定位癫痫发作的大脑活动图,还显示了不同频段的空间特征分布。Thara等人[35]在他们的工作中表明,良好的缩放技术同样重要,并使用CNN模型提取特征,合并递增和递减序列,以指出信号波形的特征。

        作者使用数据增强以及增减序列的合并来突出使用感知组织原理从样本中获得的信息[36]。不同的合并规则用于合并EEG信号中的不同波形和峰值。这不仅有助于突出信号中峰值的形状,也有助于抑制轻微的波动。在使用深度学习算法之前,已经使用短时傅里叶变换将EEG信号转换为灰度图像[37],因为它在时域和频域中包含有助于检测癫痫发作的必要信息。Usman等人[38]使用卷积神经网络提取特征,用于在发作前和发作间期之间进行分类。作者用传统分类器(如支持向量机(SVM))替换了CNN的全连接层,以识别不同的状态。为了保持EEG信号的内在特性,[39]中使用了局部平均分解(LMD)和统计特征。Bi-LSTM体系结构包括两个从相反方向传播的独立LSTM网络,并使用这些分解特征识别癫痫发作段。

        Zhou等人[40]使用发作前、发作间期和发作期的时域和频域特征来区分发作和非发作信号。结果表明,频域信号在分类精度方面优于时域信号。[41]中的作者用重构相空间(RPS)表示EEG信号,以捕获与信号相关的非线性动力学。将传递学习应用于脑电信号RPS图像的预训练卷积网络。RPS通过构造信号的状态空间,捕获了特定时刻脑电信号的动态变化。因此,RPS图像可以随时反映信号的变化。这有助于深度学习网络识别癫痫发作。在[42]中,迁移学习也被用于设计交叉患者癫痫检测CNN模型。作者采用深度神经网络结构检测夜间额叶癫痫。EEG信号的图像已被[43]用于设计一个全自动的CNN模型,该模型以小于0.5次/小时的错误警报率检测大多数患者的癫痫发作。

        Cho和Jang[21]使用不同输入模态的2D图像来分析网络结构的组合,这将适用于癫痫检测。[44]使用了长期脑电图记录的图像,用于区分发作图像与非发作图像。LSTM的一种变体,也被称为深度卷积LSTM (C-L STM),已被用于研究大脑活动和检测癫痫发作[45]。而Nagabushanam等人[46]则使用两层LSTM模型来提高癫痫分类的性能。深度神经网络的优点是可以直接从数据中学习,而不需要先验的主知识,因此有助于在不存在特征集的情况下对EEG信号进行分类[47,48]。Medvedev等人[20]在他们的论文中使用LSTM来识别峰值、波纹和峰值上波纹的存在。[49]已经使用LSTM来寻找EEG样本之间的相关性,从而进一步用于癫痫检测。利用多视角深度学习模型研究了癫痫发作时神经活动的异常。

目前讨论的癫痫检测方法都是基于深度学习算法,取得了很好的结果,但大多数方法主要依赖于CNN体系结构。在传统的分类器中使用卷积神经网络提取特征进行分类的研究较少。通常,CNN利用脑电图信号的空间信息来检测癫痫发作动态。由于脑电图信号主要是非线性的,因此利用CNN分离和提取大脑活动的时间特征可能存在一定的局限性。在一些研究中,利用小波变换和短时傅里叶变换计算脑电信号的时频系数,并将信号转化为灰度图像[37]。然后,这些输出被用作二维卷积神经网络的输入,用于提取与癫痫发作相关的光谱和空间信息。该方法的缺点是将一维的脑电图信号转换为二维的图像或矩阵,处理时间增加,数据量增加。现有方法的另一个缺点是大多数方法都是通道特异性的,即首先选择通道,然后使用这些选择的通道特征作为输入来检测癫痫。因此,提出了一种避免通道选择的方法,并利用所有输入通道特征来设计广泛性癫痫发作检测方法。此外,针对患者特异性癫痫发作检测方法的研究也为数不少。

为了解决这些限制,该研究提出了一种基于长短期记忆的新型深度学习方法,该方法能够有效地从原始脑电图信号设计一个有效的自动癫痫检测模型,该模型具有简单的架构,能够将所有步骤整合到单个系统中。所提出的长短期记忆网络的设计使得即使脑电图信号在一段时间内发生变化,也不会丧失一般性。在头皮脑电图对伪影敏感的情况下,该方法能够显著降低误检率,提高系统的整体癫痫检测精度。当与其他基于深度学习的方法相结合时[32,33,39,40,43],所提出的单层LSTM模块在分析脑电图信号中隐藏的内在时间依赖性方面是有效的。此外,该模型使用的是一维原始脑电图数据,不需要任何变换,从而在很大程度上直接降低了模型的计算复杂度。此外,该方法不需要传统分类器所要求的手工特征提取技术,从而减少了与EEG记录特征工程相关的大量预处理。该方法在非侵入性CHB-MIT头皮数据集和侵入性颅内SWEC iEEG数据集的基础上,提高了癫痫检测的准确性,从而实现了高维数据的实时实现。

论文的其余部分安排如下。第2节简要描述了所使用的方法以及所提出的方法的体系结构,以及所使用的两个数据集的描述。它还强调了工作的训练和测试策略,相关的不同学习参数,以及分析结果的性能度量。提出的模型已经在两个公开可用的数据集上进行了验证和测试,得到的结果在第3节中提到。第4节提供了与以前工作所取得的成果的讨论。最后,第5节总结了研究的发现和重点。

  2. Methods

 2.1. 数据集描述

  2.1.1. Children’s Hospital Boston Massachusetts (CHB-MIT)

            本研究考虑的数据集包括1.5至15岁之间患有顽固性癫痫的儿童患者的头皮脑电图记录。该数据集属于马萨诸塞州波士顿儿童医院(CHB-MIT)[52]的患者。由24例患者组成的数据集已用于验证所提出的方法。每个文件包含一个到最多四个癫痫发作记录,使用电极的双极位置根据10-20个国际电极的位置,采样256hz, 16位分辨率。在这项工作中被认为用作输入的脑电图通道的数量是23。图1为单个患者的头皮脑电图重新记录。

001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第1张图片

 2.1.2. Sleep-Wake-Epilepsy-Center (SWEC)

        第二个数据集用于对所提出方法的验证,该数据集来自伯尔尼大学神经学系睡眠-觉醒-癫痫中心(SWEC)和苏黎世联邦理工学院集成系统实验室[53]。该数据库共有16名患者,记录了99次癫痫发作和10次癫痫发作。使用条形电极、深度电极和栅格电极记录了颅内脑电图(iEEG)信号。在Fz和Cz的10/20位置之间,一个颅外电极被用作记录的参考。信号的采样频率为512hz,用0.5 Hz到150hz之间的四阶Butter- worth滤波器对记录的信号进行滤波。每个脑电图记录包括3分钟的中间段,随后是10秒到1002秒之间的中间段和3分钟的后段。图2显示了单个患者的颅内脑电图记录。

2.2. Classification methods 分类方法

不同的基于机器学习的分类器被用于对非发作性和发作性脑电图信号进行分类。在这项工作中,使用了三个分类器,一个常用的传统分类器和两个基于深度学习的分类器。对每种方法进行了简要的描述,并对所提出的体系结构中的参数进行了详细的讨论。

2.2.1. Artificial neural network (ANN) 人工神经网络

        人类神经系统启发了人工神经元网络(ANN)的基本架构。它是一个建立在数学模型基础上的数据驱动模型,具有识别输入和输出之间复杂非线性关系的能力。神经网络的基本体系结构包括输入层、隐藏层和输出层。在输入和输出层之间可以存在多个隐藏层,这些输出层与偏差、权重和不同的激活函数[34]相链接。该方法的特点是采用随机梯度下降优化方法训练神经网络,采用反向传播方法更新权重。

由于损失函数与激活函数有很大的相关性,根据问题[51]的类型使用不同的损失函数。在反向传播中,误差是向后传播的,因此每经过一层,误差就会减小。这导致了训练过程变长,准确率逐渐下降,导致了梯度消失问题的根本原因,这是人工神经网络的一个突出缺点。图3显示了用于癫痫发作检测的神经网络结构。

 2.2.2. Convolutional neural network (CNN) 卷积神经网络

与图像处理相关,在一维和二维体系结构[34]的医学信号检测中取得了进展。一维卷积神经网络天生适合处理生物医学信号,如脑电图记录。改进了卷积神经网络的核心结构,使其能够熟练地处理一维脑电信号。此外,一维体系结构比二维结构更快,因为它是直接的,相关的参数数量更少。为了从原始信号中了解时间、光谱和空间特征,在网络结构中使用了卷积层。池化层通过消除冗余来减少提取特征的维数。池化层还可以避免数据的过拟合。尽管有不同的池化方法,最大池化是常用的。全连通层是卷积神经网络[50]的关键组成部分。它执行分类所需的高级推理,全连接层的输出提供每个类标签的概率。一维卷积运算表示为:         

001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第2张图片                                                                                                                                                                                                                                                 式中,L为卷积层,f a为激活函数,bi为偏置,ke为卷积核数,C为输入通道数。

其中,αMB为小批方差,μMB为小批均值,σM b2为标量参数,ε为随机噪声。

Adam optimizer使用以下方程式来计算过去和过去平方梯度的衰减平均值:

001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第3张图片

式中,mo t为均值(第一矩),va为无中心方差(第二矩),β1和β2为衰减率,gr为梯度。修正的第一和第二力矩为:

 001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第4张图片

 式中,η为一般学习率。

针对二元分类问题,采用二元交叉熵计算损失函数。损失由下式得到:

001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第5张图片

2.2.3. Long short-term memory (LSTM)

长短时记忆(LSTM)是循环神经网络(RNN)[24]的进步,它解决了每个单元(或模块)增加更多交互作用时梯度消失和梯度爆发的挑战。这种特殊类型的RNN具有处理长期依赖关系和长时间保留信息的能力。LSTM模型具有一个链式体系结构,对于重复模块[20]具有不同的结构。与典型的RNN不同的是,四个相互关联的层有一种专有的通信技术。称为细胞的内存块是典型LSTM[23]的固有组成部分。单元状态负责数据[47]不变的转发流。不同的门具有单独的加权值,这类似于矩阵操作的序列或层。

这些门负责记忆过程,并帮助避免长期依赖问题。通常,LSTM体系结构由以下门组成:输出门(Fg)、输入门(x)、单元候选门(n)和输出门(Op)[34]。下面的方程表示不同的门。

001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第6张图片

 2.3. Architecture of the proposed method 方法的体系结构

所提方法的原理图如图7所示。在这项工作中,原始的脑电信号已经被用来检测癫痫发作。由于在EEG信号的记录期间使用了基本的 butter-worth filter,因此不执行记录的附加预处理。由于工作的目的是开发独立于通道的癫痫发作检测框架,因此使用所有记录的23个通道的脑电信号作为输入。该方法遵循一种泛化的方法,将整个数据集随机分为训练和测试两个子集。以80:20的比例对训练数据进行进一步分割,以执行训练模块的同时验证。接下来是分类器模型的选择以及可学习参数。传统学习模型和深度学习模型都被用于癫痫发作的研究。基本网络结构被放置在收集模块中。在初始阶段,为训练阶段初始化网络结构、层、优化器的不同可学习参数和损失函数。然后根据训练时间和超参数的选择对模型进行了解释和比较。交叉验证的训练模型被保留,以供将来解释其他数据集。除了评估之外,训练好的模型还会在单独的测试数据集上进一步测试,该测试数据集是在建议的方法开始时划分的。所提出的方法有助于理解和分析每个模型的效率、损失率以及模型相对于历元的收敛。

如图3所示,人工神经网络的网络结构由128个神经元的输入层、256个神经元的隐藏层和最终输出层组成。输入层和隐层都具有RELU作为激活函数,而输出层具有Sigmoid作为激活函数。

图4显示了能够进行特征提取和分类的一维卷积神经网络的建议结构。卷积神经网络有两个1DConv层,用于从EEG信号中学习特征。每个卷积块由128个神经元组成的卷积层,带有一个非线性激活函数校正线性单元(REU)。

001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第7张图片

第三层是处理内部变量移位的批处理归一化。卷积块的最后一层是最大池化层,它体现了平移不变性。第二个卷积块与第一个卷积块具有相同的结构。将由卷积层得到的特征图通过平化层平化为一维向量,再与全连通致密层连接,实现特征的合并和分类。前三个密集层以tanh作为激活函数,然后是辍学层。最后的密集层有一个s型激活函数,它将根据这两类生成输出向量。另一个使用的深度学习模型是长短期记忆,LSTM网络的拟议结构如图5和图6所示,图5和图6显示了单个LSTM细胞结构。L STM块由256个内存单元组成,其中ReLU作为激活功能。这些单元由不同的门组成。遗忘门可以去除LSTM不需要的信息,从而优化LSTM网络的性能。信息的添加由输入门使用tanh函数形成,而调节滤波器则使用sigmoid函数乘以并添加到单元状态。有用信息的提取是通过输出门实现的。LSTM单元后面是两个完全连接的致密层。第一层密度为128单元,具有非线性激活函数(ReLU),最后一层为sigmoid激活函数。所有分类器的详细描述见表1。

2.4. Learning parameters of different models 不同学习模型的学习参数

在所提方法的训练阶段,需要从数据集中学习与每个网络结构相关的权重参数。在人工神经网络中,采用二元交叉熵作为损失函数。采用了Adam优化器,使用的Adam算法的不同超参数分别为衰减率(beta 1 = 0.9)、平方梯度衰减率(beta 2 = 0.999)和学习率(0.0 0.01)。cho- sen的批次大小为200个,训练时间为10个。卷积神经网络的参数也采用反向传播的保守方法学习,二元交叉熵作为损失函数。在自适应估计一阶矩(均值)和二阶矩(无中心方差)的基础上,采用RMS Prop和随机梯度下降作为Adam优化器。使用的不同超参数的Adam算法是,衰减率(β 1 = 0.9),平方梯度衰减率(β 2 = 0.999)和学习率(0.001)。训练1D CNN选择的批次大小是600个,200个训练周期。同样地,对于长短时记忆网络,损失函数保持与二元交叉熵相同,且Adam优化器的超参数相似。LSTM具有十种过度拟合训练数据的倾向,从而影响了网络的可预测性。为了避免过拟合,采用l2正则化对LSTM网络中节点的权值进行正则化。

用于训练模型的权值衰减或l2正则化因子为0.0 0.01。用于训练LSTM模型的批大小为600,1 000个训练周期,序列长度为5。

2.5. Training and testing strategy 训练和测试策略

交叉验证的方法对所提方法的性能进行了评估,以检验所提结果的可靠性。脑电信号被划分为N个互不相容的折叠,这些折叠具有等跨度的非癫痫发作和癫痫发作记录。在N倍的数据中,有一倍的数据被保留下来作为测试数据,以评估训练模型的性能。因此,使用(N−1)折叠来训练和验证模型。为了避免过拟合问题,在每个折叠值中进行了分裂,使得20%的训练数据被用于同时验证模型,同时使用剩余80%的数据对模型进行训练。随着每个历元的完成,计算错误率,以使模型不会过度拟合训练数据。通常,如果错误率在连续四个历元内持续增加,则终止训练过程。在模型训练之后,使用测试折叠来评估训练模型,并且该过程重复N次,直到所有折叠都用完。所有N个单独测量的平均值给出交叉验证结果。在这项工作中,使用了10次交叉验证来分析所提出的方法的性能。

 2.6. Performance measure 性能测量

在这项工作中,灵敏度、特异性、准确性、马修相关系数和f1分数被用来研究传统分类器和深度学习方法的性能。马修的相关系数(MCC)是一个特例,相当于卡尔·皮尔逊的phi系数。它有助于测量和理解给定分类器的质量。当计算系数时,真和假情况的正和负都被考虑在内,因此这个度量被认为是一个平衡的度量。系数介于-1和+1之间,MCC表示为:

式中,TP为真阳性,TN为真阴性,FP和FN分别为假阳性和假阴性事件。

F1分数同时考虑了精确度和召回率来计算F分数。它也是一种分类的统计分析。

f1评分或F-measure表示准确率和召回率之间的调和平均值。它有时被称为骰子相似系数。

 001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第8张图片

3. Results

传统的深度学习方法和本文提出的方法在两个公开数据集的原始脑电图信号上进行了验证和测试。不同分类器的性能已经通过诸如准确性、灵敏度、特异性、精确度、误报率、Matthew相关系数(MCC)和F1评分。为了理解所提方法的正确性,也进行了收敛性分析。

001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第9张图片

 3.1. Seizure detection performance of different classifiers on CHB-MIT dataset3.1. 不同分类器在CHB-MIT数据集上的癫痫检测性能

本研究采用人工神经网络(ANN)、一维卷积网络(1D- cnn)和长短时记忆(LSTM)技术,设计了一种癫痫发作自动检测系统。所有这三种分类器已被用于由癫痫发作和非癫痫发作记录组成的两个独立的脑电图数据集。对于所有的方法,都使用了10倍交叉验证,并将(N−1)倍的训练数据进一步分割以进行验证。

然后,对训练过的模块进行测试,使用保留在一旁用于测试的折叠。对第一个数据集(CHB-MIT)进行二元分类的结果如表2所示。对于原始脑电图信号,深度学习方法比传统方法具有更好的分类精度。LSTM的假阳性率为0.003/h,而1D-CNN和ANN检测癫痫的假阳性率分别为0.034/h和0.044/h。由于误检率较低,LSTM网络的准确率在三种分类器中也较高。图8显示了两种方法相对于训练周期的准确率曲线。

001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第10张图片

 001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第11张图片

图9所示的LSTM图略有不同,因为它同时显示了验证过程中模块的准确性和损失。

001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第12张图片

3.2. Seizure detection performance of different classifiers on SWEC dataset3.2. 不同分类器对SWEC数据集的癫痫检测性能

在这项工作中,第二个数据集已经被用来测试所提出的方法的效率和能力。使用的数据集属于睡眠-觉醒-癫痫中心(SWEC),包含颅内脑电图(iEEG)。当第二个数据集被验证时,各自分类器的模型配置和参数保持不变。在SWEC数据集上的癫痫检测性能如表3所示。从结果中可以看出,性能指标与CHB-MIT数据集相似。有效的癫痫检测系统的特征是最大限度地提高癫痫检测灵敏度,最大限度地降低误检率。提出的方法已经能够实现这一标准。LSTM的假阳性率为0.006/h,而1D-CNN和ANN检测到癫痫发作的假阳性率分别为0.002/h和0.075/h,这与之前的数据集类似。图12给出了基于F1测度和每小时假阳性率(/h)的两个数据集的性能分析。

001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第13张图片

图10显示了LSTM网络在使用SWEC数据集进行测试时的准确率和损失曲线。

001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第14张图片

 3.3.  Convergence analysis of the proposed method所提方法的收敛性分析

深度学习方法具有基于梯度的优化能力,有助于算法收敛到全局最优。当一个算法在一个周期内按顺序产生一个误差时,它被称为收敛到最小误差。这意味着算法的近似平衡和正确性。在本工作中,研究了损失函数的收敛性,分析了所提方法的收敛性。

图11为损失函数的收敛曲线。可以观察到,目标函数在几个时期保持不变。LSTM网络的损失函数逐渐减小,经过一定的迭代后趋于稳定。第二个数据集(SWEC)的收敛性可以从图10中分析。损失函数收敛,并在较长时间内保持不变。

001一种儿童癫痫发作的非通道广义癫痫检测方法-2021_第15张图片

 4. Discussion

提出的方法是一个前瞻性的癫痫检测系统,可用于非侵入性(头皮)和侵入性(脑内)脑电图记录。所提出的方法是通道独立的,因为它不选择任何脑电图通道,而是将整个记录的通道作为输入。本节将所提方法的性能与文献中提到的其他相关方法进行比较,例如使用相同的数据集分析系统的检测能力。表4突出显示了目前提出的方法与以往工作的比较。

在使用非侵入性或侵入性脑电图记录的情况下,研究了不同的癫痫检测方法。在同一模块中使用两种类型的记录进行癫痫发作检测的数量较少。拟议的工作使用了非侵入性和侵入性脑电图信号,因此旨在建立一个健壮和全面的系统,该系统可以无缝适应并有效地检测癫痫发作段的存在。

灵敏度是自动癫痫发作检测单元的主要方面之一。召回率表示从脑电图记录中正确识别癫痫发作事件的率。提出的LSTM模型已经能够使用广义方法获得更高的灵敏度,而Tsiouris等人[32]使用患者特异性方法获得了相同的灵敏度。

作者逐渐利用时间窗的概念对脑电信号的分割进行了改进,这在一定程度上影响了脑电信号分割的灵敏度。提出的LSTM模型能够比Bi-LSTM[38]执行得更好,在灵敏度方面,Bi-LSTM[38]具有来回使用信息的优势。与Gomez等人[43]所应用的针对患者的策略相比,广义方法在适应信号的微妙变化和识别癫痫发作期最大值方面是有效的,这使得该工作更适合于现实生活中的实施。

提出的工作的另一个重要方面在于假阳性率。由于癫痫的识别是至关重要的,几乎所有的癫痫检测单位都希望假阳性率的最小值。与其他相关工作相比,所提出的方法能够实现较低的假阳性率,并且表现异常好[25,26,30,32,37,43],因此巩固了系统的稳定性。因此,与FPR/h相比,目前的工作具有在现实生活中实现的潜力,并将有助于警报产生系统的设计。该方法与[39]方法不同,其结构简单,[39]方法使用Bi-LSTM方法提取时间特征,然后进行进一步分类。尽管应用了嵌套的LSTM[30],但假阳性率低于所提出的方法。

深度学习方法具有从给定数据集中学习特征的内在品质。所提出的方法在设计时就考虑到了这一点。因此,所提出的LSTM网络已被单独用于分析脑电图记录。尽管该方法缺乏复杂和深入的网络结构[27,33,36],但当精确度比较时,所提出的方法在正确识别癫痫发作方面取得了更高的精确度。因此,值得注意的是,由于数据处理技术、模型设计和参数选择的不同,可能会实现较高的分类。但有时,这些可能会限制系统的性能,只要约束有轻微的变化。因此,癫痫发作检测系统需要具有自主学习能力和性能不受参数和架构复杂性影响的模型。

一般来说,对脑电图记录进行分类的研究倾向于使用单一数据集来设计拟议的框架。

但在这项工作中,一个头皮脑电图数据集和一个iEEG数据集被用于一个单一的框架,同时保持所有的配置。由于iEEG倾向于使用大量的通道,因此所提出的体系结构能够在增加的EEG通道数量的情况下高效工作。LSTM单元的序列长度已被选择,在一般情况下没有损失。脑电图信号往往在短时间内显示微妙的变化,而且所提出的架构设计的方式是,即使数据随时间发生变化,也可以避免信息丢失。此外,所提出的方法避免了特征提取的耗时步骤,一旦一个模块被训练并存储在模型集合中,它可以在未来用于检测和分析脑电图记录。这最终将有助于提高难治性癫痫患者的生活质量。

这项工作的局限性在于所提出的方法的框架。由于这两个数据集都有短持续时间的信号,广义训练模块已经能够准确地对癫痫发作进行分类。是对于长时间的脑电图记录,如果前期数据和间歇数据不平衡,就需要进行分割,这样深度学习体系结构才能高效地学习到特征。此外,由于电极的带状或网格布置,iEEG记录的通道不同,因此,需要一个经过训练的通用模组来适应和促进通道数量的变化。目前提出的方法并没有强调癫痫发作的检测潜伏期。这可以纳入到未来的工作中,因为它将有助于设计一个有效的警报生成系统,该系统将在癫痫发作前观察到变化时启动警报。

机器学习在过去几年中最关键的进展是深度学习算法的发展。一维卷积网络具有结构紧凑、结构简单等优点,在生物医学领域具有广泛的应用前景。卷积神经网络被认为是黑盒,因为它具有固有的学习特征的能力,而不需要额外的特征提取,因为特征提取和分类步骤合并到一个过程中。在这项工作中,由于使用了原始的脑电信号,因此使用1D-CNN来提取优化的特征,从而最大限度地提高准确率,最大限度地降低误检率。通常,CNN层包括五个操作:(I)与线性时不变滤波器的卷积(Ii)不同特征的求和(Iii)局部求和的计算(Iv)次抽样(V)逐点非线性激活函数。所提出的细胞神经网络由非随机卷积、合并和批归一化组成的顺序层组成。来自多个EEG通道的信号用作第一层的输入。除了使用线性过滤器处理特征外,还在最大池化层中对特征分量进行汇总。此外,由于汇聚层涉及数据的二次抽样,因此在本工作中,采用2的汇聚大小来降低维度,并使重要信息损失最小。紧随其后的是产生成为下一层输入的特征的非线性激活函数。为了避免数据的过拟合,采用了带丢失的正则化和批归一化来微调网络。在找到使网络损耗和输出差异最小的适当配置之前,网络已经进行了多次训练。

LSTM模型的学习能力用于评估每个特征在最终决策中的含义,因为在分类之前没有离散的特征选择步骤。LSTM模型对所有患者的特征空间进行内部评估。它学习最有用的特征,并采用一种广义的方法,以便产生更有效的、抗冲击的癫痫检测器。该方法中的LSTM网络从多个脑电图通道接收输入,并将脑电图记录按前后记录顺序分配到网络中。在确定最终序列号之前,对LSTM网络的序列进行修改和测试。由于LSTM网络采用了广义方法,它包含了大量的脑电图前相和前后相,这有助于区分脑电图信号的变化。为了避免过拟合,每个病人的脑电图片段都是随机选择和洗牌的,然后再拟合放入LSTM网络中。脑电图信号是复杂的,不同域(空间、时间和谱)之间的关系很强。因此,当输入数据输入到模型中时,保持关系的完整性是至关重要的。在这项工作中,由于考虑了所有的EEG通道,因此在LSTM单元中使用了列核,使所有的通道都被最小的失真覆盖。使用10倍交叉验证对所提出方法的癫痫检测能力进行了评估。

考虑到一般化的方法,LSTM网络能够学习与源自大脑不同位置的不同类型癫痫发作相关的前颞叶和前颞叶片段的广泛模式。在长期的脑电图记录中,数据的不平衡是一个常见的问题,因为前驱段相对少于前驱段。因此,为了避免这种类别不平衡的问题,在选择脑电图段时,前置段和前置段的持续时间相匹配。在深度学习体系结构中,对于深度学习模型[15]的宽度和深度没有具体的指示。

一般来说,模型的学习能力应与分类问题相协调,同时保持模型的低复杂度,以降低计算成本。

在以前的各种著作中,作者使用了LSTM模型的变体[30,32,46]。有些使用了嵌套LSTM模型,而另一些则使用了卷积LSTM[44]、深clstm[45]和双向LSTM网络[20]来研究发作、波纹、峰值等。与之前使用的其他LSTM模型相比,LSTM层中的单元数量很大,这有助于从原始脑电图信号中有效地区分正常和癫痫活动。因此,所提出的模型显示了在不需要额外的特征提取步骤的情况下识别癫痫信号的能力,而在其他LSTM模型中,要么提取特征,要么添加额外的卷积层来提取特征,然后再将其输入LSTM网络。由于训练LSTM网络本质上是耗时的,而脑电图信号会产生大数据集,因此选择了一个模拟网络,可以相对地减少训练时间。此外,当信号的序列长度改变时,产生的参数数量不变,网络的大小不受影响,这是LSTM网络的另一个很有前途的优点。在这项工作中,使用了具有不同序列长度和参数的单层LSTM模型来检测癫痫发作。虽然提出的方法使用了一个简单的LSTM框架,但网络结构是不同的。在最终确定提出的网络结构之前,已经修改了LSTM层的单元数,并进行了修改和测试。

在考虑了所有脑电通道的情况下,该方法有效地检测了不同部位的癫痫发作。该方法对每个通道都赋予了同等的权重,没有任何优先级或选择。正如在部分癫痫发作时所见,一个脑半球很少有特定的通道反映伴随癫痫发作的异常电活动。而在全身性癫痫发作时,来自大脑两个半球的多个通道都受到影响。由于在这项工作中,每个脑电图记录通道都被给予同等的重要性,因此错过癫痫发作或癫痫发作的几率很低。因此,所提出的方法可以在任何位置检测到癫痫发作。此外,所提出的方法所需的时间量是最小的,因为它可以产生输出,只要脑电图样本在时域产生。据说LSTM网络适用于时间序列信号,由于脑电图记录属于同一类别,利用LSTM网络的功能已被用于癫痫检测。在一段时间内脑电图记录中出现的微妙变化可以使用LSTM网络中出现的序列的稳定性进行分析。在一段时间内保留信息的能力有助于理解和分析脑电图信号。循环时间序列有助于更好地训练EEG信号,进而帮助更好地以最大的准确性和最小的错误检测癫痫。

5. Conclusion

在这项工作中,提出了一个通道独立的儿童癫痫发作检测框架。所有记录的通道都被用作输入,而不是选定的通道,这样就可以很容易地检测到一般性的癫痫发作。脑电图记录是复杂的,产生巨大的数据量,为了处理如此巨大的数据量,深度学习模型进入了研究领域,展示了它们的能力和有效性。

这些深度学习技术在解决不同的生物医学挑战方面开启了创新机会,其中之一是癫痫发作检测。LSTM网络已被用于这项工作,作为分析和检测癫痫发作的拟议方法。所提出的方法能够提供0.003/h的值得称赞的假阳性率,f1评分为0.999。

当对CHB-MIT的性能指标进行比较时,所提出的工作记录了高灵敏度和低FPR,这通常被认为是癫痫检测系统的理想选择。因此,需要对长时间脑电图记录进行广泛的测试,以便该方法能够在临床环境中实施。

你可能感兴趣的:(脑电研究,论文研读,神经网络,深度学习,机器学习)