脑电图(EEG)是研究癫痫和捕捉大脑电活动变化的最重要手段,这些变化可能预示癫痫即将发作。在这项工作中,将长短期记忆(LSTM)网络引入到使用脑电图信号的癫痫发作预测中,扩展了深度学习算法与卷积神经网络(CNN)的应用。首先进行预分析,通过测试多个模块和内存单元层来找到LSTM网络的最佳架构。基于这些结果,选择了一个双层LSTM网络来评估癫痫预测性能,使用4个不同长度的预发作窗口(从15分钟到2小时)。LSTM模型利用了分类前提取的广泛特征,包括时间和频域特征、EEG通道之间的相互关联和图论特征。使用开放的CHB-MIT头皮脑电图数据库的长期脑电图记录进行评估,表明所提出的方法能够预测所有185例癫痫发作,提供高的癫痫预测灵敏度和低的误报率(FPR),每小时0.11 - 0.02假报警(取决于预测窗口的持续时间)。与之前在文献中评估过的传统机器学习技术和卷积神经网络相比,提出的基于lstm的方法显著提高了癫痫预测性能。
癫痫患者的脑电活动被认为在走向癫痫发作的过程中随着时间的推移而发生显著变化,提出了各种方法来分离能够宣布癫痫发作的发作前脑电模式和节律变化[1]。随着我们对发作前脑电活动的了解的加深,癫痫发作预测的进展可能会给患者的治疗和疾病管理带来革命性的变化。然而,目前对发作前活动的研究还没有提供关于发作前脑电活动的实际持续时间、发作前脑电模式的形态和大脑状态的相对变化等关键方面的确凿证据。由于发作前脑电符号学的差异和发作前模式的时变性,癫痫发作预测问题的难度和复杂性增加,这证明了尽管过去几十年来该领域的关注越来越多,但缺乏可靠的方法是合理的。
在早期阶段,研究人员将重点放在对脑电记录(或ECoG)的分析上,因为它们提供了更好的信噪比,更好地定位了致痫区域,并且不太容易受到噪声和伪影的影响。其目的是最终将信号处理单元包括在能够动态调整电活动以防止或控制即将到来的癫痫的闭环系统中[2,3]。另一方面,头皮脑电记录在脑电信号质量、伪影(例如,身体运动和电极运动、正常肌肉活动、电磁干扰等)的存在方面存在显著劣势。以及大脑电活动的较低空间离散化,这被它是一种非侵入性技术的事实所抵消
通常执行移动窗口分析以将原始EEG数据分割成较小持续时间的片段,然后用于特征提取[23]。特征提取提供了降维和更复杂的高阶特征空间,可以提高用于分离发作前脑电段的分类算法的区分能力。
每个EEG通道的功率谱估计是最常用的单变量特征之一。将脑电信号从时间域变换到频域的最流行的算法是傅立叶变换[24,25]和小波变换[23,26]。这两种方法通常都采用离散形式(即快速傅立叶变换、FFT和离散小波变换,DWT),以降低分析大量脑电数据所需的计算成本,尽管一些癫痫发作预测研究也使用了连续小波变换来提取脑电频谱[27,28]。除了估计每个通道的脑电信号总功率外,还可以用标准化的脑电频带或节律来估计信号的能量:增量(?3赫兹)、赫塔(4-7赫兹)、阿尔法(8-13赫兹)、贝塔(14-30赫兹)和伽马(>30赫兹)。这些频段的相对功率差异在识别头皮和颅内信号的发作前变异方面显示出巨大的潜力[29-31]。
对形态脑电特征的预测价值也进行了研究,得出了一些有希望的结果。尤其是癫痫患者的脑电信号中出现尖峰的速度已经显示出显著的变化[32,33]。棘波由一个尖峰组成,与背景脑电活动明显区别,持续时间从20到70毫秒不等。在参考文献中。[33]对21例患者的脑电信号进行了分析,结果表明,发作间期、发作前、发作后和发作后的平均棘波率差异显著,平均值分别为1.7、4.98、18.97和2.36。除了棘波,脑电信号的过零点也被用来预测癫痫发作[34,35]。负过零点和正过零点都被评估为提供相似水平的癫痫发作预测性能的特征。平均而言,使用20名患者的头皮脑电信号,敏感度为88.34%,错误预测值为0.155个/小时,而使用6名患者的头皮脑电信号,敏感度为86.6%,错误预测值为0.067 F/h[35]。
最常见的双变量特征是互相关,它通过移位两个信号中的一个来估计一对脑电信号之间的相关性,从而解释了时间延迟。最大互相关值被保留为最具信息量的特征。也可以从互相关值中提取次特征,例如从通道相关性和协方差矩阵之间提取的时空特征值[36]。这些特征导致19例患者的脑电信号的平均灵敏度为86%,错误预测为0.03次/小时。信号之间的相位同步措施也被提出用于脑电分析,包括相位一致性或锁相值[37]。脑电分析的另一个主要领域是图论特征。图论框架已经被引入使用连接图来研究大脑中的功能和解剖连接[38]。可以使用互相关、相位滞后指数或滞后线性相干性作为跨EEG通道的连通性度量来提取图形[39,40]。一旦构建,这些图被用来提取次要特征,其中包括最常用的度数、直径、特征路径长度、中间度中心度和偏心率[41-43]。
传统的分类算法被广泛应用于癫痫发作预测研究中,以区分发作前的脑电片段[8,9,11]。赵等人。提出了一种结合多变量经验模式分解的方法来计算头皮EEG信号之间的锁相值,并使用支持向量机分类器将短的EEG片段分类为发作间歇期或发作前[44]。使用CHB-MIT EEG数据库中的65次癫痫发作对他们的方法进行了评估,分别达到了82.44%的敏感性和82.76%的特异性。Zhang和Parhi使用头皮EEG信号的频谱分析来提取初始特征集,然后将其用于分离最相关的电极和特征,并将这些特征送入支持向量机分类器,以区分发作前和发作间期的EEG片段[30]。用于评估的脑电数据集包括来自同一数据库的17例78次癫痫发作,该方法的平均癫痫发作预测灵敏度为98.68%,错误预测率为每小时0.05假阳性。K-近邻(k-NN)分类器也使用由10名患者的多天记录组成的脑电数据集来评估癫痫发作预测,但提供的癫痫发作预测性能略低,敏感性为73%,特异性为67%[45]。在我们的初步工作[46]中,使用CHB-MIT数据库的所有24个案例,比较了神经网络(NN)、支持向量机和基于C4.5的决策树分类器的发作前分类性能。支持向量机和神经网络的敏感度相近,分别为86.75%和86%,而支持向量机的特异度为84.75%。发现决策树分类器表现不佳,敏感度和特异度降低了约3-4%。
在深度学习算法方面,卷积神经网络(CNN)在癫痫发作预测方面最受关注。在参考文献中使用了由3个块组成的CNN结构,每个块包括归一化层、卷积层和最大池层。47.。从原始脑电信号中提取30s窗口中的频谱信息,然后将频谱作为输入输入到CNN。对CHB-MIT数据库的13例64次癫痫发作进行测试,平均发作预测灵敏度达到81.2%,错误预测率为0.16次/小时。可汗等人。还使用了具有六个卷积的CNN架构来提取特征,这些特征被用来将EEG片段划分为发作前、发作间期和发作类别[48]。作为输入,CNN接收在不同尺度上计算出的每个脑电通道的小波变换的输出。使用相同的数据库进行评估,作者使用了15例患者的18次发作和50次发作间歇记录,平均错误预测率为0.142次/小时,而3次癫痫发作未被预测。来自Freiburg数据库的测量脑电同步的双变量特征也被用来评估5层CNN的癫痫发作预测性能,结果显示它能够预测21名患者中的15名患者的所有测试癫痫而没有错误警报[49]。深层多层CNN还被用于使用空间滤波器(EEG通道的线性组合)来评估来自EEG信号的运动成像任务,所述空间滤波器增强了包含在EEG信号中的类别区分频带功率特征[50]。
相比之下,LSTM网络还没有被用于从EEG信号中预测癫痫发作。然而,LSTM网络最近在专注于脑电分析的其他领域的研究中找到了应用。LSTM模型被用于基于EEG的行为微睡眠和延时检测系统[51,52],该系统使用跨基本频带的频谱能量作为LSTM网络的输入。LSTM网络还被用于从头皮脑电记录中自动检测癫痫发作。文献[1]设计了一种递归卷积神经网络。[53]由4层CNN和LSTM网络组成,4层CNN输入每个EEG通道的频谱信息,LSTM网络具有单层以执行发作期EEG片段的最终分类。在参考文献中还对各种分类算法进行了评估。[54]将LSTM、CNN、隐马尔可夫模型(HMM)、堆叠自动编码器和多层感知器(MLP)以各种配置组合在一起。使用TUH EEG数据集,发现所有配置的癫痫检测灵敏度相对较低,从30%到39%,在某种程度上,这对于患者独立的方法是可望的,CNN-LSTM模型提供了最高的特异度,为96.86%,7个错误警报/小时。结合MLP和LSTM网络的混合模型在自动睡眠阶段分类中的性能也优于支持向量机、随机森林和单一MLP分类器[55]。两层LSTM网络也成功地提高了分类精度,使用四个统计矩作为特征来评估工作负荷。
这项研究中使用的EEG数据来自CHB-MIT头皮EEG数据库[57],该数据库可在PhysioNet.org[58]上开放获取。脑电信号来自波士顿儿童医院23例顽固性癫痫患者(女性17例,年龄1.5-19岁;男性5例,年龄3-22岁;1例性别/年龄数据缺失),以评估其手术干预的可能性。记录分为24个案例,以每秒256个样本的采样频率和根据国际10-20电极定位系统放置的电极的16位分辨率获得。在24例中,大多数脑电信号被分割成1-h长的历元,也可以发现持续2-4h的历元。现有脑电记录的总持续时间约为983h。对于包含发作性活动的脑电时段,临床专家在视觉检查后手动注释癫痫发作的开始和消失时间间隔,总共发现198次癫痫发作。有关EEG数据集的更多详细信息可以在表1中找到。
如数据库的注释文件所示,在24例中的大多数情况下,脑电信号记录的蒙太奇都有频繁的变化,在记录过程中从一个时期到另一个时期添加或移除频道。由于通过交叉验证,所有EEG时段可互换地用于训练和测试,因此只选择在每种情况下在整个持续时间内始终可用的通道进行分析,以减轻数据异质性的影响。总共有18个通道在所有24个病例中保持一致,包括:Fp1-F7、F7-T7、T7-P7、P7-O1、Fp1-F3、F3-C3、C3-P3、P3-O1、Fp2-F4、F4-C4、C4-P4、P4O2、Fp2-F8、F8-T8、T8-P8、P8-O2、Fz-CZ和CZ-PZ。从数据库的整个EEG体积中,只忽略来自病例12的三个时期(即文件“chb12_27-29.edf”),因为这些时期内的频道蒙太奇不包含上述任何频道。因此,在没有去除历元的情况下,用于评估所提出的方法的最终数据集包括大约980h的EEG信号和来自24个病例的185次癫痫发作。、
图1给出了所提方法的概要。除了分离数据集每个案例的文件中可用的18个双极脑电信号通道外,没有应用进一步的预处理,例如噪声/伪影抑制技术。因此,EEG信号被保留为其初始原始格式。对于数据集的每种情况,原始EEG信号最初被分割成5秒长的片段,相邻片段之间没有重叠。每个节段都被分配给发作,发作前,发作间期,使用CHB-MIT数据库中包含的注释文件。包含实际发作活动的发作节段不是癫痫发作预测所必需的,因此,它们被丢弃,导致发作前和发作间期类别之间的二进制分类问题。
然后,通过特征提取模块,提取各种最常用的脑电特征,从每个片段联合产生643×1特征向量。
特征提取模块包括时频脑电分析单元、信号间互相关估计单元和图论中的各种度量,以提供尽可能多的信息特征空间。
图1所示的最后一个模块由LSTM网络组成。先前提取的特征被标准化,然后作为输入提供给LSTM网络。LSTM模型的学习潜力被用来评估每个特征在最终决策中的重要性,因为在分类之前没有单独的特征选择步骤。通过LSTM模型对每个患者的特征空间进行内部评估,该模型学习最具信息量的特征并采用患者特定的特殊性,以产生更有效的、个性化的癫痫发作预测。此外,LSTM网络不是单独地对每个EEG段进行分类,而是接收多个EEG段的更大输入,并将整个EEG段序列分配到发作前或发作间期类别。作为输入提供给LSTM网络的EEG段的数目在训练期间针对每个情况从5段调整到50段。通过使用大量的EEG片段作为输入,LSTM网络可以及时提取EEG信号中的癫痫发作前变化。为了避免过度拟合,分别包含来自在每种情况下可用的整个脑电记录持续时间的发作前和发作间期段的两类内的EEG段被混洗,以便随机选择5-50段的序列,该序列被拟合为LSTM网络的输入。此外,使用分层10倍交叉验证对癫痫发作预测性能进行了评估。通过对用作输入的脑电片段进行改组,LSTM网络被迫学习更一般的发作前模式,因为每个序列都由随机的、不相邻的发作前片段组成,这些片段不仅来自与实际癫痫发作具有不同时间距离的不同位置,而且来自不同癫痫发作的发作前活动。
正如几乎所有长期脑电记录中癫痫发作预测的应用一样,发作前和发作间期类别之间存在高度数据不平衡的问题,因为脑电记录期间的癫痫发作频率可能很低(例如,病例4,156小时的脑电,有4次癫痫发作,表1)。为了克服类别不平衡的问题,同时仍然使用整个可用的EEG数据进行更完整的评估,发作间期的EEG信号被分成与发作前类别的持续时间相匹配的更小的子组。如果将发作间歇类划分为子组导致剩余,则从已完成的发作间隔子组中随机选择EEG段,以填充使用剩余EEG段所需的缺失数据的比例(即,对最后一个发作间隔子组进行过采样)。使用发作前类别和发作间期类别的每个子组之间的分类结果的平均值来评估总的癫痫发作预测性能。
随着所提出的LSTM网络被训练来以特定于患者的方法预测癫痫发作,EEG数据集的每个案例都被单独分析。从每5秒长的EEG段(即,1280个EEG数据样本)中提取在EEG信号分析中使用的各种最常见的特征[59],以便用作LSTM分类器的输入。下面列出了提取的要素,并在表2中进行了汇总
就时间域特征而言,计算了四个统计矩(即均值、方差、偏度和峰度)[56],以及总信号面积、峰峰值(即最小到最大)、过零次数和解相关时间(即,自相关函数的第一次过零的时间)。尽管这些测量方法很简单,但先前已报道在进入发作前状态时会有显著的变化,与各自的发作间隔值相比,方差和去相关时间减少,而峰度在发作开始时增加[60]。
此外,还考虑了脑电信号的频谱信息,因为还提取了各种频域特征,包括总能量谱和跨基本节奏频段(即:增量:1-3赫兹,θ:4-7赫兹,α:8-13赫兹,β:14-30赫兹,伽马1:31-55赫兹和伽马2:65-110赫兹)的能量百分比。除DFT外,还利用Daubechies 4(DB4)作为母小波,应用离散小波变换进行7级分解,以提取细节(64-128 Hz,32-64 Hz,16-32 Hz,8-16 Hz,4-8 Hz,2-4 Hz,1-2 Hz)和逼近系数(<1 Hz)。7级分解是基于在组装CHB-MIT数据库时使用的256赫兹采样频率来选择的,因为它是覆盖基本频带并允许分离最主要被伪像占据的1赫兹以下所需的最小深度。
将最大绝对互相关值作为功能连通性度量,并进一步计算每对EEG通道的最大绝对互相关值,以量化任意两个EEG信号之间的相似性。它的优点在于它考虑了在两个空间距离的信号之间引入的潜在的时间延迟。两个信号之间的最大互相关系数Cxy给出如下:
在这项研究中,图论被用作传统的网络分析方法,基于特定的功能连通性度量,使用加权图和无向图来描述EEG通道之间的功能连通性。后者被定义为一组节点(即,通道)和加权边,其中权重Wij分别连接节点i和j。每个图被表示为邻接对称矩阵W2Rnxn,其中n是单元格为i的节点数;j?等于wij。图是使用滞后索引的互相关值作为连通性度量来构建的,因为在3.3.3中已经计算了这些值,并且使用更多的计算资源来估计替换度量(例如,相位滞后指数、滞后线性相干性)并从头开始构建图将不是理想的。因此,在基本上具有预估图的情况下,可以如下所述提取一组全局和局部特征。
3.3.4.1。局部度量。为节点i计算和描述所提取的本地度量如下:(A)测量节点i的团结性的聚类系数,即,该特定节点周围的相邻连接的密度[61],(B)局部效率,其是另一个被定义为节点i的邻域上的平均逆最短路径长度的分离度量,(C)中间中心性,其定义为通过i的任何两个节点k和l之间的最短路径的数目除以两个节点之间的最短路径的总数[61]和(D)偏心率,其是从节点i到网络中任何其他节点的最长路径。
3.3.4.2。全局度量。提取的全局图度量包括图的特征路径、全局效率、直径和半径。特征路径长度被定义为网络中的平均最短路径长度,其中短路径长度指示更好的功能集成[61]。全球效率衡量网络的整体效率。直径是节点的最大偏心率(最长最短路径),其上界为n-N叶+1,其中N叶 是网络中的叶节点数(即,没有任何连接的节点)。另一方面,半径是最小偏心率(半径越小,反映的网络拓扑越集中)。
由于LSTM模型尚未用于癫痫发作预测,因此文献中没有关于最佳内部结构的参考文献。因此,在本节中执行预分析,测试图2中所示的三种不同的内部体系结构,从简单的网络转移到更复杂的网络。在最简单的LSTM_1体系结构中,网络由具有32个存储单元的单层组成。在第二个体系结构设计LSTM_2中,存储单元的数量增加到128个,保持了单层方法。最后,在LSTM_3中,存储单元的数量保持在128,但也包括另一个相同维度的层。在所有网络之后是具有30个单元的输出的完全连接层,该层使用“RELU”激活功能,以及使用“Softmax”激活,输出二进制分类一个热编码结果(即,发作前或发作间期)的最终致密层。使用自适应矩估计(ADAM)优化器(学习率?0.001,β1?0.9,β2?0.999,衰减率?0),将批次大小设置为10,并选择交叉熵损失函数作为成本函数。LSTM网络是在Python3.6中的TensorFlow 1.4.0后端[63]上使用Kera 2.0.9[62]构建的。
使用来自CHB-MIT EEG数据库的三个随机选择的病例(情况2、14和1)的EEG数据来评估LSTM架构。使用每个病例的所有可用EEG记录的整个持续时间来估计将EEG片段分配到发作前或发作间期类别时的总分类精度。发作前窗口的持续时间设置为15分钟。LSTM输入大小的效果也通过测试10个不同数量的EEG片段作为输入来评估,范围从由5个EEG片段组成的输入序列,LSTM输入大小为643×5个特征,当提供50个脑电片段的序列时,最多643×50个特征。每个LSTM输入大小的每个网络体系结构的分类精度结果如图3所示。报告的三个实验的分类精度是所有发作间隔子组的平均值,以避免类别不平衡,按照第3.2节描述的评估过程,对每个子组使用10倍交叉验证。
图3中的图表提供了关于LSTM体系结构如何影响分类精度的有用见解(除了“CHB_01”,其中所有变体都有~1%的边际)。首先,结果证实了使用更复杂的2层网络的预期优势,因为LSTM_3在总体上提供了最好的分类精度,特别是在情况2和14中。关于LSTM输入的大小,正如在所有三种情况中都可以看到的那样,如果网络不足以处理额外的信息量,那么增加作为输入提供给网络的EEG节段的数量并不一定是有益的,因为LSTM_1和LSTM_2被发现很快饱和,导致分类精度降低。在相同的上下文中,当使用少量的EEG段作为LSTM网络的输入时(即少于20个段),由于考虑的EEG数据量有限,以LSTM_3的形式增加网络复杂性在发现隐藏连接方面没有显著影响。只有当输入段的数量增加到20-30个左右时,LSTM_3网络结构更加复杂,才能充分发挥其潜力,提供更高的分类精度。LSTM输入大小的影响将在第4节中进一步研究,因为较大的发作前窗口在其中被评估。
如图2所示,包括中间丢弃层并没有显著影响分类性能(为清楚起见,图3中未示出结果)。评估包括0.2和0.5的辍学率。在LSTM_3的情况下,发现分类精度基本不受影响,与图3所示的没有丢弃层的结果相比,0.5和0.2丢失率在三种情况下的平均偏差分别为0.02%和0.03%。对于LSTM_2网络结构,丢弃层对分类精度的影响较大,0.5和0.2丢失率的平均偏差分别为0.6%和0.3%。对于较小的LSTM_1网络,两种丢失率的精度差异也在0.06%,这表明在分类前洗牌有助于减轻过拟合,使中间丢失层不那么重要。在这些结果的基础上,第四节将最终使用LSTM_3网络的In结构进行分析(从现在起简称LSTM网络),丢弃dropout层以降低网络的复杂性。最后,使用预先分析的3种情况,在5倍和3倍时使用较少数量的折叠执行交叉验证,导致类似的性能,对于10倍交叉验证,总分类准确值平均在其各自值的0.46%和0.09%内。
根据上面的文献回顾(第2节),在分类之前提取特征似乎比直接使用原始脑电图样本作为分类器的输入更可取。然而,最近也有一些研究没有进行特征提取,而是用脑电图信号训练深度学习模型[64 - 66]。因此,在本节中,还使用原始脑电图信号作为输入来评估所提出的LSTM网络的分类准确性,因为之前没有研究过使用两种方法的评估。从上面的分析中得到的最有效的LSTM体系结构(即LSTM_3)使用了相同的评估过程(即相同的三个案例、平衡类和10倍交叉验证)。
在LSTM输入段数为1 - 50的情况下,对原始脑电图和特征提取方法进行了单段评估。结果如图4所示。
案例1、2和14的特征提取(Features)和特征学习(Raw EEG)的比较。预设窗口持续时间:15分钟。LSTM输入大小:用作输入的脑电图段的数量.
如图4所示,当使用每个5秒段的原始脑电图样本而不是提取的特征向量时,LSTM网络表现严重不佳,无法从内部提取更多或同等有意义的特征。与将EEG信号作为时间序列获取信息相比,特征提取的优点是它提供了一种更简单直接的解决方案,可以从可用通道中获取信号的频率内容或脑区连通性等隐藏信息。理论上,如果大幅度增加LSTM网络的大小,通过增加更多的层数和内存单元,来补偿直接提供脑电图信号所增加的输入大小(即每5秒段1280个样本x 18个脑电图通道),就可以学习到更好的脑电图信号表示。然而,训练更大的LSTM网络的计算成本迅速增加,需要更多的训练时间或使用gpu阵列,在我们的情况下,这使得基于cpu的训练时间需要达到多日持续时间。即使计算成本不是问题,这种方法也需要更多的EEG数据来有效地训练数百万个网络参数。因此,用提取的特征向量来训练LSTM网络,可以让我们的癫痫预测方法在更易于管理的条件下运行,本质上模拟更深入、更复杂的LSTM模型的实现,而不受额外的时间和数据训练限制。
使用CHB-MIT数据库对所提出的方法进行了评估(表1)。测试了4种不同的发作前持续时间,从15分钟到2小时不等。研究了LSTM输入大小对每个患者发作预测效率的影响,以及4.2节中对每个病例的全局输入大小的评估。根据3.4节的预分析结果,预计发作预测的灵敏度会相当高,因此4.1节的重点是尽量减少数据库每一个案例对虚警的误报率。如前所述,类别不平衡的解决方法是将间隔类的EEG片段分割为更小的子组,其大小与前类相同,而报告的评估结果分别使用10倍交叉验证声明每个子组的平均值。
为了增强评估的范围,提供了基于段和基于事件的性能的结果。为估计癫痫发作的预测性能,真阳性率(TP)由被正确识别为癫痫发作前段的脑电图片段数定义,真阴性(TN)由被正确分类为癫痫发作间期的脑电图片段数定义,假阳性(FP)由被错误分类为癫痫发作前段的脑电图片段数定义,假阴性(FN)由被错误分类为癫痫发作间期的脑电图片段数定义。对于表3中基于分段的评估,灵敏度计算为TP/(TP ̄FN),特异性计算为TN/ (TN ̄FP)。对于基于事件的评估,灵敏度定义为通过检测至少一个预测脑电图片段成功预测癫痫发作的数量,错误预测率(FPR)将虚警产生率声明为每小时脑电图记录的FPs数量。
评估分别在持续时间为15、30、60和120分钟的四个预测窗口中进行,并针对数据集的每个病例分别评估作为LSTM网络输入的脑电图片段的大小,以减少错误预测。表3中的结果显示了达到最低FPR所需的LSTM输入大小,每个预设窗口和24种情况中的每一种。在基于段的评价中(表3中的“段”),使用15min前窗对EEG信号进行分类,其平均灵敏度和特异性为99.28%,使用30min前窗对EEG信号进行分类,其平均灵敏度和特异性达到99.37%,分类性能达到99.6%。在基于事件的评估(表3中的“事件”)中,24例中的每一次癫痫发作都被成功检测到两个预测窗口持续时间,平均提供100%的癫痫发作预测灵敏度。FPR在30分钟的预测窗口显著较低,分别达到0.06 FP /h,而在15分钟的预测窗口分别为0.11 FP /h。此外,尽管平均FPR较低,但在使用15分钟预诊窗口的24例病例中,有13例达到100%灵敏度和0 FP /h的完美发作预测率,在使用30分钟预诊窗口的11例中达到了0 FP /h。
将预测窗口增加到60分钟,表3中的结果表明,在每小时脑电图记录的较低的虚警率下,可以实现相同水平的癫痫预测。在基于节段的评价中,节段分类的平均敏感性为99.63%,特异性为99.78%。当使用120分钟前置时间时,灵敏度和特异性指标的分类性能分别达到99.84%和99.86%,分类性能略有提高。最后,在基于事件的评估中,成功检测到两个预测窗口的所有癫痫发作,提供了100%的癫痫预测平均灵敏度。通过将预测持续时间从30分钟增加一倍到1小时,FPR减少到一半(即从0.06 FP /h减少到0.03 FP /h),而零错误预测的病例数量增加到24例中的16例。使用2小时的预发作窗口(平均FPR为0.02 FP /h)和17例零虚警的病例获得了几乎相同的性能,这表明即使从癫痫发作开始的遥远脑电图片段仍然可以包含有价值的信息。
在本节中,通过评估使用预定义数量的LSTM输入段对预测性能的影响,研究了作为LSTM网络输入的脑电图段的潜在全局数量。对FPR的分析表明,LSTM输入大小对假阳性的影响很大。从图5可以看出,LSTM输入规模与FPR成反比(即输入规模越大,错误预测越低)。图5中的y轴显示了从数据库的24个案例中估计出的每一个LSTM输入大小和预设窗口的平均FPR值。利用45个脑电图序列段作为LSTM的输入,得到最小FPR值,15分钟、30分钟和120分钟窗口分别为0.141 F P/h、0.092 F P/h和0.038 F P/h。只有在60分钟前持续时间内,使用40个脑电图片段获得了最低的FPR,但两者之间的差异几乎可以忽略不计,40个输入片段为0.061 FP /h,而45个输入片段为0.062 FP /h。因此,如果在训练阶段没有对LSTM输入大小进行患者特异性调整,45个EEG片段序列可以提供最低的FPR,以减少所需的计算时间。最后,只有15分钟预测窗口未能提供小于0.125 FP /h(即每天3次误报)的FPR值,这在癫痫预测文献中被视为可接受性能的定性阈值。相比之下,任何数量的输入脑电图段大于35,能够提供低于0.125 FP /h的FPR为其他三个前置窗口。
基于分段分析的灵敏度和特异性的等效结果如图6所示。总体而言,与之前一样,每个预设窗口的分类性能随着提供给LSTM网络的脑电图片段数量的增加而提高。在输入到LSTM网络的30 - 45个脑电图片段的范围内,对于所有四个前置窗口,根据前置窗口的不同,15、30、60和120分钟前置窗口的最高灵敏度分别达到了99.42%、99.55%、99.68%和99.91%的相似水平。如图6右侧所示,在相同的30 - 45 LSTM输入尺寸范围内,特异性也达到最大值,在15、30、60和120 min窗口分别达到99.1%、99.4%、99.63%和99.7%。总的来说,图5中的图表表明,灵敏度和特异性值在LSTM输入大小为30段以上达到一个平台,分类性能改进的回报递减。考虑到灵敏度和特异性的变化都在30 - 45输入大小范围内最大值的0.2%范围内,在这一范围内的任何段的选择都有望提供几乎相同的性能。
图5所示。每LSTM输入大小的错误预测率的平均值,FPR (FP/h)CHB-MIT数据库的24个案例的平均FPR显示了每LSTM输入大小。红线表示0.125 F P/h值。(要了解图中对颜色的解释,请参阅本文的网页版本。)
为了展示将深度学习引入癫痫发作预测的优势,本节将与流行的传统分类算法进行比较,使用与基于lstm的方法相同的特征集。评估包括:(a)基于C4.5算法的决策树DT, (b)规则诱导分类算法重复增量修剪减少错误(RIPPER)算法,(c)支持向量机(SVM),这可能是最流行的算法。在使用过滤进行分类之前进行特征选择[67],以减少10次交叉验证中每一次使用的特征数量。对于所有的分类器,特征选择和分类算法都是使用WEKA的内置函数[68]组成的,并使用之前相同的前置窗口将EEG片段分配到前置或间隔类中。
为了进行这一比较,LSTM网络使用第4.2节所述的全局LSTM输入大小进行测试,并将输入段的数量设置为35。图7显示了15分钟和30分钟预报窗口的结果。
LSTM网络在所有24种情况下都能优于传统的分类算法。对于15分钟的前窗口,LSTM分类器在所有24例病例中产生了99.3%的平均灵敏度,而DT、RIPPER和SMV分类器分别提取了88.68%、89.36%和89.37%。在特异性方面的差异相似,LSTM网络达到98.79%,DT达到89.02%,RIPPER 89.9%, SVM得分略高,平均为91.55%。总体而言,LSTM网络与传统分类器相比,灵敏度和特异性值提高了7.2 - 10.6%。将预处理时间设置为30 min不影响LSTM分类器的性能,其平均灵敏度和特异性分别为99.55%和99.4%。然而,其他算法的分类性能有所下降,DT算法的平均灵敏度和特异性分别降至87.26%和87.15%,RIPPER算法的平均灵敏度和特异性分别降至88.3%和88.2%,SVM算法的平均灵敏度和特异性分别降至88%和88.77%。由于传统分类器的性能较差,LSTM网络的灵敏度和特异性分别为11.2 - 12.3%和10.6% - 12.3%。
图8进一步强调了LSTM网络处理脑电数据混沌特性的能力,给出了60分钟和120分钟预设窗口下的评估结果。将预处理时间设置为60 min时,DT算法的平均灵敏度和特异度分别下降到85.92%和85.48%,RIPPER算法的平均灵敏度和特异度分别下降到87.46%和86.32%,SVM的平均灵敏度和特异度分别下降到86.93%和85.87%。相比之下,LSTM的表现保持在相似的水平,平均灵敏度为99.62%(即高12.2 - 13.7%),平均特异性为99.49%(即高13.2 - 14%)。使用120分钟的前置持续时间窗口,LSTM网络在24例病例中进一步领先,平均报告了99.86%的敏感性和99.59%的特异性,而DT、RIPPER和SVM的敏感性分别为84.54%、85.83%和83.51%,特异性分别为83.29%、83.95%和83.57%,提供了高达16.35%的性能。
最后,为了为上述分类算法的分类性能提供一个参考点,我们还对来自Weka内置函数的两个基本和简单的分类器进行了评估,即Naïve Bayes和OneR,。它们各自的分类性能平均比三种传统分类算法低10.4 - 13.54%(其中Naïve贝叶斯比OneR约好4%),随着前置时间的增加,分类性能下降,比LSTM网络的分类性能低26.7%。
评估结果表明,所提出的癫痫发作预测方法能够提供可靠的性能,能够预测包括在CHB-MIT数据库的注释文件中的所有185个癫痫发作(事件),同时保持非常低的虚警率每小时检查的EEG信号。如果训练阶段的持续时间不是问题,表3中的结果显示,建议的LSTM体系结构能够提供0.11-0.02fP/h的平均FPR,随着发作前持续时间窗口从发作前的15分钟增加到发作前的2小时,错误警报减少。此外,根据发作前窗口的持续时间,LSTM分类器能够在数据库的24个病例中的11-17个病例中提供零错误警报。为了提供所提出的方法这个水平平均需要30-45个EEG段的输入序列或大约150-225s的EEG活动(即每个片段的持续时间为5秒)。如果不执行患者特定的适应,最佳的EEG段输入数量约为35-45段,特别是癫痫发作预测性能不受发作前窗口持续时间的影响。因此,根据评估结果,所提出的方法预计可以以0.038–0.141的错误预测率预测所有癫痫发作,而无需在每个新患者的训练阶段进行进一步的LSTM网络架构调整或干预。
通过对范围从15分钟到2小时的四个不同的发作前窗口的评估变得显而易见,所提出的方法的优点在于,即使在发作前持续时间增加时,它也可以提供相似水平的发作预测性能。
此外,考虑到在评估中使用的24个案例中,有17个案例实现了零错误预测率,这有力地表明癫痫发作预测非常准确,几乎没有错误警报。此外,随着初始窗口持续时间的增加,发现LSTM网络提供了更低的错误预测率,从15分钟窗口的0.107 F P/h下降到使用120分钟窗口的0.02 F P/h(表3),伴随着分别高达≥0.6%的灵敏度和特异性值的稍高比率。此外,报告了类似水平的癫痫发作预测性能,而不管每个病例中可用癫痫发作的数量,这直接影响可用于训练和测试的EEG样本的数量。基于这些事实,发现所提出的方法能够在不同条件下实现高水平的癫痫发作预测,增加了其在现实生活临床环境中处理癫痫发作预测的鲁棒性和能力。
关于发作前状态的实际持续时间,本研究中评估的四个前窗的结果表明,与即将发作相关的脑电图活动可能在实际发作前数小时开始。随着发作前窗口的增长,发作预测性能的增加是显而易见的,这表明使用更长的发作前窗口导致捕获了在每次发作之前表现出的EEG活动中的大多数发作前相关变化,使得发作间信号较少被类似的发作前相关活动污染。结果,LSTM网络能够有效地对发作前和发作间期段进行分类,具有更少的错误预测,因为当考虑更长的发作前持续时间时,这两个类别变得更加可区分。
与传统的机器学习技术(如决策树、规则诱导器和SVM)相比,所提出的方法以及深度学习算法的影响得到了进一步增强。对这三种流行的分类算法的分析表明,LSTM网络能够提供分类性能的显著提高,结果显示从≥7.2%到高达≥16.4%。然而,除了纯粹的分类性能增益之外,LSTM分类器的最大成就是其保持99%以上的灵敏度和特异性的能力,这定性地转化为非常低的FPR,同时每个癫痫发作也被成功地预测。
例如,较低的97%的平均值仍然与传统分类算法所能达到的有相当大的差异,但不足以提供期望的错误预测率,迫使采用更严格的方法,这可能最终导致癫痫发作错过发作前警报,从而无法预测。
表4给出了所提出的方法与深度学习和来自文献的其他分类算法的比较。比较的重点是已经用CHB-MIT EEG数据库评估的研究,因为这是目前唯一由长期记录组成的公共数据库,允许更容易的外部验证。所提出的LSTM分类器能够提供比任何先前的方法更好的癫痫发作预测性能,所述先前的方法已经被提出并使用相同的EEG数据集、使用相似的发作前持续时间窗口进行评估。每项研究中使用的特征也在表4中列出。除了图论特征之外,其余提取的特征已经在先前的研究中成功地用于癫痫发作预测,并且根据我们的结果,它们的组合创建更具信息量的特征空间在分类性能上提供了显著的优势。
事实上,这是首次利用CHB-MIT数据库的全部内容进行完整评估,包括24个病例的所有脑电图记录,因为除了[69]之外,其余大多数研究中仅使用了一小部分可用记录。如前所述,这是第一项将LSTM网络引入癫痫预测应用的研究,因为在参考文献中之前只研究了卷积神经网络(CNN)。[47,48],表现出较低水平的癫痫发作预测性能。这些结果证明了LSTM网络在基于脑电图的癫痫发作预测中的优势,扩大了LSTM对CNN的领先优势,这一优势之前已在不同的、与癫痫发作预测无关的脑电图应用中报告过[19–22]。最后,CHB-MIT数据库似乎对癫痫发作预测更具挑战性,如参考文献中的结果。[34]和[48]在使用私人EEG数据集评估相同方法时,效果明显更好。
这项研究的局限性在于评估过程的框架内,因为发作前脑电图片段的有限数量导致我们应用片段重排来减少过度拟合的影响,并迫使LSTM模型从发作前状态的整个持续时间中提取更通用的发作前信息。这种方法不允许评估平均预测时间(即从第一次发作前片段识别到实际发作的持续时间)。朝着这个方向,类似的癫痫发作预测系统将及时隔离发作前模式,并随着癫痫发作开始时间的减少(例如,发作前1-2小时、30分钟至1小时、15-30分钟等)在多个时区提供不同的警报。)将有助于更准确地预测癫痫发作并减少错误预测,这是我们未来工作的计划。
随着EEG数据的数量和复杂性的增加,深度学习算法开始展示其在处理EEG信号的混沌特性方面的能力,并在具有挑战性的生物医学应用(如癫痫发作预测)中开辟新的机会。
本文将长短期记忆网络(LSTM)引入癫痫发作预测,并证明它是分析发作前脑电信号的理想工具。在从15分钟到2小时的每个发作前持续时间测试中,所提出的方法能够提供可靠的发作预测性能,具有以前从未达到的发作预测和虚警率。所提出的方法需要在临床实践中用更多的EEG数据进行广泛测试,因为CHBMIT数据库主要由儿科受试者组成,但本研究的结果强烈表明其作为癫痫的有效预测工具的有效性及其对个体的及时干预。