002基于小波的多类癫痫类型分类系统-2021

WAVELET-BASED MULTI-CLASS SEIZURE TYPE CLASSIFICATION SYSTEM

ABSTRACT

癫痫是最常见的脑部疾病之一,影响着全球1%以上的人口。它的特点是反复发作,发作类型不同,治疗方法也不同。脑电图(EEG)通常用于医疗服务诊断癫痫及其类型。癫痫发作的准确识别有助于为患者提供最佳的治疗和准确的信息。然而,癫痫发作的手工诊断程序是费力和高度专业化的。此外,脑电图人工评价是一个专家之间具有较低的评价一致性的过程。本文提出了一种利用双树复小波变换(DTCWT)从脑电图信号中提取特定特征并对其进行分类的新自动化技术。我们在TUH脑电图发作语料库(TUSZ) ver1.5.2数据集上评估了提出的技术,并根据类不平衡发作类型使用总体f1评分与现有的最先进技术进行了性能比较。我们提出的技术获得了最佳的加权f1评分结果,分别为99.1%和74.7%的癫痫和患者分类,从而为该数据集设置了新的基准结果。

关键词 双树复小波变换·(DTCWT)·脑电图(EEG)·癫痫·轻tgbm·癫痫类型分类·小波变换

1 Introduction

1.1 Background背景

癫痫是中风[1]后儿童和成人中最普遍的脑部疾病。它被定义为“一种突然和反复发生的大脑功能障碍,是一种反映大脑内神经元过度和超同步活动的疾病”[2]。世界上有6000多万人口被诊断患有癫痫,其特征是反复发作。这种癫痫发作会损害大脑的正常功能,使患者变得脆弱和不安全。

癫痫在医学上分为两大类:局灶性癫痫全局性癫痫,这取决于大脑的哪个区域受到影响的程度。局灶性癫痫是一种起源于并影响大脑某一特定区域的癫痫。根据患者的意识水平,局灶性癫痫可进一步分为单纯或复杂。

另一方面,广泛性癫痫则涉及大脑的大部分区域。基于运动性和非运动性症状,癫痫的广义分类可分为失神、强直、无张力、阵挛、强直-阵挛或肌阵挛发作[3,4]。癫痫的分型对准确诊断和治疗非常重要。

确定癫痫发作的类型虽然有时很困难,但可以通过临床观察、参考病史和人口统计信息来完成,并得到脑电图(EEG)、脑磁图(MEG)和功能磁共振成像(fMRI)等通用脑成像技术的支持[5,6]。脑电图是目前诊断癫痫最实用、最经济的工具。通常需要视频脑电图监测来支持癫痫分级[8]的决定。

就治疗而言,在大多数情况下(高达70%)的患者,癫痫可以通过服用药物来达到血液中的稳定浓度来控制。对于某些情况,手术干预是另一种选择。对于高达20%的癫痫患者,没有现有的药物治疗来控制癫痫发作[2]。癫痫发作类型的准确识别会影响药物的选择,并为照顾癫痫患者的患者、家属、研究人员和临床医生提供信息[4,9]。

准确地对癫痫的类型进行分类是一项具有挑战性的任务。有几个因素使分类变得困难。首先,某些类型的癫痫发作具有相同的临床和脑电图症状。例如,研究表明,即使是经验丰富的神经学家,有时也很难区分局灶性癫痫和全身性癫痫。其次,在某些情况下需要进行长期监测(即视频脑电图监测),可能持续数天[7]。

因此,手工分析这些长记录需要神经学家大量的努力和时间。

此外,信号判读具有低评级者之间的协议,这完全取决于专家的专业水平。此外,受试者间的差异性显著增加了与癫痫发作诊断相关的困难,导致不同患者出现同一类型癫痫发作的各种表现,有时随着时间的推移出现同一个体。最后,信号伪影也阻碍了脑电图的正确判读。面对这些挑战,在一个已经缺乏医疗保健专家的领域,计算机辅助诊断(CAD)方法在支持这种严重疾病的诊断决策方面具有巨大潜力。

1.2Review of related work相关工作的评审

在癫痫自动检测和预测方面已经发表了大量的研究。然而,由于两个主要原因,癫痫发作类型的自动分类很少受到重视。首先,癫痫发作类型分类问题固有的困难,其次缺乏临床数据[11]

自本世纪初以来,相当多的研究成果集中在癫痫发作诊断的自动化[8,9]。通常情况下,自动截获分析的过程包括两个阶段:特征提取和分类。提出了多种时间特征提取方法,包括时域[13]、频域[14]和时频域[15]。

由于同时包含时间和频率特征,时间-频率方法最近变得流行起来。在时频方法中,基于小波变换(Wavelet transform, WT)的特征提取是最有前途的从脑电信号[16]中提取鲁棒特征的方法。基于小波的eeg特征提取策略有连续小波变换(CWT)[17]、离散小波变换(DWT)[18]、小波包分解(WPD)[19,18]、可调q因子小波变换(TQWT)[20]和对偶树小波变换(DTCWT)[21]。

关于临床数据的可用性,据观察,在过去几年里,医院和大学通过生成大量公开可用的临床脑电图数据,做出了值得赞赏的努力,以鼓励癫痫发作的自动诊断研究。天普大学医院脑电图库(TUH EEG)是公开获得的最广泛的脑电图数据之一,由14000名受试者组成,有超过25000个临床记录[22]。语料库有不同的子集;每一个都专注于不同的研究兴趣范围。TUH脑电图发作语料库(TUSZ)[23]是其中的一个子集,它的创建是为了利用机器学习算法[23]的进步来促进开发高性能癫痫发作检测算法的研究。该数据集是根据神经学家的档案报告和坦普尔大学的学生和神经学家[23]对信号的仔细检查手工注释的癫痫发作事件。TUSZ中的发作事件被标记为八种不同类型的发作:局灶性非特异性发作(FNSZ)、广泛性非特异性发作(GNSZ)、单纯性部分发作(SPSZ)、复杂性部分发作(CPSZ)、缺失性发作(ABSZ)、强直性发作(TNSZ)、强直性阵挛性发作(TCSZ)和mayocclinc发作(MYSZ)。这些标签的详细信息见表1。语料库团队不断更新语料库,表2展示了TUSZ最后两个版本的数据分布。

002基于小波的多类癫痫类型分类系统-2021_第1张图片

002基于小波的多类癫痫类型分类系统-2021_第2张图片

据我们所知,我们发现只有8项已发表的研究使用TUSZ来研究癫痫类型的分类问题,摘要见表3。对于七(7)种癫痫分类,Roy等人[9]运用极值梯度增强(XGBoost)和KNN将EEG信号分为七类癫痫发作。研究报告XGBoost和K-Nearest neighbour (KNN)的f1得分分别为85.1%和90.1%。

同样,Aristizabal等人开发了一种名为神经记忆网络(NMN)的深度学习模型,用于对七种癫痫类型进行分类。f1评分94.50%。在另一项与七类问题相关的研究中,Asif等人[11]应用了一种名为SeizureNet的深度学习框架,采用集成学习和多个densnet实现了95%的f1评分结果。

 Raghu et al.[25]使用预训练的谷歌's Inception 3提取脑电图图像特征,并使用支持向量机(SVM)对其进行分类,在7种癫痫发作类型与正常类之间实现了88.3%的准确率。同样,在[26]中,基于短时傅里叶变换(STFT)技术,应用卷积神经网络(CNN)模型AlexNet对EEG图像进行分类,对7种类型的癫痫发作和非癫痫发作类进行分类。该研究的准确性为84.06%。Liu et al.[8]应用混合双线性模型,包括CNN和Long - Short-Term Memory (LSTM),对8种类型的癫痫发作进行分类。f1评分97.4%。

对于癫痫发作的4类分类,Wijayanto et al.[27]将经验模态分解(EMD)应用于EEGs进行特征提取,二次向量机进行分类。该研究报告准确率为95%。在另一项研究中,Ramadhani et al.[28]将EMD、Mel频率倒谱系数(MFCC)和独立成分分析(ICA)应用于EEG数据进行特征提取,并对4类癫痫发作进行SVM分类,准确率达到91.4%。对于3类癫痫分类,Saric等人开发了一种基于现场可编程门阵列(FPGA)的框架,使用前馈多层神经网络对广泛性和局灶性癫痫发作进行分类,并实现了95.14%的准确率。

002基于小波的多类癫痫类型分类系统-2021_第3张图片

尽管在上述研究中报告了良好的性能,但预计报告的技术不能用于现实世界的情况,因为研究要么没有报告在新患者的数据上测试时的性能,要么报告了较低的性能。在表3中列出的八项研究中,只有两项研究[9,11]考虑了他们提出的技术的泛化。两项研究都提到了系统性能的显著下降,其中性能下降了45%。这表明,在提高分类系统的泛化能力方面还有很大的进步空间。

有趣的是,从表3中可以观察到,这些研究的作者选择了不同数量的癫痫发作类别,从3类问题到8类问题的癫痫发作类型分类。在这些研究中,大多数都没有讨论班级数量选择背后的原因。[9,11,24,25,26]的作者从他们的实验中排除了癫痫发作类型MYSZ,因为这种类型的信号只记录在两名患者身上(见表2)。然而在[8]中,作者选择利用数据集中的所有癫痫发作类型,而不管患者的数量。表3列出了每个研究的癫痫发作类型。

从表1可以看出,TUSZ中有6种特异性发作类型和2种非特异性一般发作类型。

从病理学的角度来看,这些类型并非完全脱节,而是形成了一个层次的子组[4,24]。

[7]中指出,当没有足够的证据确定癫痫发作的类型时;语料库团队倾向于根据癫痫发作的病灶性和局部性[23]将一个事件标记为病灶非特异性或泛化非特异性。这两种类型在医学上没有区别,而SPSZ和CPSZ是FNSZ的更具体类型,而ABSZ、TCSZ、TNSZ和MYSZ是GNSZ的更具体类型[4,24]。因此,考虑标签FNSZ作为针对特定焦点类型CPSZ和SPSZ的唯一类型的发作可能会导致分类器不能很好地执行,对GNSZ的分类也是如此。

因此,在本研究中,我们考虑了两个不同的分类问题。在第一个问题中,将数据集中的每个标签视为唯一的发作类型,并将结果与现有的最先进的结果进行比较。

然而,第二个问题是引入了一个新的挑战,这在病理学上更重要,它涉及特定的癫痫发作类型分类,以研究TUSZ(5类分类)中非特异性标签的影响。

为了解决上述问题,我们提出了一种基于小波的机器学习方法,用于多通道脑电图记录的癫痫类型自动分类。我们只利用脑电信号数据,利用DTCWT将脑电信号分解成不同层次的成分,从这些分解的成分中提取特定的特征。我们使用移位不变的DTCWT对生物医学信号进行特征提取和分类,这在癫痫类型分类中尚属首次。此外,我们在最大的癫痫发作脑电图数据库上测试了我们提出的技术,其中包含各种类型的癫痫发作。为了确保我们的技术的有效性和泛化,除了常规测试外,我们还对我们提出的技术进行了全面的跨主题测试。实验结果表明,我们提出的新技术对癫痫发作类型的分类都有很好的效果。

本文的其余部分组织如下:第2节讨论了本研究中使用的数据信息和我们提出的技术的细节。第三部分是评价方法和对所得结果的分析。第4节提供了详细的讨论。第五部分是文章的最后部分,提出了未来的研究计划。

2 Methods

2.1 Data数据

我们的研究是基于TUSZ的。1.5.2 dataset[23],这是2020年发布的最大的公开可用数据集。该数据集包括3050起癫痫发作事件,包括来自300多名不同患者的各种癫痫发作形态和记录。TUSZ来自天普大学医院(TUH)的历史医院数据,其中临床脑电图数据被检索并存储为。edf格式。信号记录采用10/20系统。表2给出了TUSZ的分布细节。根据电图、电临床和临床表现对脑电信号进行标注。关于该数据集的更多细节可在[23]中找到,该数据集可在语料库网站1在线获得。癫痫发作型MYSZ被排除在我们的研究之外,因为它在数据集中很少,因为它在最近发布的版本中只记录了两名患者。如前所述,这一决定是根据先前在相同领域[9],[11],[24]-[26]的研究。

2.2 Proposed technique提出的技术

我们提出的方法包含多个步骤,包括数据预处理,提取重要特征,然后对它们进行分类。我们提出的技术的体系结构如图1所示,所有步骤都在下面解释。

https://isip.piconepress.com/projects/tuh_eeg/

002基于小波的多类癫痫类型分类系统-2021_第4张图片

2.2.1 Preprocessing 预处理

TUSZ采集自天普大学医院的档案数据,临床脑电图数据从CD rom中恢复并保存为EDF格式[23]。所有的数据并不具有相同的蒙太奇和抽样率。因此,在特征提取之前,我们执行了一些初始过程来泛化输入数据。首先,从数据集中提取与癫痫发作相关的脑电图片段;这是使用数据集中提供的注释文件实现的,包括每个发作事件的开始和停止时间。由于数据集中缺乏发作类型MYSZ,因此我们排除了它。在提取癫痫发作事件后,我们使用横中央顶叶(TCP)蒙太奇来强调尖峰活动[9]。蒙太奇是对数据的差分视图,它包括对从两个电极(例如Fp1-F7, F7-T3)[30]收集的信号进行差分。事实上,神经学家对解释脑电图时使用的蒙太奇类型非常讲究[30,31]。天普大学医院(TUH)也报道了同样的情况,并提到它有助于通过不同信号来降低噪声[31,30]。不同的蒙太奇选择实验已经在[30,32]中完成,TCP被发现是最有效的蒙太奇,可以帮助不同的机器学习算法检测癫痫。其次,我们在250Hz下重新采样了所有的录音。

最后,我们将每个提取的信号裁剪成相同的不重叠的段,这样每个段的长度为2秒。这一选择受到[9]的影响,其中作者研究了不同的窗长,他们报告说信号的两秒窗长是实现最佳分类结果的最优选择。综上所述,我们依次采取以下预处理步骤,对输入数据进行泛化处理:

1. 使用横向中央顶叶(TCP)蒙太奇来强调尖峰活动。表4给出了我们研究中考虑的脑电图通道。

2. 以250Hz重新采样所有录音。

3.将信号裁剪成同样不重叠的段,这样每个段都是2秒,结果是500个数据点

在初始预处理步骤之后,输入数据被泛化并准备进行处理以进行转换

002基于小波的多类癫痫类型分类系统-2021_第5张图片

2.2.2 Feature extraction特征提取

小波变换(Wavelet Transform, WT)方法已经成功地应用于解决各种非平稳信号问题[16,33,34],包括EEG[19]。WT是一种谱估计方法,它提供了信号在不同尺度分量下的另一种表示。离散小波变换(Discrete Wavelet Transform, DWT)是小波变换最流行的技术之一,它通过与滤波器组的卷积将给定的信号x[k]分解为相互正交的小波集合。对于j级分解,信号x[k]通过两个带通滤波器:高h[。和低l[.]从j = 1开始。

每个级别的输出是两个向下采样的组件:近似Aj和细节Dj,表示为:

 002基于小波的多类癫痫类型分类系统-2021_第6张图片

逼近分量Aj可以进一步分解为另一个级别的Aj+1和Dj+1,如图2所示,直到达到j的最大值或所需级别。

002基于小波的多类癫痫类型分类系统-2021_第7张图片

 三尺度水平离散小波变换(DWT)结构。

 小波变换有许多成功的应用,但也存在高频分量信息不足、漂移方差大、方向性低、缺少相移等缺点。随着时间的推移,引入了不同的增强来弥补DWT的缺点。双树复小波变换(DTCWT)是由Kingsbury[35]提出、Selesnick等[36]发展起来的小波变换的延伸。它使用额外的双低通滤波器和另外两个高通滤波器在每个级别产生四个分量,其中包括实部和虚部。DTCWT可以想象为两个并行的dwt,如图3所示。该变换在二维及更高维度上近似位移不变和方向选择性,在模式识别和信号分析等应用中具有非常重要的意义。因此,与DWT相比,DTCWT的移位方差更小,方向性更强。

在我们提出的技术中,我们使用DTCWT,使用Python库DTCWT[37]2,将EEG信号分解为四个级别。根据经验性能和计算效率,对不同的分解级别参数进行实验,通过试错的方法手动设置分解参数。分解过程产生复小波系数的实部和虚部,并选取复系数的幅值。在分解之后,我们从每个系数中计算出一组统计特征。计算特征及其相应的数学表示如下。数学表示中,M为信号在各子带中的长度,本研究取500,Y {y1, y2, ....yM}和Z{z1, z2, ....zM}是两个相邻子带[38]。

https://github.com/rjw57/dtcwt/tree/0.12.0

002基于小波的多类癫痫类型分类系统-2021_第8张图片

 1. 各子带系数的绝对值均值(MA V),µ。

2. 每个子带系数的平均功率(A VP) λ

 3.各子带系数的标准差(SD), σ

4. 相邻子带的绝对平均值(RMA V)比值,χ

 5. 各子带系数的偏度(Skewness, skew) φ

6. 各子带系数的峭度(Kurt), φk

 

与此区间信号对应的所有统计系数的特征被叠加在一起,形成6×5(统计特征x DTCWT系数)特征矩阵。我们在TCP蒙太奇中有20个通道,如表IV所述。因此,我们得到的特征矩阵大小为20 x 6 x 5(通道数量x统计特征x DTCWT系数),它被扁平为1 x 600向量进行分类。

 2.2.3 Feature analysis

我们分析了所涉及的特征,以了解DTCWT提取特征的重要性。我们使用了两种特征分析方法:方差分析(ANOVA)过滤和LightGBM特征重要性评分

在这两种技术中,选择最重要的特征,如5、10或20个最重要的特征,无论选择的特征的数量如何,总是会导致分类结果的下降。图4和图5分别是采用ANOV A和LightGBM特征重要性的DTCWT得到的特征结果。我们分析了提取的特征通道,并提出了所有这些通道的特征的平均值。从已有的结果可以看出,在我们的技术中,DTCWT提取的所有特征都对提高分类性能有重要作用。 因此,我们使用了所有的特征,因为我们相信所有的特征都有助于提高分类结果。

002基于小波的多类癫痫类型分类系统-2021_第9张图片

002基于小波的多类癫痫类型分类系统-2021_第10张图片

纵轴为5×6个特征

 2.2.4 Classification分类

如第1节所述,我们在两个分类问题中定义了我们的问题:(1)7种癫痫发作类型的分类,包括TUSZ中的特异性和非特异性癫痫发作类型(见表1);(2)5种癫痫发作类型的分类,只包括特异性癫痫发作类型(见表1)。

对于这两个问题,我们都使用了Light Gradient Boosting Machine (LightGBM ver)。3.2.1)分类。LightGBM是一种基于树的学习算法的梯度提升决策树框架。它被证明是处理大数据量的最佳选择,因为它是内存高效,训练更快,并提供高精度[39]。LightGBM的主要特点是它使用基于梯度的单边采样(GOSS)来寻找最佳分割值。此外,在LighGBM中使用了专属特征捆绑(EFB)技术来降低特征空间复杂度,并且在LighGBM中树的生长是叶向生长,从而使训练[39]更快。在最近一项针对异常检测[19]的脑电图二元分类研究中,对不同的分类器进行了测试,发现LightGBM在结果和训练速度[39]方面是最有效的分类器之一。因此,我们选择LightGBM进行分类

3 Results

在本文中,我们使用TUSZ EEG语料库ver.1.5.2来测试我们提出的癫痫类型分类技术。首先,我们采用了一些预处理方法来去除噪声和增强脉冲活性。然后采用DTCWT特征提取方法,最后采用LightGBM机器学习方法进行分类

3.1 Experimental settings实验设置

实验使用16gb RAM、255gb SDD、3.6 GHz CPU、Windows 10操作系统的台式计算机。The technique is developed in Python 3.7. 使用DTCWT Python包库。0.12.0

3.2 Performance evaluation绩效评估

从表2可以看出,TUSZ多类数据集存在类不平衡的问题,类分布变化明显。与其他类相比,FNSZ、GNSZ和CPSZ类在数据中拥有更多的实例。由于这种不均匀的类分布,仅靠精度不能代表所提出的技术的性能。因此,我们使用平均加权f1得分来评估我们提出的技术的性能。事实上,我们报告了平均加权敏感度、特异性和科恩Kappa分数。如前所述,我们将我们的技术应用于两个不同的分类问题:7类分类和5类分类。此外,我们还对我们的技术进行了癫痫发作和患者交叉验证分类的测试。在检获交叉验证中,我们使用了受最新技术[8]启发的分层5倍交叉验证,该技术将整个数据集中的类的比例随机分配到5倍。这也将确保与现有的最先进的研究研究进行公平的性能比较。对于患者的交叉验证,我们采用了Asif等人[11]的验证技术,他们在患者之间应用了3倍交叉验证。在这种情况下,表2中的数据被分成三部分。所选的癫痫发作类别包括至少三名患者的数据。因此,这确保用于测试的数据总是来自不同的患者,其数据从未在训练阶段使用过。

3.3 Experimental results实验结果

在本节中,我们将比较两种评估场景的结果。我们展示了我们提出的技术在7类问题上的表现,然后是5类问题的每个癫痫和患者验证

3.3.1 Seizure-level cross-validation

对于这两个分类问题,我们进行了5次交叉验证。对于一个7类问题,我们提出的方法获得了加权平均f1得分96.04%。图6展示了数据集中所有5次折叠中每个类的F1-score分类性能,图8展示了我们提出的技术在7类分类问题上的性能混淆矩阵。

002基于小波的多类癫痫类型分类系统-2021_第11张图片

 002基于小波的多类癫痫类型分类系统-2021_第12张图片

对于5类问题,当只考虑癫痫发作的具体类型时(见表2),我们的方法获得了99.1%的加权平均f1得分。这意味着数据集中的非特异性捕获对机器学习算法的性能有很大的影响,因为结果提高了超过2%;我们将在后面的部分中对此进行更详细的讨论。图7和图9分别为数据集中所有5倍分类问题中每个类的f1 -得分分类性能图和5类分类问题的混淆矩阵图。

002基于小波的多类癫痫类型分类系统-2021_第13张图片

 提出的技术在5类分类问题上的表现,每个类具有5倍交叉验证。

002基于小波的多类癫痫类型分类系统-2021_第14张图片

 具有5次交叉验证的5类分类问题的混淆矩阵:第一到第五次(从左到右,从上到下)

此外,所提出的技术在f1得分、敏感性、特异性和Cohen’s Kappa方面对每个折叠和两个分类问题的表现结果如表5所示。 

002基于小波的多类癫痫类型分类系统-2021_第15张图片针对7类和5类问题,所提方法的加权平均特异性、灵敏度、Cohen’s Kappa和F1评分均为5倍

3.3.2 Patient-wise cross-validation交叉验证

对于患者的交叉验证,进行了3次交叉验证。我们首先针对一个7类问题评估了我们的方法,我们提出的技术获得了56.22%的f1加权平均得分。同样,对于5类分类问题,本文方法的性能显著提高,加权平均f1得分达到75.97%。

4 Discussion

表3列出了用于癫痫发作类型分类问题的最新技术。很难将我们提出的技术与文献中现有的研究进行比较,因为每个研究选择了不同数量的癫痫类别。因此,我们选择了考虑3类以上的所有最先进的研究,并将我们的技术与它们的性能进行了比较,如表6所示。

002基于小波的多类癫痫类型分类系统-2021_第16张图片

从表6可以看出,在癫痫发作级别和患者级别分类中,我们提出的技术在特定发作类型分类上的表现是所有技术中最好的,f1得分分别为99.1%和74.7%。对于7类问题,[11]使用三个densenet的集成体系结构报告f1得分为96.0%。同样,[24]和[9]中f1评分分别为94.5%和90.1%。我们提出的技术优于所有现有的研究,考虑到相同的七类癫痫发作。

对于一个八类问题,[25]和[26]都提出了基于cnn的解决方案,准确率分别为84.06%和88.3%。类似地,Liu等人[8]报告了由两个特征提取器模型CNN和LSTM组成的对称双线性深度学习模型获得的f1得分达到97.4%的高结果。这项研究证明了测试的局限性。如[8]所述,数据集中考虑的1秒段有50%的重叠,这总是有数据泄漏的可能性。

表6中提到的大部分工作都是基于快速傅里叶变换(Fast Fourier Transform, FFT)[9,11,24],其频域分辨率高,时域分辨率为零,这对于脑电信号处理[41]是非常必要的。其他方法[8,42,25]基于短时傅里叶变换(STFT),这是克服FFT局限性的已知解决方案。短时傅里叶变换分析信号在特定短时间内的频率,以避免丢失时间信息。但是,由于使用了固定的窗口长度和固定的基函数[41],STFT无法捕捉到尖锐的信号事件。

另一方面,我们提出的技术克服了这些缺点,提供了脑电图信号的平滑表示。它能够生成与脑电图信号中发作类型潜在结构有较强相关性的详细特征。此外,与其他经典机器学习技术相比,我们提出的方法也展示了非常高的分类结果[9,27,28,29]。此外,表6中提到的所有研究都使用了TUSZ的旧版本,即1.4.0版本,而当前版本的癫痫事件数量比前一个版本要大得多,如表2所示。TUSZ vs .1.5.2是一个更具挑战性的新版本,包含1000个额外的发作事件,与现有技术相比,我们提出的方法在7类分类问题上取得了更好的结果。

文献中的大多数研究只选择在发作水平上评价他们的方法。在表3所示的八项研究中,只有[9,11]考虑了模型对不同患者的泛化,换句话说,模型是根据不同患者的数据进行训练和评估的。这保证了模型的性能是通用的,可以适用于不同的患者。当使用患者交叉验证技术进行评估时,两项研究[9,11]的性能急剧下降,如表6所示。相比之下,我们提出的方法在7类问题上表现出了具有竞争力的结果,并且在5类问题的不同患者中表现出了更稳定的性能。在7类和5类问题的分类中,我们提出的方法分别获得了56.22%和74.7%的f1得分。

对于[21],采用DTCWT从脑电图中提取特征,对癫痫病人与非癫痫病人进行分类;然而,在本研究中,我们使用具有不同特征的DTCWT来解决一个更复杂的问题,即癫痫发作类型的识别,包括特异性和非特异性局灶性和全泛性癫痫发作。此外,我们在最广泛的可用脑电图数据集TUSZ ver.1.5.2[23]上评估了该技术在癫痫和患者方面的效果,该数据集包含了超过300名患者的数据。[21]中,仅从21名受试者中获得用于评估的数据。本研究探索了我们的技术在不同患者间的泛化评估,以获得更好的泛化能力。

除了评估,我们推测,当只考虑脑电图信号时,将主要癫痫发作类别作为独特的癫痫发作类型相对于其任何子类型是不合适的。由于SPSZ和CPSZ都是局灶性癫痫的子类别,训练机器学习算法来区分它们是不合理的。

根据数据集,将事件标记为局部非特异性发作的原因是缺乏做出决定的信息[23]。在排除非特异性癫痫发作标签后,实验结果显示分类器在不同患者中的稳定性如表6所示。在癫痫发作水平评估时,我们提出的针对特定癫痫发作类型分类的技术表现出近乎完美的结果,与[9,11]相比,该技术对新患者记录的信号具有更好的泛化能力。因此,当仅利用EEG数据时,将TUSZ中的非特异性癫痫发作标签作为唯一的癫痫发作类型,并不能揭示有意义的结果。相反,必须包括神经学家在诊断时寻找的临床特征(例如,视频脑电图监测)。通过这样做,机器学习算法知道将一个事件标记为非特定的原因,因为没有足够的信息来做出决定。这超出了本文的范围,因为我们只关注利用脑电图数据。通过了解医学上的其他特定发作类型在某些点上要么是集中的要么是普遍的,我们从实验中排除了非特异性标签,反过来,结果显示了高而稳定的性能。

在患者交叉验证过程中,我们注意到大多数SPSZ型癫痫发作事件被归类为CPSZ。同样,从医学角度来看,我们可以将这种错误分类与以下事实联系起来:如文献[4,23]所述,局灶性CPSZ和局灶性SPSZ之间的差异主要由临床特征决定。因此,在这种情况下考虑神经学家的报告可能有助于区分两种类型。此外,由于大多数癫痫症状是由年龄决定的[2],我们建议还可以将年龄、性别和病史作为机器学习模型的额外输入特征,以获得更准确的结果,这超出了本文的范围。

5 Conclusion

癫痫是影响所有年龄的人的最常见的神经系统疾病之一。它的特点是突然和反复发作,以不同的形式出现,并以不同的方式治疗。对癫痫发作的正确评估对于克服疾病的并发症至关重要,它为患者提供了准确的信息。本文提出了一种利用DTCWT和机器学习进行脑电图发作类型自动分类的新方法。该方法对七类和五类分类问题的分类效率分别达到96.04%和99.1%,分类效率明显提高。

我们在不同的受试者中评估了我们提出的技术,这是一项非常具有挑战性的任务,因为训练数据的数量有限,而这些数据被推广到不可见的测试患者的脑电图数据。实验结果表明,该方法的性能明显优于文献中已有的方法,具有较强的通用性。本研究的发现增强了人工智能应用在辅助神经学家决策方面的适用性。在未来的研究中,我们计划研究使用不同的特征提取方法,以更好地检测EEG中癫痫发作之间的差异。

你可能感兴趣的:(脑电研究,论文研读,人工智能)