癫痫是一种慢性非传染性疾病,由脑神经元突然异常放电引起,导致间歇性脑功能障碍。它也是世界上最常见的神经系统疾病之一。通过机器学习、相关分析和时频分析实现基于脑电的癫痫自动检测,在癫痫的早期预警和自动识别中发挥着重要作用。在本研究中,我们提出了一种利用三重遗传对抗生成网络(GAN)实现脑电癫痫识别的方法。TripleGAN分别用于脑电信号的时间域、频域和时频域。这项实验是通过CHB-MIT数据集进行的,这些数据集在世界上同行业的最新水平上运行。在CHB-MIT数据集中,分类准确率、敏感度和特异度分别超过1.19%、1.36%和0.27%。交叉对象率分别超过0.53%、2.2%和0.37%。通过对实际信号的仿真和分类优化,表明所建立的TripleGAN深度学习模型对脑电癫痫分类具有良好的效果。
本文从癫痫灶引起的头皮脑电信号的幅值与位置的相关性中提取识别特征,并基于双重GAN模型对脑电癫痫进行深入学习。
主要创新点如下:
(1)针对癫痫脑电信号的棘波、尖波、慢复合波等局部信号特征,研究了癫痫脑电信号的局部虚拟表示。本文提出将GAN机器学习方法应用于真实数据,以提高数据识别的稳健性。
(2)对脑电信号进行局部特征增强,可以有效地解决癫痫脑电信号特征聚类的显示问题,使脑电信号的特征聚类更加准确。
(3)利用GAN在势空间(向量空间)进行算术运算,将脑电聚类特征转化为相应特征空间的运算。生成的数据与真实样本没有什么不同。最后,鉴别器不能正确区分产生的数据和真实数据,从而获得更强的分类特征。
总之,本文在特征聚类、强化和端到端分类、癫痫脑电信号识别等方面提出了新的思路,为癫痫的自动诊断提供了新的工具。
生成式对抗网络(GAN)主要用于生成图像。通过不同的正则化方法[21,22]和在训练中逐渐提高图像分辨率[23],已经在生成图像的稳定性和质量方面取得了很大的进步。然而,关于时间序列的研究并不多见。[24]设计了具有均方误差的时间-空间-频率(TSF-MSE)损失函数,该函数通过根据时间序列特征、公共空间模式特征和功率谱密度特征计算MSE来重构信号。
在本研究中,从原始信号中迁移参数,并多次重复所需的源激活,以生成模拟的脑电癫痫模型。首先,随机抽取源数据样本作为癫痫预测的初始样本,利用SEED-G工具箱快速生成一组具有4s时间窗的时间序列数据集。然后,使用TripleGAN模型对目标数据集中的输入-输出对进行选择性微调,使其接近真实目标。
在癫痫脑电信号的分析和处理中,有许多非监督降维特征提取方法,如主成分分析[25]、独立分量分析[26]、AR[27]等。无监督聚类方法是从数据驱动的角度,根据样本的分布来挖掘样本的特征。集群模型主要分为基于分区的集群、基于密度的集群和基于信号自编码的集群[28]。脑电信号的聚类算法可以挖掘时间序列样本之间的分布规律,发现关键样本模式。虽然通过聚类算法提取的特征不能对应于明确的物理意义,但它们可以作为特征提取的关键组成部分,在许多脑电学研究中发挥重要作用[29]。
本文从时间、频率和时频三个维度进行特征提取。
具体方法如下:
(1)时间特征是脑电信号处理中最基本的特征,它是通过直接观察和计算原始信号来提取的。我们使用了前人的成果[30]来提取时间模型,见图1
(ii)利用该方法对频域特征进行滤波,可以区分癫痫发作过程中脑电能量的明显变化,见公式(1)
小波分析在时间-频率域中使用,将时间上的一维信号变换到时间上的一维空间,并在多个层次上对频带进行划分,以便进行更精确的特征分解,见公式(2)
这三个特征各自履行着各自的职责。特别是,小波包分析进一步分解了多分辨率分析中未细分的高频部分,具有进一步划分和细化随着尺度的增加而加宽的频谱窗口的优良特性。因此,它具有更好的时频特性,提高了脑电信号分析的精度[31]。
受对偶学习自然语言翻译[31]的启发,我们提出了一种新颖的三联机制。DualGan[32]用来自两个域的两组未标记图像训练图像转换器。在本文的实验中,原始GAN从时间、频域和FFT时频域三个维度学习脑电信号的特征,对原始信号和模拟产生的信号进行闭环训练,并允许对任何域的脑电特征进行转换和重建,见图2。因此,可以从脑电癫痫识别的三维特征合理地重构识别权重,以提高识别性能。
在学习过程中,生成模型的优化目标是尽可能多地生成虚假的脑电癫痫数据,从而得到真实数据的统计分布规律。判别模型用于判断给定的输入数据是来自真实数据还是来自生成的模型。最后,当判别模型不能准确区分生成的模型生成的数据是否伪造时,我们认为判别模型和生成的模型都提升到了一个更高的水平,生成的模型生成的数据足以模拟现实世界中的数据。
本文实现了由TripleGAN和三种特征方法组成的框架,并使用Kera 2.4.3机器学习实现了堆叠式脑电癫痫仿真。我们使用配备第12代Intel(R)Core(TM)i9-12900K [email protected] GHz、32 GB RAM、1 TB HDD和GeForce RTX 3090 GPU的机器,在64位Ubuntu操作系统下,使用CHB-MIT的开放脑电癫痫数据集进行了表1和表2所述分类问题的解决实验。
由波士顿儿童医院和麻省理工学院联合记录。采用10-20国际标准导联系统放置电极,16位模数转换器对输入信号进行256赫兹采样。它针对每个患者2次或更多的癫痫发作进行训练,并对24名患者的916小时连续脑电进行测试。
为了进行公平的比较,本文进一步将他的模型与最新的模型和基线模型进行了比较,以显示其优越的性能。对于主题相关的分类,将该模型与最近发表的bi-GRU[34]进行了比较,后者提出了双向门控递归单元(bi-GRU)神经网络来辅助癫痫的诊断和治疗。
与DLEK-GP[35]方法相比,采用经典的共同空间模式(CSP)和基于对数-欧几里德核的判别高斯过程来区分癫痫脑电信号。与EEGWaveNet[36]方法的进一步比较使用可训练的深度方向卷积作为区分过滤器,以同时从每个EEG通道收集特征并将信号分离到多尺度分辨率。最后,所提出的CE-stSENet[37]提出了嵌入信道的谱时间压缩与激发网络,该网络可以通过一种变形的压缩与激发块以统一的方式捕获分层的多域表示。在表1中,TripleGAN在平均准确度方面比比较方法高1.19个百分点,在平均敏感度方面高1.36个百分点,在平均特异度方面高0.27个百分点。
对于独立于主题的分类,也可以使用EEGWaveNet[36]作为基线方法之一。提出了一种基于同伦字典学习(DLWH)算法的稀疏表示癫痫发作分类方法[38]。GDL[39]引入了基于深度学习的癫痫发作预测模型,该模型使用脑电(EEGs),可以通过区分受试者大脑的发作前和发作间期来预测癫痫发作。最后,LRCN[40]的一种前瞻性方法构建了一个18层长期递归卷积网络(LRCN)来自动识别和定位头皮EEG上的致痫区域。[41]采用RUSBoosted树集合法实现了DB16-DWT在7个特征值上的实时癫痫检测。
在表2中,TripleGAN的平均准确率比比较方法高0.53个百分点,平均敏感度比比较方法高2.2个百分点,平均特异度比比较方法高0.37个百分点。
本文自然地将GAN扩展到TripleGAN,以提取关于时间,频域和时频的三个域的脑电信息,并保证了以分类器和生成器为特征的脑电癫痫特征的分布收敛于数据分布。
作为一个统一的模型,TripleGAN可以同时在深度生成模型中获得最新的分类结果。为了联合估计这些以分类器网络和分类条件生成器网络为特征的条件分布,定义了一个联合判别器网络,其唯一的功能是区分样本是来自真实数据分布还是来自模型。此外,为了弄清脑电癫痫灶的产生规律,本文将输入平滑地转换到三维空间,并利用GAN网络的顺序优化生成数据仿真。接下来,我们将对这一部分进行深入的研究。
本文证明了人工脑电信号是由产生式对抗网络产生的。本文通过逐步训练GAN产生稳定的人工脑电信号,得到的信号在时间域和频域上与单通道真实脑电信号非常相似。