爱吃榴莲的妹妹

014基于深度学习的脑电癫痫自动检测系统-2018(300引用)

An automated system for epilepsy detection using EEG brain signals based on deep learning approach

a b s t r a c t

癫痫是一种威胁生命和具有挑战性的神经系统疾病，影响着世界各地的大量人群。对于其检测，脑电图(EEG)是一种常用的临床方法，但人工检查EEG脑信号是一个费时费力的过程，给神经科医生带来了沉重的负担，影响了他们的工作表现。已经提出了几种使用传统方法来帮助神经科医生的自动系统，这些系统在检测二元癫痫情况(例如正常对发作)时表现良好，但是在分类三元情况(例如发作对正常与发作间期)时性能下降。为了克服这个问题，我们提出了一个系统，它是金字塔一维卷积神经网络(P-1D-CNN)模型的集成。虽然CNN模型学习数据的内部结构，并且优于手工设计的技术，但主要问题是大量可学习的参数，这些参数的学习需要大量的数据。为了克服这个问题，P-1D- CNN致力于细化方法的概念，与标准CNN模型相比，它涉及的参数减少了61%，因此具有更好的通用性。为了进一步克服少量数据的限制，我们提出了两种增强方案。我们在基准数据集波恩大学数据集上测试了该系统；在几乎所有与癫痫检测相关的情况下，它的准确率为99.1±0.9%，优于最先进的系统。此外，在享有CNN模型的优势的同时，P-1D-CNN模型需要少61%的存储空间，并且其检测时间非常短(< 0.0 0 0481 s)，因此其适合于实时临床设置。这将减轻神经科医生的负担，并有助于患者在癫痫发作前提醒他们。提出的P-1D- CNN模型不仅适用于癫痫检测，而且可以用于开发针对其他类似疾病的健壮专家系统。

1. Introduction

癫痫是一种神经系统疾病，影响着全球约5000万人(Megiddo et al.， 2016)。脑电图(EEG)是一种有效的非侵入性技术，通常用于监测大脑活动和癫痫的诊断。脑电图读数由神经学家分析，以检测和分类疾病的模式，如发作前期和癫痫发作。目测费时费力;检查一个病人一天的脑电图记录需要很多小时，而且需要专家的服务。因此，对患者脑电图脑信号的分析给神经科医生带来了沉重的负担，降低了他们的工作效率。这些限制促使人们努力设计和开发自动系统，以帮助神经学家对癫痫和非癫痫脑电图脑信号进行分类。

最近，人们开展了大量的研究工作来将癫痫和非癫痫信号分类(Gardner，Krieger，Vachtsevanos，&Litt，2006；Meier，Dittrich，Schulze-Bonhage，&Aertsen，2008；Mirowski，Madhavan，LeCun，&Kuzniecky，2009；Sheb&Guttag，2010)。从机器学习的角度来看，癫痫和非癫痫脑电信号的识别是一项具有挑战性的任务。通常，由于癫痫发作的罕见，有少量的癫痫数据可用于训练分类器。此外，数据中噪声和伪影的存在造成了学习与正常、发作和非发作病例相关的大脑模式的困难。由于患者的癫痫形态不一致，这一难度进一步增加(McShane，2004)。现有的癫痫发作自动检测技术使用传统的信号处理(SP)和最大似然技术。其中许多技术对一个问题表现出很好的准确性，但对其他问题却不能准确执行。他们对癫痫发作和非癫痫发作病例进行分类的准确性很好，但在正常发作与发作间歇期的情况下表现较差(Zhang，Chen，&Li，2017)。由于三个原因，它仍然是一个具有挑战性的问题：1)不存在可以将二进制和三元问题分类的广义模型(即正常vs.发作vs.发作间期)，ii)较少可用的标记数据，以及iii)低准确度。为了帮助和辅助神经学家，我们需要一种通用的自动系统，即使使用较少的训练样本也能提供良好的性能(Andrzejak等人，2001；Sharmila&Geethanjali，2016)。

现有的检测癫痫发作的方法使用手工设计的技术从脑电信号中提取特征。一些方法使用来自EEG信号的信息的频谱(Tzallas等人，2012)和时间角度(Shoeb，2009)。脑电信号包含具有长时间周期的低频特征和具有短时间周期的高频特征(Adeli，周和爸爸-Mehr，2003)，即特征之间存在一种层次。深度学习是一种先进的最大似然学习方法，它自动编码特征的层次结构，这些特征不依赖于数据，并适应数据的内部结构，在许多应用中显示了良好的结果。此外，使用DL模型提取的特征被证明比手工设计的特征更具区分性和健壮性(LeCun&Bengio，1995)。为了提高癫痫和非癫痫脑电信号分类的准确性，提出了一种基于DL的分类方法。

最近出现的数字图书馆技术在几个应用领域表现出了显著的性能。深度CNN的变种，即。2D CNN如AlexNet(Krizevsky，Sutskever，&Hinton，2012)、VGG(Simonyan&Zisserman，2014)等或3D网络如3D CNN Ji，Xu，Yang，&Yu，2013)，C3D(Tran，Bourdev，Fergus，Tor-resani，&Paluri，2015)等在许多领域都表现出色。最近，1D-CNN已经成功地用于文本理解、音乐生成和其他时间序列数据(Cui，Chen，&Chen，2016；Ince等人，2016；LeCun，Bottou，Bengio，&Haffner，1998；Zhang&LeCun，2015)。DL方法的端到端学习范式避免了为提取和选择最具区分性的特征而选择适当的特征抽取器和特征子集选择器的适当组合，这些特征将由合适的分类器分类(Andrzejak等人，2001；Hussain，Aboalsamh，Abdul，Bamatraf和Ullah，2016；Sharmila&Geethanjali，2016；Zhang等人，2017)。虽然传统的学习方法训练速度快于动态学习方法，但在测试时速度慢得多，不能很好地推广。经过训练的深度模型可以在几分之一秒内对样本进行测试，适合于实时应用，唯一的瓶颈是需要大量的数据和较长的训练时间。为了克服这一问题，需要引入一种增强方案，该方案可以帮助以最佳方式使用少量可用数据来训练深度模型。

由于脑电记录是一维信号，我们提出了一种金字塔状的1D-CNN(P-1D-CNN)模型来检测癫痫，该模型包含的可学习参数要少得多。由于可用的数据量很小，因此，为了训练P-1D-CNN，我们提出了两种增强方案。使用训练好的P-1D-CNN模型作为专家，设计了一个P-1D-CNN模型集成系统，该系统采用多数投票策略融合局部决策来检测癫痫。该系统提取一个EEG信号，用固定大小的滑动窗口对其进行分割，并将子信号传递给基本P-1D-CNN模型(图2)，由P-1D-CNN模型对其进行处理，并将局部决策传递给多数投票模块。最后，多数票模块作出最终决定(图1)。在不同的癫痫检测问题上，它的表现优于最先进的技术。本研究的主要贡献是：(1)数据增强方案，(2)基于P-1D-CNN深层模型集成的二值和三值脑电信号分类的自动系统，(3)构造深层1D-CNN模型的新方法，(4)对用于检测不同癫痫病例的增强方案和深层模型进行全面的评价。

论文的其余部分安排如下：在第二节中，我们介绍了文献综述。第三节详细介绍了拟议的制度。第四节讨论了P-1D-CNN模型的模型选择、数据增强方案和训练。第五节介绍了结果；第六节讨论了结果，并将它们与最先进的方法进行了比较。最后，第六部分对全文进行了总结，并对未来的研究方向进行了展望。

2. Literature review 文献综述

癫痫和非癫痫脑电信号的识别是一个分类问题。该方法从脑电信号中提取识别特征，然后进行分类。在接下来的几段中，我们概述了利用不同的特征提取和分类方法对癫痫和非癫痫脑电图信号进行分类的相关技术。

几乎所有现有的癫痫检测方法都是基于手工设计的特征提取技术。Chua、Chandran、Acharya和Lim(201)使用高阶光谱(HOS)和基于功率谱的特征自动检测癫痫。采用高斯混合模型(GMM)作为分类器，基于HOS和功率谱特征的分类准确率分别为93.1 1%和88.78%。在另一项研究中，Chua、Chandran、Acharya和Lim(2009)使用基于HOS特征的SVM分类器，准确率达到92.67%。Acharya, Vinitha Sree和Suri(2011)使用累积量自动检测癫痫。他们从小波包分解(WPD)系数中提取HOS累积量，SVM分类器准确率达到98.5%。

Subasi(2007)提出了一种分类正常和癫痫脑电图脑信号的方法。该方法采用离散小波变换(DWT)将脑电信号分解为不同的频率子带。从DWT系数中提取四个统计特征，并传递到模块化神经网络(称为专家- mes混合)进行分类。他们报告的敏感性为95%，特异性为94%，准确性为94.5%。在另一项研究中(Acharya et al.， 2012)，作者使用SampEn, ApEn和两相熵和模糊分类器;他们报告的特异性为100%，准确性为98.1%，敏感性为99.4%。Martis等人(2013)使用了来自内部时间尺度分解(ITD)和决策树分类器的特征。该方法的准确性为95.67%，特异性为99.50%，敏感性为99%。在(Acharya et al.， 2013)中，作者提出了一种将脑电图大脑信号自动分类为三种不同类别的方法，即ictal、normal和intertal。他们使用连续小波变换(CWT)进行特征提取，支持向量机作为分类器。结果表明，该方法准确率达96%。

Swami、Gandhi、Panigrahi、Tripathi和Anand(2016)提取了手工制作的特征，如香农熵、标准差和能量。他们使用通用回归神经网络(GRNN)分类器对这些特征进行分类，并获得了最大的准确率，即在Bonn数据集中，A-E(非发作vs.发作)和AB-E(正常vs.发作)病例的准确率分别为10%和99.18%。然而，其他病例如B-E、C-E、D-E、CD-E和ABCD-E的最大准确率为98.4%。在另一项研究中，Guo、Rivero、Do- rado、Rabunal和Pazos(2010)在同一数据集上对ABCD-E病例实现了97.77%的准确性。他们使用人工神经网络分类器(ANN)对离散小波变换(DWT)提取的线长特征进行分类。Nicolaou和Georgiou(2012)从脑电图信号中提取排列熵特征。他们采用支持向量机(SVM)作为分类器，对波恩大学数据集上的a - e案例实现了93.55%的准确率。其他病例如B-E、C-E、D-E、ABCD-E的最大准确率为86.1%。Gandhi、Panigrahi和Anand(201)利用小波变换从EEG信号中提取熵、标准差和能量特征。他们使用支持向量机和概率神经网络(PNN)作为分类器，报告了ABCD- E病例的最大准确率为95.44%。Gotman, Ives和Gloor(1979)使用了锐波和尖刺识别技术。他们在Gotman(1982年、1999年)、Koffler和Gotman(1985年)和Qu和Gotman(1993年)中进一步加强了这种技术。Shoeb(2009)使用支持向量机分类器，采用患者特异性预测方法;结果表明，该方法的准确率达96%。在大多数工作中，用于区分发作和非发作事件的常用分类器是支持向量机(SVM)。然而，在Khan、Rafiuddin和Farooq(2012)的研究中，线性判别分析(LDA)分类器被用于对包括65例癫痫发作的5个受试者进行分类。该方法的准确性、灵敏度和特异性分别为91.8%、83.6%和10%。Acharya等人(2012)专注于使用熵值进行脑电图癫痫检测和七种不同的分类器。表现最好的分类器是Fuzzy Sugeno分类器，它达到了99.4%的灵敏度，10%的特异性和98.1%的整体准确性。表现最差的分类器是朴素贝叶斯分类器，其灵敏度为94.4%，特异性为97.8%，准确性为88.1%。Nasehi和Pourghassem(2013)使用粒子群Op- timization神经网络(PSONN)，其灵敏度为98%。

Yuan、Zhou、Liu和Wang(2012)使用极限学习机(ELM)算法进行分类。21(21)条截获记录用于训练分类器，65(65)条用于测试。结果表明，该系统的灵敏度平均为91.92%，特异性为94.89%，总体准确率为94.9%。Patel、Chua、Fau和Bleakley(2009)提出了一种低功率的实时分类算法，用于检测动态脑电图中的癫痫发作。他们比较了Mahalanobis判别分析(MDA)，二次判别分析(QDA)，线性判别分析(LDA)和支持向量机分类器对13(13)个主题。结果表明，当LDA在单个患者身上进行训练和测试时，效果最好。该方法的灵敏度为94.2%，特异性为77.9%，总体准确性为87.7%。当应用于所有受试者时，其灵敏度为90.9%，特异性为59.5%，总体准确性为76.5%。Acharya、Faust、Kannathal、Chua和Laxminarayan(2005)使用复发量化分析(RQA)特征对EEG信号进行三类分类，以检测癫痫。采用支持向量机作为分类器，以RQA参数为特征，准确率达到95.60%。此外，一个详细的特征提取器和分类器用于二进制(例如。Sharmila和Geethanjali(2016)和Zhang等人(2017)给出了癫痫vs非癫痫)和三元(癫痫vs正常vs间歇性)场景。

对上述最新的特征提取技术的概述表明，大多数特征提取技术都是手工设计的，并不通过学习数据的内部结构来从脑电图信号中提取辨别性信息;它们的性能取决于各种参数的调优，不能很好地泛化。为了提高癫痫检测系统的准确性和广泛性，可以使用DL方法来避免手工设计特征提取器和分类器的需要。据我们所知，目前还没有人使用DL方法进行癫痫检测，可能是因为现有数据量较少，不足以训练出一个深度模型。因此，我们有动机使用DL技术来提出一个包含少量可学习参数的深度模型，并有效地将脑电图大脑信号分为癫痫性和非癫痫性。然而，最近DL也被应用于类似的问题。Acharya等人(2017 a, b,c)最近将DL应用于从心电图信号中检测心律失常、心肌梗死和冠状动脉。他们使用了一个有11层的深度卷积神经网络模型。在Acharya等人(2017a)中，作者提出了两个CNN模型:A和B。模型A以一个包含500个样本的心电信号窗口作为输入，而模型B的输入是一个大小为1250个样本的窗口。我们的CNN模型与这些模型的不同之处在于:(1)它所涉及的层数较少(只有5层)，(2)它是基于金字塔结构的，显著减少了参数的数量。我们的系统是一个CNN模型的集合，它分析输入信号的不同部分，通过这种方式增加多样性，从而获得更好的检测性能。

3. The proposed system

基于P-1D-CNN模型集合的脑电图脑信号自动癫痫检测系统如图1所示。该系统由三个主要模块组成:(1)输入模块，将输入的脑电波信号分解成具有固定大小重叠窗口的子信号，并传递给P-1D-CNN基模型;(2)集合模块，子信号按P-1D-CNN基模型进行分类;(3)融合决策，采用多数投票的方法对局部决策进行融合，得出最终决策。

标准的深度CNN模型需要大量的数据进行训练，但对于癫痫检测问题，数据量是有限的。为了解决这个问题，我们在第4节中介绍了用于为训练基地P-1D-CNN模型创建数据的数据增强方案。

训练P-1D-CNN模型后，使用其副本作为基础模型，我们构建一个深度集成分类器，其中每个基础模型扮演检查输入信号不同部分的专家的角色。当输入信号传递给集合进行分类时，为了多样性(考虑到增强方法)，它被分割成重叠的窗口，然后传递给集合中不同的P-1D-CNN基模型，如图1所示，即信号的不同部分被分配给不同的专家(基模型)进行局部分析。经过局部分析，每个模型给出局部决策;最后，采用多数投票的方式将这些决策进行融合，形成最终决策。集合中P- 1D-CNN模型(专家)的数量取决于窗口的数量。例如，如果一个输入的脑电图信号被分成n个窗口(子信号)，集合将由n个P-1D- CNN基模型组成。我们用n = 3和n = 5测试了系统，发现n = 3给出了更好的结果

该系统的核心组件是一个P-1D-CNN模型。它是一个深度模型，由三种主要类型的层组成:卷积层(Conv)、批处理归一化层(BN)和全连接层(FC)。对于Conv和FC层，使用ReLU作为激活函数;Dropout技术用于训练中的正则化。ReLU和dropout采用不同的层进行应用，并在模型中得到一致的显示。在下一节中，我们将详细介绍这个深度模型。为了更紧凑地描述这些想法，表1给出了关键术语及其缩写。

3.1. P-1D-CNN architecture 架构

深层CNN模型(LeCun等人，1998；Simonyan&Zisserman，2014)从数据中自动学习EEG信号的结构，并以端到端的方式执行分类，这与传统的手动工程方法相反，在传统的人工工程方法中，首先提取特征，选择所提取的特征的子集，最后将其传递给分类器进行分类。CNN模型的主要组成部分是Conv层，它由许多通道(特征地图)组成。通道中每个神经元的输出是与输入信号上的固定感受场的核(由同一通道中的所有神经元共享)或前一卷积层的特征映射(1D信号)的卷积运算的结果。通过这种方式，CNN通过分析信号来了解不同信息的层次结构。在CNN中，核是从数据不同的手工工程方法中学习的，其中核是预定义的，例如。小波变换。

CNN具有共享内核的新颖思想，与完全连接的体系结构相比，它的优势在于显著减少了参数的数量。最近出现的使CNN更深入的方法增加了大量的参数，增加了它的复杂性，当可用数据集很小时，这是过拟合的潜在原因。现有的用于癫痫检测的脑电图数据集规模小，我们使用两种不同的策略来解决这一问题，即新的数据增强方案和包含少量参数的记忆高效深度金字塔CNN模型。

脑电图信号是一维时间序列;因此，我们提出了一个金字塔的1D-CNN模型，我们称之为P-1D-CNN，它的通用架构如图2所示，它是一个端到端模型。

与传统的CNN模型不同，它不包括任何池化层;通过在Conv层中使用更大的大步来减少冗余或不必要的特性。Conv和FC层从给定的输入信号中学习从低到高的特征层次。将具有语义表示的高级特征作为输入传递给最后一层的softmax分类器，预测输入脑电信号的各类。

CNN模型通常采用从过程到细化的方法，其中底层层包含少量的内核，而高层层包含大量的内核。但是这个结构包含了大量的可学习参数。它的复杂性很高。相反，我们采用了类似于Ullah和Petrosino(2016)为深度2D CNN提出的金字塔结构，即底层层有大量的内核，而高层层包含少量的内核。这种结构显著减少了可学习参数的数量，避免了过拟合的风险。在convv -1层取了大量的核，在convv -2和convc -3层取了一定数量的核，如表3所示的型号M5和M6，包括conv1、conv2和conv3层，分别有24、16和8个核。其思想是，低层次提取大量的微结构，这些微结构被更高层次的层组合成更高层次的特征，随着网络的深入，这些特征数量很少，但具有区别性，即该模型隐式地进行特征选择。

为了展示P-1D-CNN模型的有效性，我们考虑了8个不同配置的模型，其中4个基于金字塔结构。表3显示了这些模型的详细规格，并给出了每个模型中需要训练的参数数量。最后一层完全连接层有两个或三个神经元，这取决于脑电图大脑信号分类问题是两类(如癫痫和非癫痫)还是三类(正常、癫痫和间隔期)。在这些模型的帮助下，我们展示了一个适当设计的模型如何在较少参数的情况下产生相同或更好的性能，从而降低过拟合的风险。基于金字塔结构的模型涉及的可学习参数数量显著减少，见表3;例如，具有金字塔结构的模型M5的参数比类似的1D-CNN模型M1少61%。

深度P-1D-CNN模型(M5)的细节如图2所示。输入信号归一化为零的平均值和单位方差，即。

使用z分数归一化。这种归一化有助于更快的收敛和避免局部极小值。归一化输入由三个卷积块处理，每个卷积块由三层组成:卷积层、批处理归一化层(BN)和非线性激活层(ReLU)。conv1的核数为24个，每个核的感受野为5(即1 × 5);conv2的核数为16个，每个核的感受野为3(即1 × 3)，深度为24;conv3的核数为8，每个核的感受野为3(即1 × 3)，深度为16。第三个块的输出被传递给第一个FC层(FC 1)，然后是一个ReLU层和另一个FC层(FC 2)。

FC1中的神经元数量是20个。为了避免过拟合，我们在FC 2之前使用dropout层。将FC 2的输出交给一个softmax层，该层作为分类器，并预测输入信号的类别。FC2中的神经元数量是2或3，取决于类的数量。在测试时，模型不使用BN和DO。其他型号规格见表3。在接下来的小节中，我们将简要解释主要层，即1D-Conv层、BN层和FC层。详见LeCun et al.(1998)和Ioffe and Szegedy(2015)。

a) Convolution Layers

一维卷积运算用于滤波一维信号(如。时间序列)用于提取鉴别特征。将前一层与K个感知场Rf和深度c的核进行卷积生成Conv层，这些核等于前一层中的chan- nels或feature map的数量。形式上,卷积层X = {X ij: 1≤≤c j 1≤≤z},其中c是渠道的数量的层和z是神经元的数量在每个chan - nel与K内核K l, l = 1, 2,…,K的接受域卷积c产生射频和深度层Y = {Y lm: 1≤≤K, K m 1≤≤},在那里

m为该层每个通道中的神经元数量，K为该层中的通道总数。注意，生成的Conv层中的通道数量等于内核的数量。不同的核从输入信号中提取不同类型的判别特征。核的数量随着网络的深入而变化。底层核学习微观结构，而高层核学习高级特征。在该模型中，第一个Conv层选择最大的核数，并在随后的层中减少33%，以保持金字塔结构。三个Conv层的激活(通道)如图3所示。

a) Batch Normalization

在训练过程中，特征图的分布会因参数的更新而发生变化，这迫使选择较小的学习率和仔细的参数初始化。它减慢了学习的速度，使学习变得更加困难，因为饱和的非线性。Ioffe和Szegedy(2015)将这种现象称为内部协变量漂移，并提出了批量归一化(BN)作为解决这一问题的方法。在BN中，每一层的每个小批次的激活都是标准化的，详细信息可以在Ioffe和Szegedy(2015)中找到。现在，在神经网络中使用BN是非常普遍的。它有助于避免特殊的参数初始化，同时提供更快的收敛速度。在所提出的模型中，我们只在训练过程中的每一卷积层之后使用BN。

a) Fully Connected

在卷积层之后，每个模型有两个全连接(FC)层。CONV3层的所有神经元都被连接到每个神经元是第一个完全连接的层Fc1。在不同的模型中，Fc1内神经元的数量不同，详情如表3所示。第二个全连接层有2个或3个神经元，取决于检测问题，例如对于正常对癫痫问题，这是一个两类问题，FC2中的神经元数量是2，而对于正常对发作间期对发作，这是一个三类问题，FC2包含3个神经元。

4. Model selection and parameter tuning

首先，我们介绍了数据的细节，以及提出的数据增强方案。然后，我们给出了用于验证所提出的系统性能的评估指标。之后，对培训程序进行了详细的阐述。最后，最好的数据通过分析不同的数据增强方式和不同的一维CNN模型的结果，得出了P-1D-CNN模型和增强方案。

4.1. Dataset and data augmentation schemes

这项工作中使用的数据集由波恩大学的一个研究小组获得(Andrzejak等人，2001年)，并已被广泛用于癫痫检测的研究。使用标准的10-20电极放置系统记录脑电信号。完整的数据由五个集合(A到E)组成，每个集合包含100个单通道实例。A组和B组分别由5名健康志愿者在放松清醒状态下睁眼(A组)和闭眼(B组)时记录的脑电信号组成。C组、D组和E组记录自5名患者。D组脑电信号取自致痫灶。C组记录于对侧大脑半球的海马区。C组和D组包括在无癫痫发作间期(发作间歇期)测量的脑电信号，而E组的脑电信号仅在癫痫发作活动(发作)期间被记录(Andrzejak等人，2001年)。详情载於表二。

该数据集中收集的实例数量不足以训练有效的深度模型。为了解决这个问题，获取大量的脑电信号是不现实的，由专业神经学家对其进行标记也不是一件容易的任务。我们需要一种扩充方案来帮助我们增加足以训练深度广义CNN模型的数据量，这需要大量的训练数据才能获得更好的性能。现有的脑电信号数据量小，可以学习模型，但存在过度拟合的问题。为了克服这个问题，我们提出了两种数据增强方案来训练我们的模型。通过使用固定大小的窗口将给定的全长EEG信号分割成小信号来扩大数据；每个小信号被用作学习CNN模型的独立实例。将脑电信号分离成小信号是现有方法中采用的标准程序(Sharmila&Geethanjali，2016；Zhang等人，2017，Zhang等人，2017)。

波恩大学数据集中的每个记录由4097个样本组成。为了从一条记录中生成多个实例，我们采用了与参考文献中的方法类似的滑动窗口方法。Sharmila和Geethanjali(2016)和Zhang等人。(2017)。

在Zhang等人的研究中。(2017)，作者采用了窗口大小为512，步长为480(512的93.75%)；每条记录被分割成8个相等的脑电子信号，去掉最后一个样本。通过这种方式，从100个单通道记录中为每个数据集获得总共800个数据实例，但这个数量不足以学习深度模型。然而，这种方法表明大跨度没有帮助，可以使用较小的跨度来创建足够的数据。基于窗口大小和步长，我们提出了两种数据增强方案。

Scheme-1

将可用信号分为互不相交的训练集和测试集，分别占总信号的90%和10%。使用训练集来扩充数据。选择512的窗口大小和64的步长(512的12.5%，重叠87.5%)，将训练集中的长度为4097的每个信号分成57个子信号，每个子信号被视为独立的信号实例STR。这样，每个类别(类)总共创建5130个实例，用于训练P-ID-CNN模型。

为了进行测试，将测试集中的每个长度为4097的信号划分为4个子信号Sts，每个子信号的长度为1024，这些子信号被视为独立的测试信号实例。当长度为1024的信号实例Sts被传递到系统时，它被分成具有大小为512和50%重叠的窗口的三个子信号，即Sts i，i=1，2，3，每个大小为512，它们被传递到集合中的三个训练的基本P-ID-CNN模型，并且多数投票被用作融合策略以作出关于输入信号实例S的决策。集成中的每个基本模型充当专家的角色，独立分析信号实例Sts的局部部分，并在融合局部决策的帮助下由系统给出全局决策。

Scheme-2

此方法类似于方案1。在这种情况下，用于创建训练实例S的窗口大小为512，重叠25%(即，步长128)。

为了测试，当长度为1024的输入信号实例Sts被传递到系统时，将其划分为具有大小为512和75%重叠的窗口的五个子信号，即，每个大小为512的Sts i，i=1，2，3，4，5，这些子信号被传递到集合中的五个经训练的基本P-ID-CNN模型，并且多数投票被用作融合策略以作出关于信号实例Sts的决定。

4.2. Performance measures (evaluation procedure)

在评估方面，我们采用了10次交叉验证，以确保系统在不同的数据变化上进行测试。每一类的100个信号被分成10个折叠，每个折叠(10%)依次保留用于测试，其余9个折叠(90%信号)用于学习模型。对于每个折叠，使用所提出的扩充方案和90%的训练数据来创建训练实例，并且从坚持的10%的测试数据来创建测试实例。平均性能计算为10倍。使用诸如准确度、特异度、敏感度、精确度、f-测量和g-均值等众所周知的性能指标来评估性能。大多数最先进的癫痫系统也使用这些指标，这些指标的适应评估我们的系统有助于与最先进的系统进行公平的比较。这些指标的定义如下：

其中，Tp(真阳性)是异常情况的数量(例如。FN(假阴性)是被预测为正常的异常病例的数量，TN(真阴性)是被预测为正常的正常病例的数量，FP(假阳性)是系统识别为异常的正常病例的数量。

Training of P-1D-CNN Model

P-1D-CNN的训练需要从数据中学习权重参数(核)。为了学习这些参数，我们使用了传统的具有交叉熵损失函数的反向传播技术和带有Adam优化程序的随机梯度下降方法(Kingma&BA，2014)。ADAM算法有六个超参数：学习率(0.001)，Beta1(0.9%)，Beta2(0.999)，Epsilon(0.0 0 0 1)，使用LOCKING(FALSE)和NAME(ADAM)；我们使用所有这些参数的缺省值(在括号中给出)，除了学习率，我们将其设置为一个非常小的数字0.0 0 0 2。虽然BN通常允许较高的学习率，但在使用ADAM优化器时，需要较小的学习率来控制网络的振荡，避免出现局部极小值问题。根据数据集的大小，用不同数量的迭代来训练模型。在Dropout中，所有实验的概率值均为0.5。该模型是在TensorFlow(TensorFlow，2017)中实现的，TensorFlow是谷歌的一个免费提供的DL库。每个实验的迭代次数不同--这取决于实验中使用的数据集的数量。例如，当我们使用两个数据集，即A与E或D与E时，我们以50k次迭代训练模型；当我们在实验中使用五个集合(即A、B、C、D或E)中的三个集合时，例如。

AB和C，我们将最大迭代次数设置为150k。然而，当我们使用四个或所有五个可用信号集时，我们用300k次迭代来训练我们的模型。虽然模型的训练速度要快得多，但我们仍然将其训练到指定的最大迭代次数，以便更好地泛化模型。

4.2.1. Selection of best model and data augmentation scheme

为了选择最好的模型，我们在最初的实验中考虑了八个CNN模型，如表3所示。对于最佳模型的选择，我们需要解决两个问题：(A)哪种数据增强方案最合适？(B)金字塔体系结构是否比传统模型有更好的普适性，传统模型的核心数量随着网络的深入而增加？为了回答这些问题，我们仅对三类问题：非癫痫发作(AB)与癫痫发作间期(CD)与癫痫发作(E)这三类问题，对所有八个模型进行了10倍交叉验证。这些实验使我们选择了最好的模型和数据增强方案，并将其用于其他分类问题。应该注意的是，所有10重交叉验证集都是随机创建的，强制将所有样本包括在训练(90%)和测试(10%)中。

模型的训练和测试使用数据增强方案1和2。模型M1到M4是使用随着网络的深入而在每个较高层增加K(过滤器或核的数量)的传统概念来设计的，而模型M5到M8(金字塔模型)是使用过程到精细化的概念来设计的，即随着网络的深入而减少K(过滤器或核的数量)33%的比例。

与传统模型相比，金字塔模型涉及的参数数量更少，因此不太容易过度拟合和很好地泛化。

表3给出了使用不同模型和数据增强方案的10倍交叉验证获得的平均性能结果。首先，使用数据增强方案1和2的平均精度(所有模型)及其标准差分别为96.45±0.13和95.40±0.35；在其他性能指标方面几乎可以观察到类似的结果。结果表明，增强方案1比方案2具有更好的性能。在此基础上，本文的其他实验均采用方案1。

其次，根据总体结果可以看出，金字塔模型(M5到M8)的结果优于或等于两种增强方案的传统模型的结果。此外，在大多数情况下，金字塔模型M5给出了最好的结果，在完全连接的情况下，具有0.5个和20个神经元层；它与20个神经元一起工作比在完全连接的层中40个神经元更好。显然，M5是最好的模型，它的性能略高或相近，但涉及的参数最少；与参数较多的模型(M1、−、M4)相比，这种模型易于在内存有限的低成本芯片上部署。在所有后续实验中，我们使用具有增强方案1的模型M5。

5. Results

在模型选择后，即M5与增强方案1，我们提出并讨论了与癫痫检测相关的不同实验案例的结果。我们考虑了三个实验案例:(i)正常vs间歇期vs间歇期(AB vs CD vs E)， (ii)正常vs癫痫(AB vs CDE和AB vs CD)， (iii)癫痫发作vs非癫痫发作(A vs E, B vs E, A + B vs E, C vs E, D vs E, C + D vs E)。AB vs. CD vs. E, AB vs. E, A vs. E, B vs. E, CD vs. E, C vs. E, D vs. E, BCD vs. E, BC vs. E, BD vs. E, AC vs. E, ABCD vs. E, AB vs. CDE, ABC vs. E和ACD vs. E，在16个实验中，有14个被大多数研究频繁考虑，例如Sharmila和Geethanjali(2016)。剩下的两个实验很少或从未被测试过。所有实验均采用10倍交叉验证。

5.1. Experiment 1: normal vs ictal vs interictal classification (AB vs CD vs e)

Zhang et al. (2017) 指出最近的几项研究工作对正常与癫痫发作或非癫痫发作脑电图信号的分类达到了近10%的准确性。然而，较少的工作投入到正常与间隔信号和间隔信号的分类。他们专门针对这三类问题提出了一个系统，取得了97.35%的准确率。

使用M5模型，单一P-1D-CNN模型的平均准确率为96.1%，3个P-1D-CNN模型的平均准确率为99.1%，比(Zhang等人，2017)高出1.7% (Bhattacharyya, Pachori, Upadhyay， & Acharya, 2017)高出0.5%。这一问题的详细性能分析如表3所示，其中显示了所有模型和增强方案的平均结果。然而，表4和表5显示了这个问题的10倍交叉验证结果和混淆矩阵。表5指出，主要混淆出现在nor- mal和inter-ictal或inter-ictal和ictal之间。

5.2. 实验2:正常vs癫痫分类(AB vs CDE和AB vs CD)

本案例涉及两类实验，涉及二元分类问题:(i)正常(AB) vs非发作性癫痫(CD)， (ii)正常(AB) vs非发作性癫痫和发作性癫痫(CDE);10次交叉验证结果如表6所示。

在单一P-1D-CNN模型下，该系统对AB vs CD的平均准确率为98.2%，而在3个P-1D-CNN模型的集成下，该系统的平均准确率为99.8%。同样，平均敏感性和特异性分别为98%和99%。在AB vs CDE的情况下，单模型和集成的平均准确性分别为98.1%和99.95%，而平均敏感性和特异性均为98%。结果表明，该系统具有更好的泛化性，优于Sharma、Pachori和Acharya(2017)和Sharmila和Geethan- jali(2016)中报道的最新方法。同时指出P-1D-CNN模型的综合效果优于单一的P-1D-CNN模型，这是因为在综合过程中，每个模型都是一个专家，对信号的局部部分进行分析，最后通过多数投票将局部决策进行融合，得出最终决策。

5.3. 实验3:正常或非发作vs发作分类(A vs E, B vs E, A + B vs E, C vs E, D vs E, C + D vs E)

第三组实验涉及6个二类问题(i)正常(A) vs发作(E)， (ii)正常(B) vs发作(E)， (iii)正常(AB) vs发作(E)， (iv)非发作(C) vs发作(E)， (v)非发作(D) vs发作(E)， (vi)非发作(CD) vs发作(E))。

我们测试了所有这些组合，以检查所提出的系统的鲁棒性。表7报告了结果。单一P-1D-CNN模型给出的平均值在99.9% ~ 97.4之间，而集成模型给出的平均值在10% ~ 98.5%之间。对于所有正常与癫痫发作的问题，综合诊断的准确性几乎为10%。对于C vs E问题，单一P-1D-CNN模型的平均准确率为98.1%，整体P-1D-CNN模型的平均准确率为98.5%;在这种情况下，集成有一点改进，这表明在这种情况下，几乎所有的专家(P-1D-CNN模型)有相同的决定，它不会产生重大影响。对于另外两个非癫痫发作与癫痫发作的问题，平均准确率分别为99.3%和99.7%，这表明这些问题比C对E相对容易。

6. Discussion

对于二元(正常与癫痫、发作与非发作)和三元(正常与发作间歇期与发作期)分类问题，已经提出了许多方法。表8给出了与最先进方法的比较：Zhang-17(Zhang等人，2017)、Bhattacharyya-17(Bhattacharyya等人，2017)、Sharma-17(Sharma等人，2017)、Swami-16(Swami等人，2016)、Sharmila-16(Sharmila&Geethan-jali，2016)、Samiee-15(Samiee等人，2015)、Orhan-1(Orhan等人，201 1)、Tzallas-12(Tzallas等人，2012)。据我们所知，到目前为止还没有使用动态链接法来解决这个问题。最近，Zhang等人提出了一种基于变分模式分解(VMD)的融合技术和基于自回归的二次特征提取技术。(2017)。使用随机森林分类器将提取的特征分为三类。尽管使用了多种复杂技术，但对于三类问题，它的准确率达到了97.35%，我们的系统达到了1.7%的高准确率，即99.1%。

Bhattacharyya等人提出的技术。(2017)使用可调Q小波变换(Tqwt)计算基于品质因子(Q)的多尺度熵度量，并将其用作特征。该方法的性能是基于Q和Tqwt的剩余参数(R)的调节。我们的方法在A与E，B与E，C与E，D与E，ABCD与E，AB与CD与E上进行了测试。我们的方法在D与E，ABCD与E，AB与CD与E上的性能优于它。然而，在B与E和C与E的两种情况下，它给出了更好的结果，但差异不显著，参见表8。这种方法的缺点是需要手动调整参数，并且依赖于数据。

Sharmila和Geethanjali(2016)提出的方法采用离散小波变换(DWT)进行特征提取，朴素贝叶斯(NB)和k近邻(k-NN)用于癫痫和非癫痫信号的分类。该方法报道的结果没有10倍交叉验证。表8显示，用10倍交叉验证评估的拟议系统总体上优于执行最好的方法(Sharmila&Geethanjali，2016；Bhattacharyya等人，2017)。有趣的是，观察到Sharmila和Geethanjali(2016)和Bhattacharyya等人的方法。(2017)不一致，即它们在不同情况下的表现存在显著差异。这表明，这些系统不能很好地适用于不同的情况，并依赖于数据。另一方面，该系统在所有情况下都表现出一致的性能，即对于不同的情况，准确率从99.1%到99.97%不等，略有差异是由于问题的性质；这意味着它不太依赖数据，具有较好的鲁棒性和比最新方法更好的泛化能力。对于所有16种情况(如上列的表8所示)，所提出的系统的平均准确率为99.6%，这验证了所提出的系统的泛化能力。

现有的所有系统都是基于人工设计的特征提取技术，需要对参数进行调整，其性能在很大程度上依赖于超参数和数据的选择，没有学习数据的内部结构。因此，它们不能很好地在不同的数据集上进行泛化，即不同的案子。此外，它们还涉及费力的设计，即首先提取和选择特征，然后将其传递给分类器，所有这些阶段都涉及到超参数，其联合调整是费力的。相反，该系统是一个端到端的系统，它基于深度学习理论，接受输入信号并给出决策，不需要任何信号预处理、人工特征提取和选择以及局部参数调整。它从数据中自动学习判别信息，学习过程完全自动化。与基于手工设计技术的传统系统相比，拟议系统的唯一缺点是必须始终保留学习的模型。值得注意的是，与其他CNN模型相比，我们的设计需要最小的存储空间。基于金字塔设计的P-1D-CNN模型(M5、M6、M7)与三类情况下的类似标准CNN模型相比，参数个数最少。最好的基于金字塔的P-1D-CNN模型(M5)包含8347个参数，是类似标准CNN模型(M1)包含的21,387个参数的39%，即M5包含的参数至少少61%。较少的参数不仅确保了更好的泛化，而且还导致了较少的存储开销。

我们在一台笔记本电脑上训练了P-1D-CNN模型，该笔记本电脑配备了英特尔酷睿i7-6700HQ [email protected] GHz，具有16 GB RAM，4 GB Nvidia GeForce GTX 965 M显卡。对于P-1D-CNN模型的训练，我们使用了22,400个EEG信号，每个EEG信号由512个样本组成；一个历元(训练和验证)花费了4.33秒。在测试场景中，系统接受1024个样本的EEG信号作为输入并预测其类别。在AB、CD和E三种情况下，一个实例的预测时间在有GPU加速的情况下为0.0 0 0 142s，而在没有GPU加速的情况下为0.0 0 481s，这表明所提出的系统适合于部署在小型FG-PAS中；在这种情况下，系统的唯一弱点可能是内存和存储需求。由于高精度和实时性能，该系统可以部署在临床环境中，以帮助神经科学家。

7. Conclusion

本文提出了一种癫痫自动检测系统，它处理二元检测问题(癫痫与非癫痫或发作与非癫痫)和三元检测问题(发作期与正常发作与发作间歇期)。该系统被设计为一种记忆效率高且简单的一维深卷积神经网络(P-1D-CNN)模型的集成，它以脑电信号为输入，将其传递给不同的基本P-1D-CNN模型，最后利用多数投票来融合它们的决策。为了克服数据集小的问题，提出了两种数据增强方案。由于该模型具有较少的参数和扩充方案，因此在有限数据的情况下易于训练，并且易于在内存有限的芯片上部署。它将帮助神经科医生发现癫痫，并将大大减轻他们的负担，提高他们的效率。

与拟议的工作相关的未来方向有很多。

虽然提出的系统在基准数据集上表现良好，但其临床验证和检查其在临床环境中部署的适宜性仍是未来的工作。另一个可能的方向是将其整合到癫痫患者的可穿戴设备中。尽管P-1D-CNN占用的内存和存储空间减少了约61%，但它对可穿戴设备的存储和内存要求可能是个问题。这个问题还需要进一步研究，以进一步降低内存和存储需求。此外，该系统可以部署在集中的云环境中，通过移动设备快速访问，而不使用特定的可穿戴设备。需要输入的小尺寸脑电信号和轻便的P-1D-CNN模型使其适合云部署。小信号可以很容易地传输到云中进行实时处理，在那里它可以生成警告警报，以便在必要时提醒医生/患者。在这方面，隐私保护和数据丢失是将数据传输到云中的一项艰巨任务。这些问题将在今后的工作中予以强调。该系统具有一定的通用性，可用于类似脑电信号疾病的专家系统开发，如工作指令应力检测。此外，通过增加模型的深度，增强基于CNN模型的多样性，可以对深层模型进行扩展，以设计出更具通用性和更强大的模型。

你可能感兴趣的:(脑电研究,论文研读,深度学习,人工智能)

写测试太烦？Copilot + Jest 让你 3 分钟搞定单元测试
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
基于springboot的社区生鲜团购系统优创学社2 spring boot 后端 java
目录摘要IAbstractII1绪论11.1研究背景11.2课题意义22开发技术论述22.1Springboot框架32.2Vue框架32.3Tomcat服务器42.4MySQL数据库53需求分析63.1系统的可行性分析73.2功能需求分析73.3项目设计目标83.3.1关于系统的基本要求83.3.2开发目标94系统设计104.1系统功能模块设计114.2系统功能流程设计124.3数据库设计134
5.31.15 使用图像到图像转换和 YOLO 技术对先前的乳房 X 光检查结果中的异常进行早期检测和分类托比-马奎尔深度学习基础知识 YOLO
在本研究中，我们研究了基于You-Only-Look-Once(YOLO)架构的端到端融合模型的有效性，该模型可同时检测和分类数字乳房X光检查中的可疑乳腺病变。包括四类病例：肿块、钙化、结构扭曲和正常，这些病例来自包含413个病例的私人数字乳房X光检查数据库。对于所有病例，先前的乳房X光检查（通常是1年前扫描的）均报告为正常，而当前的乳房X光检查被诊断为癌变（经活检证实）或健康。方法：建议将基于Y
Python编程电子书：从基础到实践王奥雷
本文还有配套的精品资源，点击获取简介：Python电子书汇集了基础语法、面向对象编程、标准及第三方库使用、文件操作、网络编程、并发编程、单元测试与调试、Python2与Python3的区别等核心知识点。通过实例和项目案例，帮助读者在Web开发、数据分析、人工智能等应用领域提升编程技能，跟上Python的技术进步。1.Python基础语法介绍Python作为一种高级编程语言，其易读性和简洁的语法使其
Python爬虫实战：研究chardet库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 chardet
1.引言1.1研究背景与意义在互联网信息爆炸的时代，网络数据采集技术已成为信息获取、数据分析和知识发现的重要手段。Python作为一种高效的编程语言，凭借其丰富的第三方库和简洁的语法，成为爬虫开发的首选语言之一。然而，在网络数据采集中，文本编码的多样性和不确定性一直是困扰开发者的主要问题之一。不同网站可能采用不同的编码方式（如UTF-8、GBK、GB2312等），甚至同一网站的不同页面也可能使用不
开源模型应用落地-OpenAI Agents SDK-集成MCP与Qwen3-8B模型的创新应用探索（七）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言在人工智能技术飞速发展的今天，如何将先进的模型和技术无缝结合，成为推动行业变革的关键。OpenAIAgents通过集成模型上下文协议（MCP）和阿里巴巴推出的Qwen3-8B模型，正开启一场智能应用的革命。这种创新的结合不仅提升了AI代理与外部工具之间的通信能力，还在多模态任务处理、个性化服务等领域展现出巨大潜力。本文将深入探讨这一技术组合的实际应用场景，揭示其在改善客户体验和提升运营效率
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用（六）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言随着人工智能技术的迅猛发展，大语言模型（LLM）在各行各业的应用日益广泛。然而，模型生成的内容是否安全、合规、符合用户预期，成为开发者和企业不可忽视的问题。为此，OutputGuardrail应运而生，作为一种关键的安全机制，它在模型生成结果之后进行内容审核与过滤，确保输出不偏离道德、法律和业务规范。通过检测不当的内容，不仅提升了AI系统的可信度，也为构建更加稳健和负责任的人工智能应用提供
什么是深度学习框架中的计算图？杰瑞学AI Computer knowledge NLP/LLMs AI/AGI 深度学习人工智能 pytorch
在深度学习框架中，计算图是核心的数据结构和抽象概念，它用来表示和定义深度学习模型的计算过程。我们可以把它想象成一个描述数学运算如何组合和执行的有向图。以下是计算图的关键要素和作用：节点：代表操作或变量。操作：数学运算，如加法(+)、乘法(*)、矩阵乘法(matmul)、激活函数(ReLU,sigmoid)、卷积(conv2d)、损失函数(cross_entropy)等。变量：通常是张量，即存储数据
开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践（四）开源技术探险家开源模型-实际应用落地 neo4j 开源人工智能语言模型
一、前言在人工智能迅速发展的今天，如何让AI系统更懂“你”？答案或许藏在个性化的记忆管理之中。Mem0作为一个开源的记忆管理系统，正致力于为AI赋予长期记忆与个性化服务能力。通过结合高性能向量数据库Qdrant、图数据库Neo4j的强大关系分析能力以及Streamlit的高效可视化交互，我们可以打造出一个既能存储用户历史行为、又能实时推理并展示结果的智能记忆助手。本文将带您一步步探索这一技术组合的
【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
青年开发者董翔：在代码世界中探索创新边界程序猿全栈の董（董翔） javascript 开发语言开发者
引言：从兴趣萌芽到技术深耕当大多数00后还在适应大学生活时，2004年出生的董翔已在软件技术领域展现出超越同龄人的探索热情。作为软件技术专业大一学生，他以“技术创新解决实际问题”为核心理念，在前端开发、数据修复等领域构建了独特的研究体系。从高中时期自学编程的懵懂少年，到提出“同源数据互补修复机制”“框架质疑学习法”的青年研究者，董翔的成长轨迹折射出新一代技术人对知识的主动建构与实践突破。一、学术探
蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务 hyperai
蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来，生命科学对蛋白质复杂特性解析的需求日益迫切，大数据、深度学习、多模态计算等技术的突破性发展，为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质智能计算体系的构建，使得蛋白质在大规模功能注释、交互预测及三维结构建模等领域取得显著成果，为药物发现与生
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
自然语言处理-基于预训练模型的方法-笔记
自然语言处理-基于预训练模型的方法-笔记【下载地址】自然语言处理-基于预训练模型的方法-笔记《自然语言处理-基于预训练模型的方法》由哈尔滨工业大学出版，深入探讨了NLP领域的前沿技术与预训练模型的应用。本书系统介绍了预训练模型的基本概念、发展历程及常见模型的原理，并通过丰富的实践案例与代码实现，帮助读者掌握这些技术在自然语言处理任务中的实际应用。无论是初学者、研发人员，还是希望提升NLP能力的研究
模型微调方法Prefix-Tuning ballball~~ 大模型人工智能算法大数据
简介：个人学习分享，如有错误，欢迎批评指正。随着大规模预训练语言模型（如GPT系列、BERT等）的广泛应用，如何高效、经济地针对特定任务对这些模型进行微调（Fine-Tuning）成为研究热点。传统的微调方法通常需要调整模型的大量参数，导致计算资源消耗大、适应新任务的速度慢。为了解决这一问题，Prefix-Tuning（前缀调优）作为一种高效的微调技术被提出，旨在通过引入少量可训练的前缀参数，达到
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【限时干货】Calibre智能分类，轻松突破内网限制畅享电子书库比头发还脆弱服务器 tcp/ip linux
文章目录前言1.网络书库软件下载安装2.网络书库服务器设置3.内网穿透工具设置4.公网使用kindle访问内网私人书库前言本研究旨在构建一套运行于微软操作系统环境下的独立电子图书管理体系，核心目标是建立可远程操作的资源访问机制。该架构采用高可用性设计，在第三方阅读平台服务中断时仍能保障数字内容传输的稳定性。系统创新性地融合了两大核心技术组件：通过Calibre开源软件实现文献分类算法与格式转换功能
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
说话人识别python_基于各种分类算法的说话人识别（年龄段识别） weixin_39673184 说话人识别python
基于各种分类算法的语音分类(年龄段识别)概述实习期间作为帮手打杂进行了一段时间的语音识别研究，内容是基于各种分类算法的语音的年龄段识别，总结一下大致框架，基本思想是：获取语料库TIMIT提取数据特征，进行处理MFCC/i-vectorLDA/PLDA/PCA语料提取，基于分类算法进行分类SVM/SVR/GMM/GBDT...用到的工具有HTK(C,shell)/Kaldi(C++,shell)/L
在Linux环境下从0私有化部署Dify
在Linux环境下从0搭建Dify准备工作系统环境私有化部署下载Dify代码ZIP包启动Dify启动Docker容器访问Dify本地环境服务器环境准备工作因工作需要私有化部署公司内部的知识库，研究了一下准备采用Dify+RAG的方式实现，以下是具体步骤。系统环境服务器配置：官方建议2核4G以上；Liunx版本：RockyLinuxrelease9.4；Docker版本：28.1.1；Dify版本：
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
Transformer模型压缩：结构化剪枝与混合精度量化研究 pk_xz123456 仿真模型机器学习深度学习 transformer 剪枝深度学习
Transformer模型压缩：结构化剪枝与混合精度量化研究摘要本文针对Transformer模型在实际部署中面临的计算资源消耗大、内存占用高和推理延迟等问题，提出了一种结合结构化剪枝与混合精度量化的综合压缩方案。我们首先分析了Transformer模型的结构特点及其在计算效率方面的瓶颈，然后系统地研究了结构化剪枝和混合精度量化的理论基础与实现方法。通过实验验证，我们的方法在保持模型性能的同时显著
样本量计算：配对样本定量资料——平均值法
今天介绍的是配对样本定量资料采用平均值法的样本量计算。先来看一下案例。一、案例为明确某种新的训练计划是否能显著提高运动员的100米短跑成绩，欲招募一批志愿者，分别记录运动员在进行新训练计划前后的100米短跑成绩（秒）。据早期研究，两配对样本差值的标准差为5秒，若接受新的训练计划前后的100米短跑成绩平均值差为3秒，问至少需要招募多少志愿者？运动员的100米短跑成绩属于连续性数据。经正态性检验，成绩
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
ARMv8 创建3级页表示例 liuluyang530 FPGA验证 ARMv8 armv8 页表 mmu
最近在研究armv8页表创建过程，顺带做了一个如下形式的页表，//level1table,4entries://00000000-3FFFFFFF,1GBblock,DDR//40000000-7FFFFFFF,1GBblock,DDR//80000000-BFFFFFFF,1GBblock,DDR//C0000000-FFFFFFFF,pointtolevel2tabel////level2ta
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {