《EEG Emotion Recognition Using Dynamical Graph Convolutional Neural Networks》
构建邻接矩阵:
按照Fig.3,展示的空间关系,在两个EEG的通道上有连接或者没有连接,这些连接关系被用来构建GCNN的邻接矩阵。
计算邻接矩阵的权重:
A typical distance function would be the Gaussian kernelfunction, which can be expressed as:
where τ and θ are two parameters to be fifixed, dist(i, j) denotes the distance between the i-th node and the j-th one.
特征提取
典型的EEG情绪识别方法通常包括两大部分,即EEG特征提取部分和情绪分类部分。用于情绪识别的EEG特征基本上可以分为两种,即时域特征型和频域特征型。时域特征如Hjorth特征[22]、分形维数特征[23]、高阶交叉特征[24]等,主要捕获脑电信号的时间信息。而与时域特征不同的是,频域特征的目的是从频率的角度捕捉EEG情绪信息。频域特征提取方法中最常用的一种是将脑电信号分解为几个频段,即δ频段(1- 3Hz)、θ频段(4-7Hz)、α频段(8-13Hz)、β频段(14-30Hz)、γ频段(31-50Hz)[20] [25] [26] [27],然后分别从每个频段提取脑电信号特征。常用的脑电图特征包括:微分熵(DE)特征 [28] [29]、功率谱密度(PSD)特征[30]、微分不对称性(DASM)特征[23]、比例不对称性(RASM)特征[31]和微分尾数(DCAU)特征[18]。
表1展示不同特征的特征数目。
算法实现
算法流程如下所示:
计算损失
式(14)中, I I I和 I p I^p Ip分别表示训练数据的实际标签向量和预测标签向量, Θ Θ Θ表示所有模型参数,α为权衡正则化权重。交叉熵函数交叉熵 ( I , I p ) (I, I^p) (I,Ip)旨在测量实际情感标签与期望情感标签之间的不相似性,正则化 α ∣ ∣ Θ ∣ ∣ \alpha||Θ|| α∣∣Θ∣∣旨在防止模型参数学习的过拟合。
同一个人的数据进行训练、预测
1、在五种EEG特征中,DE特征的平均识别准确率优于其他大多数特征。对于每种情绪识别方法,当5个频段同时使用时,平均识别准确率最高。其中,当5个频段均使用时,DE特征的最佳平均识别准确率可达90.4%(标准差为8.49%)。
2、在四种EEG情绪识别方法中,DGCNN和GCNN的平均识别准确率均高于另外两种方法(SVM和DBN)。然而,与GCNN相比,DGCNN在大多数情况下在使用相同的EEG特征时,对EEG情绪类别的分类能力更强。这很可能是由于GCNN模型中邻接矩阵进行了优化,使得它能够更准确地表征EEG各通道之间的关系。
3、在5个EEG频段中,大多数情况下β和γ频段的识别结果都优于其他3个频段。这表明,较高的频带可能与情绪活动的关系更密切,而较低的频带与情绪活动的关系更小。
使用留1交叉法验证受试者独立
SEED的受试者无关实验:在受试者无关实验中,采用LOSO交叉验证策略来评估所提出的DGCNN方法的EEG情绪识别性能。具体而言,在LOSO交叉验证实验方案中,使用14名受试者的EEG数据进行模型训练,其余1名受试者的EEG数据作为测试数据。实验重复进行,每个被试的脑电图数据作为测试数据一次。分别计算了五种脑电信号特征对应的平均分类精度和标准差。
实验结果:
1、对于每一类特征,高频段的识别精度均优于低频段的识别精度。
2、对于每种特征,将从五个频段提取的特征组合在一起进行情感识别时,识别精度最好。其中,当使用5个频段并采用DE特征时,识别准确率最高,为79.95%。
对于跨领域情绪识别准确性:
考虑到受试者无关的情绪识别任务可以被看作是一个跨领域的情绪识别问题,采用了几种流行的跨领域识别方法,包括转移成分分析(TCA)[56]、KPCA[57]、转导支持向量机(T-SVM)[58]和转导参数转移(TPT)[59]作为基线方法。由于DE特征与δ、θ、α、β和γ五个频段的结合被证明是EEG情绪识别中最有效的特征,采用这些特征来比较五种方法的EEG情绪识别性能。图4总结了实验结果。从图4的结果可以看出,DGCNN方法在五种方法中识别准确率最高(= 79.95%)。此外,DGCNN的标准差(= 9.02%)远低于TCA、KPCA、T-SVM和TPT,这表明DGCNN比其他四种方法更稳定。