小白的论文笔记:From Intricacy to Conciseness: A Progressive Transfer Strategy for EEG-Based Cross-Subject Emotion Recognition
一、摘要:
本文提出了一种自增强联合分布自适应(AA-JDA)方法和一种减轻负担和首选源(burden-lightened and source-preferred)的JDA (BLSP-JDA)方法。该方法基于一种新的迁移思想,从适合迁移的样本中学习目标域的特定知识,降低了两个域之间的迁移难度,我们的模型显示了最先进的性能。
二、引言:
(1)对于现有的方法,存在三个弱点:
(1)在联合分布自适应算法中,优化的目标是使某一映射下的联合分布距离最小,将优化问题使用转化为−+−‖(MP(X_T )-MP(X_S ))‖_dist+‖MP(Y_T )-MP(Y_S )‖_dist。最后,利用最优传输来定义目标在条件分布下的误差界。然而我们发现,这种转化对三种情绪是不对等的。这可能是因为积极情绪和消极情绪会诱发相反的皮层激活,而消极情绪和神经情绪则更一致。
(2)现有的DA方法在解决跨会话(cross-session)问题时,使用被试的标签数据作为源域是不合理的,因为通常很难获得新的被试标签。此外,可以得出结论,测量时间间隔远的会话之间的相关性很弱,这表明这些数据可能不再是TL的最佳数据,目标领域渴望一个新的信息提供者。
(3)DA方法更喜欢多源数据。然而,源域数据的数量往往不足以获得良好的性能,这甚至会导致负迁移。为了进一步发展这一研究领域,迫切需要新的方法。
三、方法:
(1)基本概念:
SSL(Semi-Supervised Learning半监督学习)对于缺乏训练数据有很好的解决方案。利用一个小的标记数据集对大量未标记样本进行预测,进而得到大量训练数据。常用实现方法包括:自学习、熵正则、聚类和图方法等。
DA(领域适应):目的是通过将源域和目标域转换为多维空间,封闭其分布,寻找更多的共同特征,从而解决域差异问题,这是基于eeg的情绪识别领域中比较流行的方法。
(2)本文方法
选择JDA(联合分布适配方法)作为算法的DA部分。JDA能够适应源域和目标域的联合分布,使我们在后续操作中能够获得可靠性更高的伪标签。AA-JDA使用扩展循环(Augmentation Loop),而BLSP-JDA使用细循环(Fine Loop)。
1、AA-JDA:提出了扩展循环,用于解决跨被试(sebject)问题
基本过程为,选取一个被试(不带标签),将其两个试验(trail)用于数据扩展,具体过程为以目标域的身份输入到JDA网络得到伪标签;将带有伪标签的这组数据送到下一次的源域。以上过程是一次扩展循环,对于不同数据集,扩展循环次数不一样,SEED数据集扩展循环有两次。
2、BLSP-JDA: 提出了精细循环,用于解决跨会话(session)问题
(1)对未标记的目标域数据进行聚类,聚类完成后,以聚类形式将未标记的样本送入标签预测器P,得到其伪标签属于0(L^0 ) ̃。
(2)计算每个样本的置信度,在每个聚类中,拥有最大置信度的样本将获得重新标记同一聚类中的其他样本的能力。同一簇中的样本具有相同的伪标签。
(3)计算每个簇的置信度,选择三个最大置信度的聚类。带有伪标签的选中数据作为细循环的新源域,选取具有不同情绪标签的前3个高置信度聚类作为伪标记的ground truth,对其余聚类进行伪标记。直到没有匹配的聚类被选择,细循环结束。
注:上述用到 具有噪声的基于密度的聚类方法(DBSCAN)是对未标记样本进行分类,以识别EEG的DE特征。不需要指定数量的类。所有数据点根据其周围的点密度分为三类(核心点cP_c、边界点b、P_b 、噪声点)。该算法有两个超参数,分别为半径r、MinPts、本文两个超参数取值分别为0.5和3。
以下是DBSCAN的开源网站:
https://www.naftaliharris.com/blog/visualizing-dbscan-clustering/
论文中JDA模型: