R. Leeb 1 , C. Brunner 1 , G. R. M uller-Putz 1 , A.Schlogl 2 , and G.Pfurtscheller 1
1 Institute for Knowledge Discovery, GrazUniversity of Technology,Austria
2 Institute for Human-Computer Interfaces, GrazUniversity of Technology, Austria
实验范式
数据收录
三个电极记录(C3、Cz和C4)的脑电信号,采样频率为250Hz。记录的脑电数据包括屏幕动态范围为+-100uV和反馈段的动态范围+-50uV。数字信号通过0.5-100Hz的带通滤波,50Hz时提供陷波滤波器。电极在各个被试的头部位置会略有不同(距离的大小,或前或后,更多的细节参见[1])。电极在Fz的位置设置为EEG接地。
除了EEG的通道,用三个电极收录眼电数据(如图2,左边电极作为参考量),眼电和EEG使用相同的放大器。动态范围设在+-1mV。眼电在执行想象之后进行伪迹处理操作,并不必要进行分类。
3个在线反馈期(session)有4组,笑脸反馈被记录下来(如图3b),每一组(run)在每一类动作想象中包含20次实验。在每一次实验开始,(0秒出)灰色的笑脸在屏幕中央。在2秒处,短时提醒出现(1kHz,70ms)。线索(cue)在3到7.5秒出现。根据提供的线索,要求被试主体通过想象左手或是右手动作,将笑脸朝左侧或是右侧移动。在反馈的时段,当想象运动方向符合,笑脸变绿,如果做错了,笑脸变红。笑脸距离原始位置的移动距离根据刚过去的两秒动作想象的集成分类输出设定(细节在[1])。另外,分类器输出也绘制出笑脸嘴角也有向上向下弯的变化。在7.5秒时刻,屏幕变白,1到2秒的随机间隔被加入到测试里。被试被要求保持笑脸尽可能长时间处于正确的一侧,从而可以尽可能长时间的进行动作想象。
数据文件说明
所有的数据被储存成General Data Format 中,作为生物医学信号的格式(GDF),一个文件一人一期(session)。可是,只有前面三个session有所有测试的分类标注。剩下的两个期seesion则是用来测试分类器,然后评估分类器的性能。所有的文件都列在表格1中。GDF文件可以使用开源工具箱BioSig加载,在http://biosig.sourceforge.net/免费获取。包括Octave/MATLAB和C/C++的库文件。
在Octave/MATLAB里,使用BioSig工具箱加载一个GDF文件,如下操作(for C/C++, the corresponding function HDRTYPE* sopen and size t sread must be called)
[s, h] = sload('B0101T.gdf');
注意组(run)被100个缺省值分割,缺省值默认编码为没有数字(NaN)。或者,行为将被停止,缺省的数据将被编码成负的最大值储存在文件里。
[s, h] = sload('A01T.gdf', 0, 'OVERFLOWDETECTION:OFF');
工作区包含两个变量,s是信号,h是头结构。信号变量包含6个通道,(前3个通道是EEG,后3个通道是EOG信号)。头结构包含事件信息,描述时间流中数据的结构。下面的介绍了评估这些数据的重要信息。
在样本中事件的位置包含在h.EVENT.POS。相对应的类型在h.EVENT.TYP,特定的事件区间被储存在h.EVENT.DUR。该数据集所采用的类型记录于表格2中(16进制数字,10进制标注在括号里)。注意类别标记(如1,2对应事件类型769和770)只标注于训练数据,并没有标注于测试数据。
试验(trials)包含伪迹,将被专家标注为事件类型1023。另外,h.ArtifactSelection包含所有试验(trials)的目录。0表示没有伪迹的试验,1表示包含伪迹的试验。
为了观察GDF文件,观察和记分应用终端SigViewer v0.2或更高的BioSig可以使用。
评估
参与者必须以类别编号(1,2)的形式对每一个样本,提供连续的输出分类结果,包括被标记的测试(trial)和被标记为伪迹的测试(trial)。对于每一个时间点,所有不存在伪迹的测试(trial),可以用来建立一个混淆矩阵(confusion matrix)。从这些混淆矩阵,可以得到时间流的准确率和Kappa系数。BioSig将会提供评估算法。赢家将是kappa值最大的算法。
由于评估数据集直到比赛结束才会发下来。提交的程序必须兼容EEG 数据(该数据结构必须与所有训练集中使用的数据结构相同),该EEG数据作为输入,产生上述提到的类别标注向量。
因为提供了3个EOG通道,在处理数据之前,利用伪迹处理技术,如高通滤波或线性回归[4],剔除EOG伪迹。为了保证其他修正方法的使用,我们选择最大透明度措施,提供EOG通道;与此同时我们要求伪迹不要影响分类效果。
所有的算法都要符合因果性,意味着在k时刻的分类结果,只与当下和过去采样x_k ; x_ k-1,…, x_0有关。为了检测提交算法是否符合因果性和符合伪迹处理要求。所有参赛作品必须开源,包括使用的库,编译器,编程语言,等等。(如Octave/FreeMat, C++, Python, . . . )。使用MATLAB提交算法可以在闭源环境开发,只要代码可以在Octave上运行。同样,C++程序可以在Microsoft或Intel环境下编译,但是代码必须可以在g++下编译。
参考
[1] R. Leeb, F. Lee, C. Keinrath, R. Scherer, H. Bischof, G. Pfurtscheller. Brain-computer communication: motivation, aim, and impact of exploring a virtual apartment. IEEE Transactions on Neural Systems and Rehabilitation Engineering 15, 473{482, 2007.
[2] M. Fatourechi, A. Bashashati, R. K. Ward, G. E. Birch. EMG and EOG artifacts in brain computer interface systems: a survey. Clinical Neurophysiology 118, 480{494, 2007.
[3] A. Schlogl, J. Kronegg, J. E. Huggins, S. G. Mason. Evaluation criteria in BCI research. In: G. Dornhege, J. d. R. Millan, T. Hinterberger, D. J. McFarland, K.-R. Muller (Eds.). Toward brain-computer interfacing,MIT Press, 327{342, 2007.
[4] A. Schlogl, C. Keinrath, D. Zimmermann, R. Scherer, R. Leeb, G.Pfurtscheller. A fully automated correction method of EOG artifacts in EEG recordings. Clin.Neurophys. 2007 Jan;118(1):98-104.