1、 test.zip
1) 内容
包含3种立体混合语音:
(1) 瞬间混叠(通过正增益缩放的静态源)
(2) 现场录音(在会议室用扬声器播放静态源,每一次用一对全向麦克风录一个源,再加一起形成混合源)
Ps:因为SiSEC2015,我们不再评估“合成的混合卷积混合语音”(通过Roomsim 工具箱模拟的一对全向麦克风合成的房间瞬间脉冲响应过滤静态源???)
(3)合成的混合卷积混合语音
2)场景
合成的卷积混合语音和现场录音的房间的尺寸一致:4.45 x 3.55 x 2.5 m;混响时间T60=130ms/250ms;麦克风的距离为1m/5cm。共有9种混合条件。
源的到达方向在-60°到+60°之间变化,最小间距为15度,声源和麦克风对之间的距离在80cm和1.20m之间变化。【不是很懂,这的到达方向是只单个源的还是不同的源的相互夹角?】
3)声源集
对于每个混合条件,通过放置在不同的空间位置的不同组声源生成六个混合语音:
①4个男声源
②4个女声源
③3个男声源
④3个女声源
⑤3个非撞击的音乐源
⑥3个包括鼓声在内的音乐声源
4)命名说明
数据集包含了立体WAV音频文件,可以使用MATLAB的audioread()函数进行读取。文件命名均为:test___mix.wav,中间是声源集的缩写+混合类型的缩写+混响时间+麦克风距离。
5)授权问题:这些文件根据知识共享署名 - 非商业性使用 - 相同方式授权2.0提供。
2、 test2.zip
1)内容
包含2种立体混合语音:
(1) 瞬间混叠(通过正增益和负增益缩放的静态源)
(2) 仿真录音(在真实的房间,使用一对全向麦克风录扬声器播放的经过脉冲响应的静态源)
2) 场景
仿真录音的房间4.45 x 3.55 x 2.5 m,声源与麦克风对的距离为1.2m。混响时间T60=130ms/380ms,麦克风距离为4cm/20cm。含瞬间混叠,共5种混合条件。
3) 声源集、命名说明、授权问题
同test1.
3、 test3.zip
1) 内容
含2种3通道混合语音(我暂时用不到,暂不翻译了)
4、 dev1.zip
1) 内容
Test1的开发数据
2) 命名说明
① dev1____src_.wav:单通道声源信号
② dev1__inst_matrix.mat:瞬时混叠的混合矩阵
③ dev1_____setup.txt:卷积混合语音的声源位置
④ dev1_____filt.mat:卷积混合语音的混合滤波器系统
⑤ dev1_____sim_.wav:声源对两通道混合语音的立体贡献(即混合语音的纯净源?)
⑥ dev1_____mix.wav:立体混合信号
5、 dev2.zip
同为test1的开发数据,说明一致。
6、 dev3.zip
1) 命名说明
① dev3____src_.wav:单通道声源信号
② dev3_____sim_.wav:声源对两通道混合语音的立体贡献(即混合语音的纯净源?)
③ dev3_____mix.wav:立体混合信号
根据点击打开链接翻译整理,侵权删。