说话人识别声纹语音数据库CN-Celeb

分享:
CN-Celeb 是由清华大学语音和语言技术中心(CSLT)近日公布的一个中国明星声纹库。该声纹库包含1,000名中国明星(包括歌星、影星、说唱艺人等)在采访、歌舞及影视作品中的声音片段。每位明星的声音时长大约20分钟,整个数据集近300小时。该数据包含了11类实际场景,覆盖了噪音、信道、发音方式等各方面的复杂性,特别适合研究复杂场景下的说话人识别技术。研究者可在共享资源网站 http://openslr.org 搜索 CN-Celeb 免费下载。

基于 CN-Celeb 数据库,清华大学 CSLT近日提交了一份说话人识别 Recipe,并于今日 Merge 到 Main Branch 中。这是第一份中文说话人识别的 Kaldi Recipe。研究者可以通过下载最新的 Kaldi 系统进行实验验证。
CN-Celeb 项目网址
http://cslt.riit.tsinghua.edu.cn/mediawiki/index.php/CN-Celeb
CN-Celeb 论文地址
https://arxiv.org/abs/1911.01799
CN-Celeb 下载地址
CSLT@Tsinghua University:
http://cslt.riit.tsinghua.edu.cn/~data/CN-Celeb/
OpenSLR:
http://www.openslr.org/82/
Kaldi Recipe 地址
https://github.com/kaldi-asr/kaldi/tree/master/egs/cnceleb

说明:以上内容是在朋友圈分享中同行分享看到,分享给大家!原发布者不知道是谁,如有问题可随时联系。

你可能感兴趣的:(分享)