【分享】2600人中文普通话手机语音数据库(样例 男)

数据介绍


不同籍贯、性别的发音人在手机环境下录制的中文普通话语料,所有数据均做过人工转写。可用于手机语音识别研发。


实际参加录音人数3000多人,平均每人300句。录音结束后人工对逐条语音进行了严格的审核转写,总合格量为800409条,共计2668人的合格语音数量(按每人300句计)。


本数据为该数据的样例。


具体指标


1)录音环境


在安卓手机环境中用自制的录音软件录制,每个录音人的脚本已事先嵌入,录音人根据录音脚本来朗读。


2)录音设备


覆盖了15部最常用的安卓手机,包括三星、华为、中兴、HTC、联想、酷派、小米等厂商的流行机型,如三星i9100、小米1S、小米2、HTC Incredible S、HTC Desire、中兴U807、K-Touch T780等。

3)录音人


2800名来自全国各地不同城市及年龄段的录音人


4)录音语料


覆盖4.1万个中文句子,每名录音人录制300句中文。在句子选取时,进行了相似去重并考虑了不同音素的平衡。录音语料分布如下:


来自各领域的用户问题26820句,领域覆盖:常用网址、彩票、影视、应用、股票、利率、汇率、周边搜索、限行、短信、音乐、餐饮、电视交互、笑话、唐诗宋词、假期安排、打电话、系统设置、通讯录、地图导航、网络搜索、天气、计算器、公制转换、日期时间、油价、日程安排、航班、火车时刻、发短信等30多个领域。


用户短信8180句,覆盖常用的短信内容。


客服查询6000句:覆盖电信、银行、IT领域的常见客户问题。


5)采样格式


16000Hz,16位,单声道,同时存储wav格式和mp3格式


数据格式


每个录音人对应一个唯一编号,如S0001、S0002,每个录音人的数据放在一个文件夹下,包括四类数据:


1)录音人信息文件(.txt):存放该录音人的性别、年龄、籍贯及所用手机型号


2)Mp3格式的语音:在Mp3文件夹下存放该录音人的各个句子的mp3格式语音文件,文件以句子编号命名。


3)Wav格式的语音:在Wav文件夹下存放该录音人的各个句子的wav格式语音文件,文件以句子编号命名。


4)录音人脚本(*.scp):存放该录音人每条语音的对应文本。


数据样例

 



数据大小


压缩后95.8 GB




数据堂-数据共享服务平台:http://www.datatang.com/data/45861

你可能感兴趣的:(数据共享)