如何解决TTS个性化场景数据?

个性化TTS应用
智能交互、自动客服、虚拟主持人

个性化TTS数据如何解决?

专业TTS数据制作
为产品塑造独特声音形象:根据产品特点筛选符合音色的声优,高标准录制数十小时音库
数据采集:中文、英文、中英混杂
数据标注:发音校对、音素转写、音素边界切分、韵律标注、词性标注、重音标注、发音词典制作

案例:美式英语TTS数据制作
发音人:美国女声
数据量:2万句,20小时
录音环境:专业录音室,专业麦克风
标注内容:发音校对、音素转写、音素边界切分、韵律标注、重音标注、词性标注、发音词典制作
如何解决TTS个性化场景数据?_第1张图片
在这里插入图片描述

普通人TTS数据制作
用于迁移学习的个性化声音合成:根据应用场景,筛选数千普通人在录音棚或按照要求环境下录制
数据采集:中文、英文、中英混杂
数据标注:发音校对、音素转写、发音词典制作

案例:素人TTS采集
发音人:普通话
数据量:1000人,每人300句
录音环境:专业录音室,专业麦克风
标注内容:发音校对
如何解决TTS个性化场景数据?_第2张图片

前端模型数据制作
用于TTS前端模型的预处理:根据提供文本,进行韵律标注及多音字、数字、符号的读音标注
数据标注:多音字读音标注、数字读法标注、符号读音标注、韵律标注

案例:前端模型数据标注

200万句多音字读音标注:选择正确的拼音
在这里插入图片描述

100万句数字读法标注:电报读法还是序数读法
在这里插入图片描述

100万句符号读音标注:选择正确的读法
在这里插入图片描述

TTS数据:
200小时TTS普通话成人大库
1000普通人个性化语音库
20万条中文文本韵律语料库
汉语多音字语料库(10万句,100多音字)
数字读法语料库(10万句)

https://www.datatang.com/dataset/all/1

你可能感兴趣的:(数据产品)