刚刚,我们上线了「易魔声」开源语音合成(TTS)引擎!
「易魔声」,是一款有道自研TTS引擎,目前支持中英文双语,包含2000多种不同的音色,更有特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
「易魔声」中文 网易有道
(我们用「易魔声」将以上这段话进行了技术合成,点击试听 )
用户可免费在开源社区GitHub进行下载使用(地址:https://github.com/netease-youdao/EmotiVoice),通过我们提供的web界面、及批量生成结果的脚本接口,轻松实现音色的情感合成与应用。
(GitHub开源界面,点击蓝字可跳转)
在你过往的回忆里,是不是也有一些特别的声音,比如:偶像的声音激励人心、妈妈的声音让我们一秒回忆起小时候…声音,作为语言维度的一种,总是蕴含着人类充沛的情感表达。而富有情感的合成语音,是能够为应用和内容增色的AI功能。
现在通过「易魔声」,简单通过在文本中加入情感的描述提示,开发者或者内容创作者就可以自由合成符合自己需求的带有情感的语音,比传统TTS更加自然逼真!
「易魔声」,是有道AI团队今年开发的一个项目。随着基于GAN等现代AI技术的语音能力越来越成熟,实现一个质量较高的TTS系统的门槛越来越低。但即使如此,中英双语的高质量、现代TTS模块还是不容易找到,要在自己的应用与内容中加入高逼真度且高度可控的语音,特别是中英双语的语音,依然比较麻烦。
这也是我们将这个项目开源的初衷,希望能帮助有需求的开发者与内容创作者,并不断扩大高质量TTS的应用范围。目前该项目还处于初期阶段,期待大家在开源网站给予我们更多反馈,我们非常希望听到大家的使用体验与建议,欢迎各位扫码进群交流~
若二维码失效,可添加我们工作人员的企业微信申请进群~
借此机会,我们也邀请您了解和探索有道的更多酷炫AI技术
关于有道智云
有道智云AI开放平台,是网易有道旗下一站式人工智能服务提供商,为开发者、企业和政府机构等提供自然语言翻译、文字识别、OCR、语音识别等服务以及行业解决方案,致力于提供安全、可靠和高效的云服务。
联系电话:010-8255-8901;商务合作:[email protected].
想了解更多关于有道人工智能的内容,可访问“有道智云”官网https://ai.youdao.com.