ai机器人接口TTS配置

TTS配置

机器人引擎程序会根据配置生成  这样的路径去播放声音,voice和text使用utf8字符编码,然后进行url编码。用户可以直接实现TTS服务,也可以使用ASRPROXY提供的tts服务。

ai机器人接口TTS配置_第1张图片

  • 发音人列表:可以配置多个发音人,每个电话循环使用发音人,避免每个电话都是同样的声音。

    • 阿里云,接口说明 - 智能语音交互 - 阿里云这个页面看voice参数值。
    • 科大讯飞 控制台-讯飞开放平台 这个页面发音人授权管理看参数(vcn/voice_name)的值。以下及几个基础发音人,特色发音人联系科大购买。
      • 讯飞小燕(xiaoyan)
      • 讯飞许久(aisjiuxu)
      • 讯飞小萍(aisxping)
      • 讯飞小婧(aisjinger)
      • 讯飞许小宝(aisbabyxu)
    • 百度
      • 度小宇=1
      • 度小美=0
      • 度逍遥(基础)=3
      • 度丫丫=4
      • 下面几个发音人都需要购买的
      • 度逍遥(精品)=5003
      • 度小鹿=5118
      • 度博文=106
      • 度小童=110
      • 度小萌=111
      • 度米朵=103
      • 度小娇=5
  • 默认发音人:如果配置了默认发音人,就不会使用循环使用发音人列表里面的发音人。

  • TTS接口:如果使用ASRPROXY
  • TTS配置:ASRPROXY可以配置多个不同的TTS服务和KEY,通过这个配置来控制使用具体的TTS服务。
  • 录音路径: 不是TTS文件的缓存录音路径,是真人录音文件的存放目录。
  • 音量语速语调:都是0-100之间 0默认 100最大。
  • 引擎
    • 阿里云
      0 统计参数合成: 基于统计参数的语音合成,优点是能适应的韵律特征的范围较宽,合成器比特率低,资源占用小,性能高,音质适中
      1 波形拼接合成: 基于高质量音库提取学习合成,资源占用相对较高,音质较好,更加贴近真实发音,但没有

       

你可能感兴趣的:(WX机器人kelaile520,大数据,人工智能,语音识别,数据库)