机器人ESL接口开发指南

start_asr 说明
start_asr 是一个异步函数,只需要执行一次,启动后会一直进行VAD和ASR,直到调用sotp_asr
start_asr [] [] [] [] [] [] [] []
min_speak_ms 最小说话时间,默认值100,单位毫秒,说话时间小于这个值,会被认为是无效声音。
max_speak_ms 最大说话时间,默认值10000,单位毫秒,说话时间超过这个值,就停止录音,直接提交ASR服务器识别。
min_pause_ms 最小停顿时间,默认值300,单位毫秒,默认值用户停顿时间超过这个值,会提交到ASR识别。识别完成后发送asrprogress事件。 完成后的意思是 ASR服务器可能 300-800ms才返回识别接口。
max_pause_ms 最大停顿时间,默认值600,单位毫秒,用户停顿时间超过这个值,认为一句话说完,所有识别完成后发送asrmessage事件。所有识别完成后的意思是,所有提交到asr服务器的识别结果都返回了。 注意 min_pause_ms 必须大于min_pause_ms。
pause_play_ms 触发暂停放音时间,默认值1000,单位毫秒,建议设置200-1000,用户说话时间超过这个值,就暂停放音。 有时候用户一直持续说话,中间没停顿,所以还没提交到ASR服务器识别,不能使用关键词打断,可以先暂停放音。
threshold VAD阈值,默认0,建议不要设置,如果一定要设置,建议 2000以下的值。
recordpath 录音文件路径,如果不设置,就不会把录音存到文件,如果设置了会保存录音到文件,文件格式是 recordpath/被叫号码_Unique-ID_序号.wav
volume 音量标准化的值。0-100,0不使用音量标准化,其他值 音量把录音音量调整到这个值后,再提交ASR识别。

custom_playback 说明
custom_playback [] []
file 放音文件,支持URL,和多文件放音。
wait 单位毫秒,放音结束后等待时间。用于等待用户说话。
retry 重播次数。就是wait时间内用户不说话,就重新播放声音。

sotp_asr
停止ASR。


API  
uuid_console_playback 用于播放控制,用户说话开始,先暂停播放,如果说的是无效声音,可以恢复播放。
uuid_console_playback
pause 暂停播放
resume 恢复播放
stop 停止播放


esl 订阅 事件
CUSTOM asrprogress asrmessage


下面的esl消息,为了方便查看我去除了无关字段


+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Event-Subclass: asrprogress
Event-Name: CUSTOM
asrtype: aiui
asrtext: 第一句话。
asrtextall: 4.第一句话。;
asrelapse: 594
volumegain: 0.984585
recordms: 1175
recordfile: 4
Channel-Name: sofia/external/[email protected]
Unique-ID: 34a719ed-2f22-4349-b9ed-a3329ee875e2

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Event-Subclass: asrprogress
Event-Name: CUSTOM
asrtype: aiui
asrtext: 第二句话。
asrtextall: 4.第一句话。;5.第二句话。;
asrelapse: 360
volumegain: 1.396321
recordms: 1169
recordfile: 5
Channel-Name: sofia/external/[email protected]
Unique-ID: 34a719ed-2f22-4349-b9ed-a3329ee875e2

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Event-Subclass: asrprogress
Event-Name: CUSTOM
asrtype: aiui
asrtext: 第三句话。
asrtextall: 4.第一句话。;5.第二句话。;6.第三句话。;
asrelapse: 359
volumegain: 1.567299
recordms: 1208
recordfile: 6
Channel-Name: sofia/external/[email protected]
Unique-ID: 34a719ed-2f22-4349-b9ed-a3329ee875e2


+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Event-Subclass: asrmessage
Event-Name: CUSTOM
asrtext: 4.第一句话。;5.第二句话。;6.第三句话。;
speakms: 3202
Channel-Name: sofia/external/[email protected]
Unique-ID: 34a719ed-2f22-4349-b9ed-a3329ee875e2


说明

asrprogress 说话停顿min_speak_ms时间后返回的识别结果。
asrtextall 包含之前停顿的识别结果的组合。 格式是 录音序号.识别结果;这样组合多个识别结果。
asrelapse asr识别服务器消耗的时间,单位毫秒。
volumegain 音量标准化放大或者缩小的倍数。
recordms 录音时间,单位毫秒。
recordfile 录音序号

你可能感兴趣的:(机器人ESL接口开发指南)