微信小程序语音搜索踩坑之路——SUSE版

直接调用微信小程序录音接口,然后上传到服务器,百度语音的接口是识别不了这种格式的文件,那么问题来了

一、如何转码?ffmpeg?

二、如何在PHP中使用?

本文将要解决这两个问题。

用到的第三方工具:

1、百度语音

2、silk文件格式转换

一、转码silk文件格式

传送门在此:https://github.com/kn007/silk-v3-decoder

需要注意的是:

1、首先要安装- ffmpeg,具体安装方法请自行百度,如果要转码成MP3格式,请记得启用libmp3lame 即 --enable-libmp3lame


微信小程序语音搜索踩坑之路——SUSE版_第1张图片

2、如果在使用silk-v3-decoder 过程中提示转码失败,请自行添加ffmpeg到环境变量或者修改converter.sh,如下所示,建议后者,因为通过PHP执行shell脚本是不读环境变量的


微信小程序语音搜索踩坑之路——SUSE版_第2张图片

二、如何在PHP中使用

有了上面的神器之后,妈妈再也不用担心语音识别问题了。

目前采用thinkPHP 5作为服务端系统,在小程序端把音频文件上传到后台,TP5已有文件上传功能的封装,具体上传代码不细说;

我们只需要读取上传的文件,通过shell命令进行转码,然后把转码后的文件发送给百度语音接口即可得到语音识别结果。

需要注意如下几点:

1、其中php执行转码的代码如下


微信小程序语音搜索踩坑之路——SUSE版_第3张图片

$real_file即为转码后的音频文件的绝对地址,建议转换成WAV格式,amr格式转换不成功,原因未知。

2、调用百度语音接口格式设置

需要设置音频格式为WAV,码率为16000或者8000,如图所示:


三、总结

1、新版的小程序返回的silk文件内容是webm+base64,对于这种情况,请先将base64字符解码,然后通过下面指令专门成WAV格式,其他格式请自行解码:

base64解码函数:

function decode_base64_file( $inputfile, $outputfile ) {

/* read data (binary) */

$ifp = fopen( $inputfile, "rb" );

$rawData = fread( $ifp, filesize( $inputfile ) );

fclose( $ifp );

$data = explode(',', $rawData);

/* encode & write data (binary) */

$ifp = fopen( $outputfile, "wb" );

fwrite( $ifp, base64_decode($data[1]) );

fclose( $ifp );

/* return output filename */

return( $outputfile );

}

FFmpeg解码命令:

ffmpeg -i 【解码后文件路径】 -ab 12.2k -ar 8000 -ac 1 【输出文件路径】

2、小程序语音接口和公众号的语音接口不一样,公众号语音接口返回的是amr格式,小程序的是silk格式,是Skype开源的一个网络音频格式,通过传送门中的工具即可转码,转码工具先是转成pcm格式文件,然后转成指定格式,其实pcm这种格式百度语音已经可以识别,有需要的童鞋可以修改converter.sh脚本。

你可能感兴趣的:(微信小程序语音搜索踩坑之路——SUSE版)