百度语音

百度语音识别API

百度语音对上传的语音要求目前必须是单声道,16K采样率,采样深度可以是16位或者8位的PCM编码,其他编码输出的语音识别不出来。所以识别前要对采取的语音段进行处理

同样可以使用ffmpeg将mp3处理为PCM,后文的程序即采样这种方法。

PCM编码的语音没有压缩,文件体积与语音长度成正比。

使用前需要才百度开发者上申请相关的API ID,API Key,Secret Key,并以申请的参数代入到文件中。

错误锦集

TypeError: the JSON object must be str, not ‘bytes’ 

解决方法:

  story_data = json.loads(self.request.body)改为

  story_data = json.loads(self.request.body.decode('utf-8'))

 

你可能感兴趣的:(百度语音)