详细百度语音识别api文档
先下载python用SDK,可以用python setup.py install
安装
# 引入Speech SDK
from aip import AipSpeech
# 定义常量
APP_ID = '你的 App ID'
API_KEY = '你的 API Key'
SECRET_KEY = '你的 Secret Key'
# 初始化AipSpeech对象
aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
在上面代码中,常量APP_ID在百度云控制台中创建,常量API_KEY与SECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。
注意:
请求说明:
1. 原始语音的录音格式目前只支持评测 8k/16k 采样率 16bit 位深的单声道语音
2. 压缩格式支持:pcm(不压缩)、wav、amr
3. 系统支持语言种类:中文(zh)、粤语(ct)、英文(en)。
# 读取文件
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
# 识别本地文件
aipSpeech.asr(get_file_content('audio.pcm'), 'pcm', 16000, {
'lan': 'zh',
})
# 从URL获取文件识别
aipSpeech.asr('', 'pcm', 16000, {
'url': 'http://121.40.195.233/res/16k_test.pcm',
'callback': 'http://xxx.com/receive',
})
返回结果:
// 成功返回
{
"err_no": 0,
"err_msg": "success.",
"corpus_no": "15984125203285346378",
"sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D",
"result": ["北京天气"]
}
// 失败返回
{
"err_no": 2000,
"err_msg": "data empty.",
"sn": null
}