python语音识别(语音转文字)

存在问题:
将音频转化成文字进行输出


解决方案:
调用第三方百度的语音识别api进行语音识别

步骤:
1)安装百度提供的Python库:pip install baidu-aip
2)运行以下代码:

from aip import AipSpeech
APP_ID = '160'
API_KEY = 'f6XVtm'
SECRET_KEY = 'zbvyYC'
# 百度AI库获取的参数
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

# 构造读取语音文件函数
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 识别本地文件  主函数
result = client.asr(get_file_content(r'F:\PythonFiles\PycharmFile\16k.pcm'), 'pcm', 16000, { 'lan': 'zh',})
#此处地址处必须要加r,使其成为绝对地址,要么容易字符转义出现错误
print(result)

注:
1)百度AI云平台地址:https://ai.baidu.com/
2)进入后添加应用,获取相应的接口ID和密钥(上文提到的三个参数)
3)该接口只支持pcm、wav和amr格式音频
4)程序返回值有4个,如下
python语音识别(语音转文字)_第1张图片
5)存在一个问题,自己录的音总是报3301错误,该错误显示录音效果差,无论怎么录音都显示这个错误

你可能感兴趣的:(软件类)