人工智能学习与实训笔记(五):百度AI能力AIP sdk调用实操

百度的很多AI能力是通过AIP sdk对外开放的,比如语音识别,语音合成,图像识别,NLP,人脸识别等等。下面以实际调用AIP的语音识别接口为例进行实操介绍:

1. 百度AIP sdk安装

pip install baidu-aip

2. 百度对开发者还是非常友好的,可以申请AI能力免费使用额度,比如语音免费调用的申请可以参考:申请百度语音识别API 接口-免费_语音识别接口免费_小小131的博客-CSDN博客

3. 调用AIP的语音sdk,完成语音识别

from aip import AipSpeech
 
APP_ID = 'YOUR APP ID'
API_KEY = 'YOUR API KEY'
SECRET_KEY = 'YOUR API SECRET'
 
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

def recognize_speech(file_path):
    with open(file_path, 'rb') as f:
        speech_data = f.read()
 
    result = client.asr(speech_data, 'pcm', 16000, {
        'dev_pid': 1537,  # 普通话(支持简单的英文识别)
    })
    
    print(result)
 
    if 'result' in result:
        return result['result'][0]
    else:
        return '识别失败'
 
# 调用方法
result = recognize_speech('test.wav')
print(result)

4. AIP sdk里除了语音还有很多其他API可以调用,这些API本质其实都是通过requests访问百度云端AI的服务接口,只是将他们封装成了本地sdk,方便使用。在AIP sdk包里可以看到还有以下类型的API接口可以使用:

人工智能学习与实训笔记(五):百度AI能力AIP sdk调用实操_第1张图片

你可能感兴趣的:(人工智能,学习,笔记)