飞桨PaddleSpeech:智能语音示例环境搭建Win11

一、简介

PaddleSpeech 遵循 Apache2.0 开源协议,支持开发者们做二次开发,免费商用!

Paddle Speech Demo 是一个以 PaddleSpeech 的语音交互功能为主体开发的 Demo 展示项目,用于帮助大家更好的上手 PaddleSpeech 以及使用 PaddleSpeech 构建自己的应用。

智能语音交互部分使用 PaddleSpeech,对话以及信息抽取部分使用 PaddleNLP,网页前端展示部分基于 Vue3 进行开发。

主要功能:main.py中包含功能

  • 1、语音聊天:PaddleSpeech 的语音识别能力+语音合成能力,对话部分基于 PaddleNLP 的闲聊功能;
  • 2、声纹识别:PaddleSpeech 的声纹识别功能展示;
  • 3、语音识别:支持【实时语音识别】,【端到端识别】,【音频文件识别】三种模式;
  • 4、语音合成:支持【流式合成】与【端到端合成】两种方式;
  • 5、语音指令:基于 PaddleSpeech 的语音识别能力与 PaddleNLP 的信息抽取

二、下载源码

在gitee.com下载源码:
https://gitee.com/paddlepaddle/PaddleSpeech.git
在pycharm导入后端服务项目:
PaddleSpeech\demos\speech_web\speech_server
在idea导入前端项目:
PaddleSpeech\demos\speech_web\web_client

三、环境搭建

在运行speech_server 下main.py时报错,初步判断是环境搭建问题!
报错:
W0309 13648 gpu_resources.cc:61] Please NOTE: device: 0, GPU Compute Capability: 8.6, Driver API Version: 11.6, Runtime API Version: 11.6
W0309 13648 dynamic_loader.cc:278] Note: [Recommend] copy cudnn into CUDA installation directory.
For instance, download cudnn-10.0-windows10-x64-v7.6.5.32.zip from NVIDIA’s official website,
then, unzip it and copy it into C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0
You should do this according to your CUDA installation directory and CUDNN version.

CUDA、CUDNN没安装

1、CUDA 的安装

一般是选用直接去官网下载的方式,https://developer.nvidia.com/cuda-downloads
所以我还是建议从历史版本页索引后下载。
https://developer.nvidia.com/cuda-toolkit-archive
确定安装电脑需要下载的版本:

飞桨PaddleSpeech:智能语音示例环境搭建Win11_第1张图片

飞桨PaddleSpeech:智能语音示例环境搭建Win11_第2张图片

而具体能装哪个版本的CUDA,得看电脑显卡驱动的版本(如下图,控制面板 - 搜索 - NVIDIA控制面板 - 帮助(H) - 系统信息(I))

飞桨PaddleSpeech:智能语音示例环境搭建Win11_第3张图片

下好安装包之后,会让你选个安装包解压位置,一般按默认的就好,除非C盘空间紧张,解压的内容在重启后是会自动清除的,一般问题不大,然后跟着它的步骤无脑下一步基本就没问题了,但必须要记住你CUDA的安装路径,在下一步有用。

飞桨PaddleSpeech:智能语音示例环境搭建Win11_第4张图片

2、cuDNN 的安装

官网下载地址:https://developer.nvidia.com/rdp/cudnn-archive
选择对应的版本:
飞桨PaddleSpeech:智能语音示例环境搭建Win11_第5张图片

下载小技巧:如果点击进入,需要注册账号再下载;若右键选择下载工具,可以直接下载!

飞桨PaddleSpeech:智能语音示例环境搭建Win11_第6张图片
需要做的事是:把压缩包中cuda文件夹下的所有内容与之前 CUDA的安装路径(一般为C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0(此处为具体版本号,自行更改)合并(也就是直接 复制粘贴/解压 过去,过程应该是不会报错的,都是新东西)!

3、添加PATH环境变量

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.6

%NVIDIA_GPU_HOME%\bin

%NVIDIA_GPU_HOME%\libnvvp

飞桨PaddleSpeech:智能语音示例环境搭建Win11_第7张图片

飞桨PaddleSpeech:智能语音示例环境搭建Win11_第8张图片

以上环境搭建后,记得重启电脑!!!

4、重新运行main.py

[ WARNING] - The sample rate of the input file is not 16000.
The program will resample the wav file to 16000.
If the result does not meet your expectations,
Please input the 16k 16 bit 1 channel wav file.
Could not locate zlibwapi.dll. Please make sure it is in your library path!

下载相应组件并copy到指定目录:
飞桨PaddleSpeech:智能语音示例环境搭建Win11_第9张图片

关注【笑傲江湖工作室】微信公众号:回复【zlibwapi】,获取下载链接。
lib文件放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.6\lib
dll文件放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.6\bin

四、体验服务

1、启动后端服务:speech_serve

cd speech_server

默认8010端口

python main.py --port 8010

2、启动前端服务:web_client

进入前端目录cd web_client

安装yarn,已经安装可跳过

npm install -g yarn

使用yarn安装前端依赖

yarn install
启动cd web_clientyarn dev --port 8011

3、访问开始体验

http://localhost:3000/

飞桨PaddleSpeech:智能语音示例环境搭建Win11_第10张图片

欢迎关注小程序

飞桨PaddleSpeech:智能语音示例环境搭建Win11_第11张图片

你可能感兴趣的:(paddlepaddle,人工智能)