docker启动paddlespeech服务,并使用接口调用

一、检查docker容器是否启动

1.输入命令  systemctl status docker

启动        systemctl start docker
守护进程重启   sudo systemctl daemon-reload
重启docker服务   systemctl restart  docker
重启docker服务  sudo service docker restart
关闭docker service docker stop
关闭docker systemctl stop docker
检查docker状态  systemctl status docker

若docker正常启动则显示界面如下

docker启动paddlespeech服务,并使用接口调用_第1张图片

2.启动服务时可能出现报错

可能为权限不够导致

输入su,并输入当前用户登录密码即可进入root权限模式,再次启动即可

Docker启动失败报错Failed to start Docker Application Container Engine解决方案

二、docker启动paddlespeech镜像

1.安装

初始需要下载镜像到本地,参照官方文档docker安装paddlespeech,并启动服务

#下载并启动服务
docker run --name dev -v $PWD:/mnt -p xxxx:xxxx -it paddlecloud/paddlespeech:develop-cpu-fb4d25 /bin/bash

其中xxxx:xxxx,前为端口映射端口,后为实际请求端口

比如想启动paddlespeech基础服务需要将实际请求设置为8090,包含中文语音识别,中文语音合成等等

        但此服务语音识别和合成只能识别中文以及数字,字母及英文无法识别,使用需要注意

2.二次使用

docker run  -p XXXX:XXXX -it paddlecloud/paddlespeech:develop-cpu-fb4d25 /bin/bash

使用此命令即可启动paddlespeech镜像

若想查看当前有哪些镜像,使用  docker images  命令即可查看

三、启动paddlespeech服务

1.官方文档说明有三种服务启动方式

#启动AI Studio服务,即包括语音识别,语音合成,音频分类等多种服务
paddlespeech_server start --config_file ./speech_server/conf/application.yaml
#启动完毕,即可看到启动端口为8090
#需要在启动docker镜像时指定实际端口
#启动流式tts服务
paddlespeech_server start --config_file ./demos/streaming_tts_server/conf/tts_online_application.yaml
#启动流式asr服务
paddlespeech_server start --config_file ./demos/streaming_asr_server/conf/application.yaml

启动成功后应该显示

[2023-05-02 07:16:34,644] [    INFO] - start to init the engine
[2023-05-02 07:16:34,644] [    INFO] - asr : python engine.
W0502 07:16:37.497296  1187 gpu_resources.cc:61] Please NOTE: device: 0, GPU Compute Capability: 8.9, Driver API Version: 12.1, Runtime API Version: 11.7
W0502 07:16:37.502528  1187 gpu_resources.cc:91] device: 0, cuDNN Version: 8.8.
2023-05-02 07:16:38.195 | INFO     | paddlespeech.s2t.modules.embedding:__init__:153 - max len: 5000
[2023-05-02 07:16:39,064] [    INFO] - Initialize ASR server engine successfully on device: gpu:0.
[2023-05-02 07:16:39,064] [    INFO] - tts : python engine.
...
[2023-05-02 07:16:55] [INFO] [on.py:61] Application startup complete.
INFO:     Uvicorn running on http://127.0.0.1:8090 (Press CTRL+C to quit)
[2023-05-02 07:16:55] [INFO] [server.py:212] Uvicorn running on http://127.0.0.1:8090 (Press CTRL+C to quit)

2.若想使用中英文混合语音合成可以使用飞浆另一个产品PP-TTS飞浆文档

这里不多做说明,需要自行文档查阅

四、使用服务

1.使用以上服务可以有三种方法验证

        1、命令行

        2、api接口

        3、python程序调用

此文档  paddlespeech正常服务使用方法  具体说明每一种使用方式

若想使用流式tts和流式asr服务请参考以下文档

https://github.com/PaddlePaddle/PaddleSpeech/wiki/PaddleSpeech-Server-RESTful-API

PaddleSpeech Server WebSocket API · PaddlePaddle/PaddleSpeech Wiki · GitHub

使用postman请求,并带body参数请求服务,需要注意请求类型,正常服务一般为post请求

2.请求返回数据

audio数据为base64码,需要转为wav编码即可听到合成音频

到此服务启动->调用接口->使用数据结束

                                                                                                                        结束

你可能感兴趣的:(docker,容器,语音识别,语音合成)