NVIDIA® Riva Speech Skills 快速入门指南是试用 Riva 的起点;具体来说,本指南使您能够在本地工作站上快速部署预训练模型并运行客户端示例。
Riva Speech Skills 支持两种架构,Linux x86_64 和 Linux ARM64。这些在本文档中被称为数据中心 (x86_64) 和嵌入式 (ARM64),Linux ARM64架构的嵌入式平台操作指南将在下一章节进行说明。
在使用 Riva 之前,请确保您满足以下先决条件:
有两种方式可以使用NGC目录中所提供的预训练模型来部署Riva技能:
Note:另外除了使用预先训练的模型,Riva技能可以使用NVIDIA TAO工具包运行微调自定义模型。 有关使用TAO Toolkit创建模型存储库的高级选项的详细信息请参阅使用TAO Toolkit进行模型开发一节。
Riva包括快速启动脚本,以帮助您快速开始使用Riva技能。 这些脚本用于本地部署服务、测试和运行示例应用程序。
1.可以使用NGC的CLI工具从命令行下载快速启动脚本,指令如下:
ngc registry resource download-version nvidia/riva/riva_quickstart:2.1.0
2.下载完成后进入快速启动脚本目录中
cd riva_quickstart_v2.1.0
3.初始化并启动Riva(初始化步骤将会下载并准备Docker映像和模型, start命令启动服务器)
bash riva_init.sh
bash riva_start.sh
4.对于数据中心平台,为每个服务启动都带有示例客户端的客户端容器。可以通过以下命令开启客户端:
bash riva_start_client.sh
5.客户端开启后,从客户端容器内部可以使用容器所提供的 Jupyter 笔记本,通过以下指令开启jupyter notebook并使用脚本案例。
jupyter notebook --ip=0.0.0.0 --allow-root --notebook-dir=/work/notebooks
Note:如果在云服务提供商(例如 AWS 或 GCP)上运行 Riva 快速启动脚本,请确保您的计算实例具有外部可见的 IP 地址。要运行 Jupyter 笔记本,请将浏览器窗口连接到该外部 IP 地址的正确端口(默认为 8888)
6.完成试验步骤并实现推理后,若想停止服务器则运行:
bash riva_stop.sh
有关如何自定义本地部署的更多详细信息请参阅 Local (Docker)
对于自动语音识别 (ASR),从 Riva 客户端容器内部运行以下命令,以执行音频文件的流式传输和离线转录。
riva_asr_client --audio_file=/work/wav/en-US_sample.wav
riva_streaming_asr_client --audio_file=/work/wav/en-US_sample.wav
注意:
–audio_file参数用来指定需要进行语音识别的语音文件的路径。
如果使用 SSL/TLS,请确命令中保包含 --ssl_server_cert /ssl/server.crt 参数选项。
在 Riva (数据中心)客户端容器中运行以下命令来合成音频文件。命令行案例如下:
riva_tts_client --voice_name=English-US-Female-1 \
--text="Hello, this is a speech synthesizer." \
--audio_file=/work/wav/output.wav
注意:
–voice_name:选择语音合成的声音样本
–text:指定需要进行语音合成的文字
–audio_file: 合成出来的音频文件output.wav存储在 /work/wav 目录中。
在本快速入门指南中,您了解到了如何使用预训练模型部署Riva 服务器和使用命令行 API 的基础知识。
初始化启用Riva服务器
启动Riva客户端
通过 Jupyter 笔记本使用 Riva API
客户端执行 Riva 命令行完成语音识别
客户端执行 Riva 命令行完成语音合成
有关如何在实际应用中使用 Riva 技能的更多示例,您可以关注虚拟助手演示
有关微服务gRPC可以参考 gRPC gRPC & Protocol Buffers
更多的客户端命令行可参考 API Command-line Clients
要了解有关 Riva 技能的更多信息,请访问 NVIDIA Riva 开发者主页NVIDIA Riva | NVIDIA Developer。
更多精彩内容,请扫描下方二维码或者访问https://developer.nvidia.com/zh-cn/developer-program 来加入NVIDIA开发者计划