NVIDIA Riva中文手册 (二) —— Riva快速入门(数据中心平台)

Riva快速入门(数据中心平台操作指南)

NVIDIA® Riva Speech Skills 快速入门指南是试用 Riva 的起点;具体来说,本指南使您能够在本地工作站上快速部署预训练模型并运行客户端示例。

Riva Speech Skills 支持两种架构,Linux x86_64 和 Linux ARM64。这些在本文档中被称为数据中心 (x86_64) 和嵌入式 (ARM64),Linux ARM64架构的嵌入式平台操作指南将在下一章节进行说明。

一 :数据中心平台使用的先决条件

在使用 Riva 之前,请确保您满足以下先决条件:

  1. 您可以访问并登录到 NVIDIA NGC。有关分步说明,请参阅 NGC 入门指南。
  2. 您可以使用Linux x86_64架构的操作系统和NVIDIA Volta™、NVIDIA Turing™ 或基于 NVIDIA Ampere 架构的GPU。
    下图截选了Riva Speech Skills 2.1.0 在数据中心平台上支持的GPU硬件。详情请参考Support Matrix
    NVIDIA Riva中文手册 (二) —— Riva快速入门(数据中心平台)_第1张图片
  3. 您安装了支持 NVIDIA GPU 的 Docker。详情请参阅Support Matrix

二:可供部署的模型

有两种方式可以使用NGC目录中所提供的预训练模型来部署Riva技能:

  1. 本地化Docker: 您可以使用快速入门脚本结合Docker部署Riva服务。
  2. Kubernetes: Riva Helm Chart设计用于自动化Kubernetes集群的按钮部署步骤, 嵌入式平台不支持此选项。

Note:另外除了使用预先训练的模型,Riva技能可以使用NVIDIA TAO工具包运行微调自定义模型。 有关使用TAO Toolkit创建模型存储库的高级选项的详细信息请参阅使用TAO Toolkit进行模型开发一节。

三:本地快速启动脚本部署

Riva包括快速启动脚本,以帮助您快速开始使用Riva技能。 这些脚本用于本地部署服务、测试和运行示例应用程序。

针对于数据中心平台:

1.可以使用NGC的CLI工具从命令行下载快速启动脚本,指令如下:

ngc registry resource download-version nvidia/riva/riva_quickstart:2.1.0

2.下载完成后进入快速启动脚本目录中

cd riva_quickstart_v2.1.0

3.初始化并启动Riva(初始化步骤将会下载并准备Docker映像和模型, start命令启动服务器)

bash riva_init.sh
bash riva_start.sh

4.对于数据中心平台,为每个服务启动都带有示例客户端的客户端容器。可以通过以下命令开启客户端:

bash riva_start_client.sh

5.客户端开启后,从客户端容器内部可以使用容器所提供的 Jupyter 笔记本,通过以下指令开启jupyter notebook并使用脚本案例。

jupyter notebook --ip=0.0.0.0 --allow-root --notebook-dir=/work/notebooks

Note:如果在云服务提供商(例如 AWS 或 GCP)上运行 Riva 快速启动脚本,请确保您的计算实例具有外部可见的 IP 地址。要运行 Jupyter 笔记本,请将浏览器窗口连接到该外部 IP 地址的正确端口(默认为 8888)

6.完成试验步骤并实现推理后,若想停止服务器则运行:

bash riva_stop.sh

有关如何自定义本地部署的更多详细信息请参阅 Local (Docker)

四:使用 Riva 转录音频文件(语音识别)

对于自动语音识别 (ASR),从 Riva 客户端容器内部运行以下命令,以执行音频文件的流式传输和离线转录。

  • 进行离线语音识别指令:
riva_asr_client --audio_file=/work/wav/en-US_sample.wav
  • 进行流式语音识别指令:
riva_streaming_asr_client --audio_file=/work/wav/en-US_sample.wav

注意:
–audio_file参数用来指定需要进行语音识别的语音文件的路径。
如果使用 SSL/TLS,请确命令中保包含 --ssl_server_cert /ssl/server.crt 参数选项。

五:使用 Riva 生成语音(语音合成)

在 Riva (数据中心)客户端容器中运行以下命令来合成音频文件。命令行案例如下:

riva_tts_client --voice_name=English-US-Female-1 \
                --text="Hello, this is a speech synthesizer." \
                --audio_file=/work/wav/output.wav

注意
–voice_name:选择语音合成的声音样本
–text:指定需要进行语音合成的文字
–audio_file: 合成出来的音频文件output.wav存储在 /work/wav 目录中。

六:总结

在本快速入门指南中,您了解到了如何使用预训练模型部署Riva 服务器和使用命令行 API 的基础知识。

  • 初始化启用Riva服务器

  • 启动Riva客户端

  • 通过 Jupyter 笔记本使用 Riva API

  • 客户端执行 Riva 命令行完成语音识别

  • 客户端执行 Riva 命令行完成语音合成

  • 有关如何在实际应用中使用 Riva 技能的更多示例,您可以关注虚拟助手演示

  • 有关微服务gRPC可以参考 gRPC gRPC & Protocol Buffers

  • 更多的客户端命令行可参考 API Command-line Clients

  • 要了解有关 Riva 技能的更多信息,请访问 NVIDIA Riva 开发者主页NVIDIA Riva | NVIDIA Developer。

  • 更多精彩内容,请扫描下方二维码或者访问https://developer.nvidia.com/zh-cn/developer-program 来加入NVIDIA开发者计划
    NVIDIA Riva中文手册 (二) —— Riva快速入门(数据中心平台)_第2张图片

你可能感兴趣的:(自然语言处理,语音识别,语音合成,人工智能)