python pytorch语音识别_PyTorch通过ASR实现语音到文本端的模型以及pytorch语音识别(speech) - pytorch中文网...

ASR,英文的全称是Automated Speech Recognition,即自动语音识别技术,它是一种将人的语音转换为文本的技术。今天我们主要了解pytorch实现语音到文本的端到端模型。

speech

speech是一个开源软件包,用于构建自动语音识别的端到端模型。目前支持具有注意力和连接主义时间分类的序列 - 序列模型。

这个软件的目标是促进语音识别端到端模型的研究。这些模型在PyTorch中实现。

该软件仅在Python2.7中测试过,但我们打算同时支持2.7和3.5。

安装

我们建议创建一个虚拟环境并在那里安装python需求。

virtualenv

source /bin/activate

pip install -r requirements.txt

然后按照适用于您的机器的PyTorch版本的安装说明进行操作 。

在安装了所有python需求之后,从顶层目录运行:

make

构建过程需要CMake以及Make。

之后,setup.sh从源码安装。

source setup.sh

考虑把这个添加到你的bashrc。

您可以通过运行tests目录中的测试来验证安装是否成功。

cd tests

pytest

运行

训练模型运行

python train.py

模型完成训练后,您可以使用

python eval.py

要查看每个脚本使用的可用选项-h:

python {train, eval}.py -h

例子

有关模型配置和数据集的示例,请访问示例目录。每个示例数据集应具有用于下载和准备数据的指令和/或脚本。还应该有一个或多个模型配置可用。每个配置的结果将记录在每个对应的例子中README.md。

姓名地址:Github

原创文章,转载请注明 :PyTorch通过ASR实现语音到文本端的模型以及pytorch语音识别(speech) - pytorch中文网

原文出处: https://ptorch.com/news/81.html

问题交流群 :168117787

你可能感兴趣的:(python,pytorch语音识别)