kaldi中使用PyTorch训练模型

Daniel Povey 去年年末在小米开发者大会上说要打造下一代kaldi。
kaldi中使用PyTorch训练模型_第1张图片
目前官方网站上已经有一些进展,已经使用pybind11将Python接口添加到Kaldi中,在pybind11分支中。
目前 Kaldi Pybind 仍然在开发完善中,不过可以下载下来实验。

拉取最新代码。
切换到 pybind11分支
git checkout pybind11
cd pybind
pip install pybind11
make -j4
编译完成后设置环境变量。

export KALDI_ROOT=/aiwork/kaldi (kaldi安装路径)

export PYTHONPATH=$KALDI_ROOT/src/pybind:
$PYTHONPATH

kaldi/egs/aishell/s10/中已有demo 用 PyTorch 执行LF-MMI(Lattice-Free Maximum Mutual Information)
执行run.sh脚本即可。

训练速度确实比用kaldi原来的要快很多,我没有详细记录对比,但是WER要比原来的要高1-2个百分点,这一点我相信在后面会完善好。

官网demo 结果训练时间对比。
training time for 6 epochs:
kaldi pybind with PyTorch: about 45 minutes
kaldi nnet3: about 4 hours 37 minutes.

你可能感兴趣的:(语音识别,pytorch,神经网络,深度学习)