TensorFlow练习15: 中文语音识别

语音识别的应用领域非常广泛,洋文名Speech Recognition。它所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。

语音识别是前文《聊天机器人》必不可少的一个组件,本帖就使用TensorFlow做一个中文语音识别。

使用的数据集

THCHS30是Dong Wang, Xuewei Zhang, Zhiyong Zhang这几位大神发布的开放语音数据集,可用于开发中文语音识别系统。

为了感谢这几位大神,我是跪在电脑前写的本帖代码。

下载中文语音数据集(5G+):

在开始之前,先好好检视一下数据集。

训练

相关资源:

  • TensorFlow练习8: 基于RNN生成音乐
  • Machine Learning is Fun Part 6: How to do Speech Recognition with Deep Learning
  • 深度学习大牛Andrew Ng:Speech Recognition and Beyond
  • https://github.com/kaldi-asr/kaldi
  • http://cmusphinx.sourceforge.net
  • https://pypi.python.org/pypi/SpeechRecognition

你可能感兴趣的:(语音合成技术)