关于kaldi的一些其他资料

最近,终于跑完kaldi的timit里面所有的例子,最大的感触就是机器要给力,所以拥有一个很好配置的电脑对于做语音识别的人来说是多么重要。我不能定义自己是完全做语音识别的,因为我导师的原因,我只能利用自己的时间来学习语音识别,其他时间还得去看音乐分离,这个是我的毕业设计。下面我直说了,关注我博客的人就知道我前面提到的kaldi+pdnn.

下面的资料得感谢@Alice美女的。下面就是一些资料啊,希望对大家有用吧。

  1.kaldi-trunk的资料:这里面主要有babel数据库的例子。babel 数据库是什么,我自己也不清楚,网上只是介绍了这个是一个多语言的数据库。大家有知道,可以留言跟我说声哦。谢谢……这个跟kaldi的trunk有不一样,网址:https://github.com/vimal-manohar91/kaldi-trunk

  2.https://github.com/vimal-manohar91/workspace这个可能主要是bottleneck feature。

  3.kaldi+pdnn在sourceforge上的主页:http://sourceforge.net/p/kaldipdnn/code-0/HEAD/tree/ 里面还是告诉大家怎么去用kaldi+pdnn。我现在不清楚这个能不能很好的结合,因为我没有数据库啊。呵呵……


此外,大家在用kaldi+pdnn时需要装上theano这个。这个在ubuntu下安装的方法主页有介绍,我就copy到这里:

Installation steps

Ubuntu 11.10/12.04/12.10/13.04:

  1. sudo apt-get install python-numpy python-scipy python-dev python-pip python-nose g++ libopenblas-dev git
  2. sudo pip install Theano

If the packages libatlas3gf-base or libatlas-dev are already installed, there will be problems as they conflict with libopenblas-dev. If you see NumPy errors, the simplest is to remove libopenblas-dev and its dependency libopenblas-base like this: sudo apt-get remove libopenblas-base. The ideal would be that you remove libatlas3gf-base and libatlas-dev, but you will need to reinstall python-numpy, python-scipy and all other packages that used it. OpenBLAS is faster then ATLAS most of the time and it allows to control the number of threads used during the execution.

Ubuntu 11.04:
  1. sudo apt-get install python-numpy python-scipy python-dev python-pip python-nose g++ git libatlas3gf-base libatlas-dev
  2. sudo pip install Theano

资料留在这里,欢迎大家试用,当然我希望你试用了跟我说声。呵呵……

你可能感兴趣的:(关于kaldi的一些其他资料)