刚开始参照如下博客进行学习,并针对自己在windows XP平台上的问题
http://www.cnblogs.com/huanghuang/archive/2011/07/14/2106579.html
一、使用平台
windows XP + VS2010
二、 CMUSphinx语音识别工具包
Pocketsphinx — 用C语言编写的轻量级识别库
Sphinxbase — Pocketsphinx所需要的支持库
Sphinx3 — 为语音识别研究用C语言编写的解码器
CMUclmtk — 语言模型工具
Sphinxtrain — 声学模型训练工具
三、环境搭建
http://cmusphinx.sourceforge.net/wiki/download/
下载最新版,我使用的是
sphinxbase-0.7.tar.gz
pocketsphinx-0.7.tar.gz
sphinxtrain-1.0.7.tar.gz
cmuclmtk-0.7.tar.gz
然后直接编译,先编译sphinxbase,将其解压后,它的文件名为sphinxbase,再编译,然后依次编译
但是我在编译sphinxtrain时老是有错误,无法解决,然后又用了另一种方法。
同样在下载页面下载,不过下载的是snapshot版本,
pocketsphinx-snapshot,sphinxbase-snapshot,sphinxtrain-snapshot,
将这3个都解压到 F:\speech_recognition中,分别编译,在debug中生成.dll和.exe文件
同时将前面下载的最新版的前3个文件分别解压到F:\acoustic中
将F:\speech_recognition\sphinxbase\debug中的.exe与.dll文件拷贝到F:\acoustic\sphinxbase\bin中;
F:\speech_recognition\pocketsphinx\bin\Debug 中的 .exe与.dll文件拷贝到 F:\acoustic\pocketsphinx\bin中;
F:\speech_recognition\SphinxTrain\bin\Debug中的.exe拷贝到F:\acoustic\sphinxtrain\bin\Release中(Release是自己建立的)。
cmuclmtk-0.7.tar.gz直接编译即可。
这样环境就基本建立了。
利用现有的语言模型和声学模型,和刚开始链接中的博客是一样的。但是我识别出来的都是乱码,不知道是怎么回事。