基于深度学习的语音识别毕设备忘录(1)

**

基于深度学习的语音识别备忘录(1)

作为超级萌新在配置框架TensorFlow和Keras时所遇到的问题的记录

**

写在前面

       也许对于那些已入门的人来说,看到我最开始的操作时会觉得不可理喻,甚至会有些愠怒。但请见谅,这是一个光知道些理论和术语,却对自己要做什么和怎么做毫无规划、一窍不通的人的真实记录。

GitHub:从下载到迷茫

       最开始在了解到Kaldi在语音识别领域的地位后,果断下载了GitHub。将Kaldi下载好后,我发现我并不知道如何打开它,于是搜索“如何使用Kaldi”。显然,大多数帖子讲的都是基础的模型训练,而横亘在我面前的问题是——依据以往的经验,C有Workspace;C#有.sln;Java也有Project打开选项——而到了Kaldi这,不仅没有看到任何一个文件类似工程头文件,选择打开整个文件夹也因为不是工程而无法显示(顺带一提,一开始用的是自带的Spyder,我连创好的新工程都无法打开)。我不断地搜索各种“如何使用“或者是“如何打开”工程,但一无所获(估计别人也没想到有人会无知到这份上 ),于是越来越烦躁(无能狂怒 )。

重缕头绪,粗拟大纲

       在这里,我要感谢实验室的师哥师姐们,他们热心地询问我的情况,得知了我的问题后也没有厌烦,而是认真又耐心地协助解决。
  首先,他在查看了Kaldi内的文件列表后,告诉我用Python跑就行,接着问我这是工具包(Toolkit)还是框架(Framework),正是这句话点醒了我,我虽然记得Kaldi是工具包,但压根没意识到只有工具包是跑不起来的。于是接下来我便开始寻找合适的框架和语言了。当时还正儿八经地在想是用Python(小学期溜了,没学 )还是用C#;是用Keras还是用TensorFlow;用Windows还是Linux。稍一调查就发现:用Python;Keras不仅适合新手,而且两者并不冲突;倒是Linux没装,先用着Windows,毕竟牵扯到一些程序以外的事情,如果是自己配的电脑的话,估计直接就上Linux了。
既然已经有了大致的方向,接下来需要做的事情就是一步一步来做即可。
  结合师哥姐的建议,我把Spyder换成了Pycharm,又下载了Anaconda。与此同时,我还私下买了《TensorFlow+Keras:深度学习人工智实践应用》和《Python:从零基础到项目实战》两本书。(但说真的,买回来总感觉像是F1帮助手册汉化版,好多都是网上随便查查都找得到的
       初步的准备工作已就绪,接下来就慢慢开始做吧。

环境配置

       由于实验室配备的电脑并不是全新的,其上一任主人已经安装好了各种基础的软件,所以我就省去了这份功夫。因此第一步转变为,利用Anaconda配置TensorFlow和Keras。
参考文章:
Anaconda环境安装指导
在Windows中安装Tensorflow和Kears深度学习框架【虽然是百家号,实用就行】

**安装步骤:**
Anaconda的安装

基于深度学习的语音识别毕设备忘录(1)_第1张图片
基于深度学习的语音识别毕设备忘录(1)_第2张图片
基于深度学习的语音识别毕设备忘录(1)_第3张图片
基于深度学习的语音识别毕设备忘录(1)_第4张图片

测试并安装环境
1、打开cmd,查看Anaconda是否安装成功

conda --version

基于深度学习的语音识别毕设备忘录(1)_第5张图片

2、检查已有的环境变量

conda info --envs

说明尚未安装环境,很“干净”
基于深度学习的语音识别毕设备忘录(1)_第6张图片

3、建立Anaconda虚拟环境

conda create --name tensorflow python=3.6(3.5 or 3.6,3.7在此时尚未支持)

基于深度学习的语音识别毕设备忘录(1)_第7张图片

y:安装

基于深度学习的语音识别毕设备忘录(1)_第8张图片
基于深度学习的语音识别毕设备忘录(1)_第9张图片

4、根据提示,激活虚拟环境

activate tensorflow

出现这个就是对的了

5、安装TensorFlow

pip install tensorflow

基于深度学习的语音识别毕设备忘录(1)_第10张图片

安装完成

基于深度学习的语音识别毕设备忘录(1)_第11张图片

6、安装Keras

pip install keras

同理
基于深度学习的语音识别毕设备忘录(1)_第12张图片

安装失败好几次后,终于成功

基于深度学习的语音识别毕设备忘录(1)_第13张图片

6.5检查环境安装结果
环境安装已完成

基于深度学习的语音识别毕设备忘录(1)_第14张图片

7、使用Pycharm设置编译器,初步调试

基于深度学习的语音识别毕设备忘录(1)_第15张图片

在右上角的齿轮处寻找已安装的Anaconde/TensorFlow/Python.exe作为编译器(Interpreter)

基于深度学习的语音识别毕设备忘录(1)_第16张图片

选择Conda Environment(毕竟是用Anaconda装的)

基于深度学习的语音识别毕设备忘录(1)_第17张图片

打开在GitHub下载好的Keras框架
选择入门级的mnist_cnn作为例子运行

基于深度学习的语音识别毕设备忘录(1)_第18张图片

可以看到Pycharm开始跑程序了

至此,环境的初步建立大功告成,接下来就是熟悉框架,试着调调参,为最后的语音识别做好准备

blog撰写备注
【 】空格
居中

你可能感兴趣的:(毕设记录,语音识别)