ASR学习经验分享

声明

以下分享的学习经历和经验皆是本人亲身的学习经历,推荐的每本书和每个视频课都有认真读完或看完,基于此分享一些好的东西给有需要的人。

相关基础

要学习语音识别,DSP、线性代数以及一些基本编程能力肯定是要有的

学习步骤

  1. 首先是深度学习相关知识:大力推荐《Deep Learning》,这本书相信大家都很认可,时间有限的话重点看前两部分就行。视频课比较推荐台大李宏毅老师的“Machine Learning”,李老师讲的真的很好,B站以及Youtube上都有资源。
  2. 然后是一些语音信号方面的知识:可以看看《语音信号处理(第3版)》,浏览浏览,对语音的各个领域比如声纹识别以及语音识别都有个大概了解。
  3. 一些机器学习框架的学习使用:本人是从Pytorch学起,上手之后再学一些别的框架比如Keras就很容易了。比较推荐B站上的一个Pytorch视频课,链接:视频课
    上课的是个博士生,本身是做NLP的,不仅可以快速入门Pytorch对之后的ASR学习也很有帮助,本人当时只看了这个视频课的前两节课,就基本可以自己操作 Pytorch了,本年后开始学习ASR后才剩下的部分看完。
  4. ASR知识学习:首先目前ASR框架大致分为:HMM和seq2seq两派。HMM相对传统,当然和深度学习结合后效果还是很好的,据我所知一些商用的就是采用的DNN-HMM Hybrid的架构。在这类方法市面上很多书,可以看看《解析深度学习:语音识别实践》。对于 seq2seq方法的学习,涉及到的知识都比较新,大力推荐李宏毅老师的视频课:人类语言处理 HLP,讲的很透彻。
  5. 最后,基本知识都有了之后,重点找开源的程序,自己读读程序,再尝试复现几篇论文的结果,你就真正入门了。

你可能感兴趣的:(机器学习)