数学之美-第三章-统计语言模型

文章介绍了什么是统计模型,统计模型的如何得来。
特别是马尔可夫假设。
然后就是一个扩展阅读:关于统计语言模型的工程诀窍

  • 高阶语言模型的获得:主要是二元和三元,而之后的四元及其以上的效果提升不明显
  • 关于模型的训练,零概率问题和平滑方法。正好这段时也正在写关于一元(就是昨天才写完)的模型训练和平滑问题的解决,但是我用的模型是贝叶斯模型训练的分类器。虽然我接触的那本书和这本的平滑理论原理是一样的,但是关于他的计算公式那些我还是一知半解的,可能是数学基本功太差了的原因,希望自己后面补一补。
  • 最后就是关于语料库的选择,这个不用多提,很重要,就像一个人初入门的工作者和行业领域专家一个道理。问题需要有针对性才能有更好的解决办法
    什么是统计模型很容易理解,当时关于如何构建模型学问很大,不急慢慢来,一个一个的来。

你可能感兴趣的:(数学之美-第三章-统计语言模型)