NLP常用知识点总结

出于面试的需要,需要总结下自然语言处理的方方面面和常用知识点

NLP领域

首先总结NLP主要研究问题:

  • 机器翻译
  • 实体识别
  • 文本分类
  • 问答系统
  • 自动摘要
  • 情感分析
  • 阅读理解
  • 对话机器人
  • 机器写作
  • 语音识别

NLP研究方法

1.语言模型

定义

通过语料计算某个句子出现的概率(概率表示)

应用

输入法语音识别消除歧义

给定拼音串 ta shi yan yan jiu saun fa de

可能的汉字串:踏实烟酒算法的 他是研究酸法的 他是研究算法的,基于统计语料判断出最后一句是合理的。

意义

开启了自然语言处理的统计方法

步骤

  1. 收集大量语料
  2. 对语料进行分析,得出知识
  3. 针对场景建立算法模型
  4. 解释和应用结果

2.概率图模型

  • 最大熵模型
  • 条件随机场
  • 隐马尔可夫过程
  • 主题模型

3.深度学习方法

  • 分类方法
    • SVM
  • RNN
  • 词嵌入

你可能感兴趣的:(自然语言处理)