学习NLP的第1天——学习大纲及入门资源整理

我以前虽然在研究中用过一些NLP相关方法,但是都仅限于最基础的应用,最近开始系统性地自学NLP。将学习过程进度以及遇到问题的解决方案记录于此,不求踩出一条路,只求为其他自学的朋友踩掉一些坑。

NLP基本大纲

首先,我依据以前的了解和收集的各处教程、网课,整理了NLP主要的学习大纲。因为一些方法我并没有用过也不了解,所以可能逻辑上会存在问题,以后理解深刻会逐渐更正。

算法模型

概率图模型、马尔科夫过程、隐马尔科夫过程、马尔科夫网、最大熵模型、条件随机场(CRF)

深度学习

支持向量机、LSTM、BERT

词汇级

语法分析:中文分词、词性标注、命名实体识别(人名、地名、机构名、日期)、新词发现

语义分析:语义表示、语义消歧

语义关系:语义关系建模、语义关系抽取、语义关系计算

句子级

语句变换:近义词替换、语义归一化、省略纠错

语句解析:句法结构分析、依存结构分析

语句表示:语义表示、文本分类、句子相似度

语义分析:关键词提取(TF-IDF、TextRank)、特征提取(特征提取与权重计算)、句意理解、意图识别、情感分析、语境分析

语句生成:规则模板、知识图谱、机器翻译

段落/篇章级

单文本分析:文本摘要、文本主题、文本分析、文档结构分析、文本语义分析、情感分析

多文本分析:文本主题、文本分类、文本排重、文本聚类、词向量、文档相似度、主题模型(LDA)、PLSA

综合性任务

问答系统(问题分析、信息检索、答案抽取)、自动摘要(自动文摘)、机器翻译、信息检索(布尔模型、向量空间模型、概率模型)、文档分类、信息过滤、信息提取、文本挖掘、舆情分析、机器写作、语音识别

NLP的入门资源整理

https://www.cnblogs.com/nxf-rabbit75/p/10967943.html 大纲

http://www.52nlp.cn/ 教程

https://github.com/duoergun0729/nlp 教程

https://gitbook.cn/gitchat/column/5b10b073aafe4e5a7516708b 网课

https://github.com/fighting41love/funNLP 资源库

 

你可能感兴趣的:(学习NLP的第N天)