不知不觉读研已经快两个月了,抱着对NLP极大的兴趣,每天都是学习新的东西,但是最后发现学完什么也没有收获,依旧是以前喜欢学东西,不去深入的毛病。但值得欣慰地是自己却没有像以前一样失去对NLP的兴趣。于是在总结之后以及最近看到一位NLP直博大佬的博客,觉得要有一个明确的NLP学习计划和路线才能不至于陷入迷茫,以及一种“学而不思则罔,思而不学则殆”的误区。同时参考大佬的博客对自己的做一个大翻新,不仅仅作为自己博客的导航,同时也是自己在这个领域的笔记和技能树,希望在后期慢慢地去点亮。
计划选择了“Apple of my eyes”这个名字,是因为自己反思自己对朋友都是计划言出必行,基本上不会拒绝和延迟。嗯,其他原因可能也就是希望借学习替代“沈佳宜”吧!呵呵,这不重要,重要的是这个是现阶段的学习计划和目标,同时也作为自己的学习笔记。
参照大佬的博客,主要部分如下:我暂时不去想自己的计划,直接拿来主义。(后期去迭代!)
本科混乱摸鱼学习经历
目录
一、数学基础
二、Python基础
三、PyTorch基础
四、LaTex
五、C/C++、数据结构与算法
六、爬虫
七、学术英语
八、程序人生
九、Linux基础
十、web,前端,测试,安卓
十一、其他程序员必备
十二、其他学习以及日程
专业知识
一、机器学习
二、深度学习
三、自然语言处理
四、GAN
五、强化学习
六、大数据与云计算
项目与论文
一、 图神经网络
二、 预训练语言模型
三、智能问答
四、 文本分类项目与比赛
五、 对话情感识别与生成
六、元学习与小样本学习
七、知识图谱
八、自监督学习
九、 知识蒸馏
十、序列标注
十一、对话系统
十二、推荐系统
1. 线性代数
(考研复习过,后期整理补充!)
2. 概率论与数理统计
(考研复习过,后期整理补充!)
3. 数学基础
该专栏主要对一些教科书或参考书涉及或附录中的数学知识进行整理(后期补充)。
4. 其他数学
该专栏主要对平时看论文或做实验过程中遇到的一些数学知识或数学问题进行整理。
1. Python基础
该专栏主要整理了Python的一些基础知识和语法,适合0基础到入门。
2. Python数据分析
该专栏主要对Python的数据分析常用库的相关用法进行整理,包括NumPy、Pandas、Matplotlib、Seaborn、Scipy、Sklearn等。
3. Python其他
该专栏主要对平时学习过程中遇到的一些不熟悉的Python语法或知识进行整理。
4. Django
主要涉及Django的一些东西。
1. PyTorch从入门到实践
该专栏主要整理了PyTorch的基础知识,常用工具的用法以及深度学习项目代码的组织结构(推荐)。
2. PyTorch中文教程
该专栏主要转述了官方的PyTorch教程。
3. 动手学PyTorch
该专栏主要基于李沐的《动手学深度学习》,Github有人将其用Pytorch实现了一遍(原书是MxNet),特此整理。
4. PyTorch杂谈
该专栏主要对平时学习过程中遇到的一些不熟悉的PyTorch语法或知识以及一些之前没有遇到过的工具或库(如,torchtext、torchnet等)的用法进行整理。
LaTex学习
该专栏主要对LaTex的一些用法或基础知识以及平时编写文档中遇到的一些问题进行整理。
1. 程序设计与算法
本专栏主要基于北大郭炜老师的程序设计与算法系列课程进行整理,包括课程笔记和OJ作业。该系列课程有三部分: (一) C语言程序设计;(二) 算法基础;(三) C++面向对象程序设计
2. 数据结构与算法(Python版)
本专栏主要基于北大的数据结构与算法教程(Python版)进行整理,包括课程笔记和OJ作业。
3. LeetCode(敬请期待)
本专栏主要记录LeetCode刷题笔记。
4. 程序员算法趣题
本专栏主要对程序员算法趣题这本书的算法用python复现。
5. 算法其他
本专栏是平时自己写的算法
1. Python爬虫基础
本专栏主要整理了Python3网络爬虫的一些基础知识和用法,并配以实战案例。
2. Python爬虫进阶
本专栏主要基于爬虫大神崔庆才的教程和书籍,整理了Python3网络爬虫的一些进阶知识和用法,并配以实战案例。
3. 论文爬取系统
之前我曾自己实现了一个学术论文爬取系统,可以输入NLP相关会议名称,关键词以及年份,自动对符合要求的论文进行爬取并保存在本地相应的位置。本专栏将介绍如何构建该论文爬取系统。
4.爬虫所遇问题
记录做爬虫过程中所遇到的一些问题以及解决办法。
学术英语词汇
该专栏主要整理了我在广外学术英语课程学习中遇到的一些不太熟悉的单词。
学术论文写作
主要对平时阅读文献时遇到的生词,句型结构等进行整理,以及论文各个部分的写法和写作技巧。
程序人生
主要对个人学习科研过程中的一些感悟、计划,学术大牛的一些言论或建议,相关顶会信息进行整理。
1. Linux基础
该专栏主要整理了Linux的一些基础知识和相关命令的用法。
2. Linux杂谈
该专栏主要对平时学习过程中遇到的一些不熟悉的Linux知识或命令的用法进行整理。
3. Shell基础
主要介绍编写Shell脚本时常用的一些基础语法和命令。
1. HTML5基础
主要介绍HTML5的基础知识。
2. CSS基础
主要介绍CSS的基础知识。
3. 移动端测试
主要介绍移动端测试的相关知识。
4.Python_Web开发
主要记录自己使用Python进行Web开发的经历
Mac系统随笔(希望能攒钱买一个Mac)
记录Mac系统使用的相关问题与解决方案
Git教程
基于廖雪峰老师的git教程,系统介绍git和github的使用。
Linux系统随笔
记录Linux系统使用的相关问题与解决方案
1. 读研工作日报
主要记录从2020年11月15日开始每天学习和工作日报,方便导师查看以及自己每周的总结整理。
2.心理学
主要是记录自己学习心理学的一些心得和记录,以及一些临床的治疗方法,从而使得自己的内心更加强大。
3.管理学
4.随感小说
5.Arduino 智能小车项目
记录自己本科时候的智能小车项目的实训课程。
6.问题解决
主要是平时遇到的一些问题,包括但不限于编程的问题。
1. 吴恩达机器学习
主要包括吴恩达机器学习课程的笔记整理以及详细实验代码。
2. 李航统计学习方法
主要包括李航统计学习方法(第2版)的笔记整理以及习题和作业代码。
3. 模式识别
国科大《模式识别》课程笔记和作业整理。
4. 林轩田机器学习
主要包括林轩田机器学习基石笔记以及林轩田机器学习技法笔记。
5. 机器学习面试(敬请期待)
机器学习/深度学习常见面试题整理。
6. 集成学习算法(敬请期待)
系统介绍集成学习算法,包括决策树(ID3,C4.5,Cart)、随机森林、GBDT、Bagging、Adaboost以及机器学习竞赛神器XGBoost、LightGBM的原理和使用。
7. 机器学习(敬请期待)
平时学习过程中遇到的有关机器学习问题的整理。
1. 吴恩达深度学习
主要包括吴恩达深度学习专项课程的笔记整理以及详细实验代码。
2. 深度学习
平时学习过程中遇到的有关深度学习问题的整理。
1. CS224n
CS224n课程笔记和作业整理。
2. 知识图谱和语义计算
国科大赵军老师《知识图谱和语义计算》课程整理。
3. 自然语言处理
平时学习过程中遇到的有关自然语言处理问题的整理。
4. 自然语言处理面试
主要结合胡盼盼的自然语言处理从入门到实践那本书,对自然语言处理岗位的面试做一个总结
1. 李宏毅GAN(敬请期待)
李宏毅GAN教程的相关笔记和作业整理。
2. GAN(敬请期待)
GAN相关的一些基础知识、前沿动态、代码等内容。
1. 李宏毅强化学习
李宏毅强化学习课程(2018)笔记整理。
2. 强化学习基础
转载自博客园刘建平老师的强化学习笔记(含代码)。
3. 分布式强化学习
介绍分布式算法框架Ray在强化学习上的应用,以及开源强化学习库RLlib。
4. 强化学习(敬请期待)
强化学习相关的一些基础知识、前沿动态、代码等内容。
期待ing……
1. 图神经网络
图神经网络相关的一些基础知识/模型、前沿动态(论文)、代码等内容。
2. GNN在文本分类上的应用
本专栏主要介绍基于图神经网络的一些模型在文本分类上的应用。
预训练语言模型
预训练语言模型相关的一些基础知识、前沿动态(论文)、代码等内容。
BERT
关于BERT预训练模型的论文,项目,学习心得,代码等内容。
机器阅读理解
机器阅读理解(文本问答)相关的一些基础知识、前沿动态(论文)、代码等内容。
知识图谱问答
知识图谱问答相关的一些基础知识、前沿动态(论文)、代码等内容。
1. 文本分类项目
从0开始搭建一个文本分类系统。包括数据预处理,常用方法复现,网页Demo,预测,项目组织结构。
2. 达观杯文本分类比赛
达观杯文本分类比赛所用方法(传统机器学习方法、深度学习方法、集成学习)的介绍,比赛或刷榜的技巧。
3. Github优秀文本分类项目解析(1)
基于深度学习方法,与之前的项目相比,提供了一种不同的数据预处理方式、编码风格以及项目组织结构。
4. Github优秀文本分类项目解析(2)
基于预训练语言模型,如:Bert、ERNIE、AlBert、XLNet。以及深度学习模型CNN、RNN等和预训练语言模型的结合。介绍如何将预训练语言模型应用在文本分类任务上。
1. 对话情感识别与生成
对话情感识别与对话情感生成相关的一些基础知识、前沿动态(论文)、代码等内容。
2. SemEval2019Task3_ERC
本专栏对SemEval2019(Semantic Evaluation2019)的Task3_ERC(Emotion Recognition in Conversation)的各种解决方案进行整理。
元学习与小样本学习
元学习与小样本学习(Few-shot Learning)相关的一些基础知识、前沿动态(论文)、代码等内容。
知识图谱
知识图谱相关的一些基础知识、前沿动态(论文)、代码等内容。
自监督学习
介绍一些自监督学习方法,前沿动态。
知识蒸馏
介绍知识蒸馏概念、方法,前沿动态。
序列标注
介绍一些序列标注相关的任务,包括分词、词性标注、命名实体识别(实体抽取)等,方法模型,前沿动态。
对话系统
(任务型)对话系统相关的一些基础知识、前沿动态(论文)、代码等内容。
推荐系统
介绍(对话)推荐系统相关的一些基础知识、前沿动态(论文)、代码等内容。
个人GitHub
大佬博客地址(自己目前跟着大佬的路线在学,所以里面很多都是大佬博客的链接!)