贪心学院NLP自然语言处理训练营第六期

自然语言处理无非是目前最大的风口,从Word2Vec、ElMo、GPT、Bert到XLNet, 我们见证了这个领域的高速发展以及未来的前景。互联网中的大量的文本以及IOT时代赋予我们的全新交互带来了这个领域的爆发。

为了迎合这种变化,我们的课程也在不断迭代更新,保证不错过任何2周之内出现的重要技术。这次我们迎来了第五期NLP的招生,千万不要觉得这是一个对标其他线上课程的普通的训练营。由于内容的专业性以及深度,在过去吸引了大量的全球顶级名府的学员,这里不乏来自CMU, Columbia, USC, UCSD等美国顶级名校和清北上交等国内名校学员,还有很多准一线的工程师。

我们训练营的特色可以概括为:

体系化、专业性、深度、精细化讲解,

最重要的一点是可以帮助你看到里面的本质、而且能够把零零散散的知识点串起来,

我们只做AI教育,因为这是我们最擅长的领域!

另外,我们配备相应的教材,越早加入就有更多预习准备的时间!

课程大纲

第一阶段 算法与机器学习基础

【核心知识点】

. 时间复杂度,空间复杂度分析

. Master’s Theorem,递归复杂度分析

. 动态规划以及Dynamic Time Warpping

. Earth Mover’s Distance

. 维特比算法

. LR、决策树、随机森林、XGBoost

. 梯度下降法、随机梯度下降法、牛顿法

. Projected Gradient Descent

. L0, L1, L2, L-Infinity Norm

. Grid Search, Bayesian Optimization

. 凸函数、凸集、Duality、KKT条件

. Linear SVM、Dual of SVM

. Kernel Tick, Mercer’s Theorem

. Kernelized Linear Regression、Kernelized KNN

. Linear/Quadratic Programming

. Integer/Semi-definite Programming

. NP-completeness/NP-hard/P/NP

. Constrained Relaxation、Approximate Algorithm

. Convergence Analysis of Iterative Algorithm

【部分案例讲解】:

. 基于Sparse Quadratic Programming的股票投资组合优化策略编写

. 基于Earth Mover’s Distance的短文本相似度计算

. 基于Projected Gradient Descent和非负矩阵分解的词向量学习

. 基于Linear Programming的机票定价系统

. 基于DTW的文本相似度分析

第二阶段 语言模型与序列标注

【核心知识点】

. 文本预处理技术(tf-idf,Stemming等)

. 文本领域的特征工程

. 倒排表、信息检索技术

. Noisy Channel Model

. N-gram模型,词向量介绍

. 常见的Smoothing Techniques

. Learning to Rank

. Latent Variable Model

. EM算法与Local Optimality

. Convergence of EM

. EM与K-Means, GMM

. Variational Autoencoder与Text Disentangling

.有向图与无向图模型

. Conditional Indepence、D-separation、Markov Blanket

. HMM模型以及参数估计

. Viterbi、Baum Welch

. Log-Linear Model与参数估计

. CRF模型与Linear-CRF

. CRF的Viterbi Decoding与参数估计

【部分案例讲解】:

. 基于无监督学习方法的问答系统搭建

. 基于监督学习的Aspect-Based 情感分析系统搭建

. 基于CRF、LSTM-CRF、BERT-CRF 的命名实体识别应用

. 基于语言模型和Noisy Channel Model的拼写纠错

你可能感兴趣的:(AI,NLP,自然语言处理)