NLP自然语言处理:文本表示总结 - 上篇word embedding(基于降维、基于聚类、CBOW 、Skip-gram、 NNLM 、TF-ID、GloVe )
文本表示分类(基于表示方法)离散表示one-hot表示词袋模型与TF-ID分布式表示基于矩阵的表示方法降维的方法聚类的方法基于神经网络的表示方法NNLMCBOWSkip-gramGloVeELMoGPTBERT目录一、文本离散表示1.1文本离散表示:one-hot1.2文本离散表示:词袋模型与TF-IDF1.2.1词袋模型(bagofwords)1.2.2对词袋模型的改进:TF-IDF二、文本分布