文本向量化学习笔记

最近学习了NLP中的文本向量化的方法,在此做一个整理,一方面帮助自己梳理思路,另一方面以便自己将来快速回顾。

文本向量化总体框图

文本向量化总体框图.jpg

目前整理的文本想量化方式有离散表示和分布式连续表示两大类。离散表示方式包括one-hot,tfidf,N-gram以及共现矩阵等方式。分布式连续表示有word2vec和fasttext等方式。

你可能感兴趣的:(文本向量化学习笔记)