kaggle MovieSentiment 情感分类的简单套路

问题:简单的对电影评论进行情感分类的问题

方案:采用了最基础的基于tfidf的向量化+lr和word2vec向量+lr以及word2vec+单层lstm三种方案,供大家参考。

评分:tfidf在0.84左右,word2vec在0.86左右,30轮训练的word2vec+lstm的auc在0.86左右还需要调整。

源码如下。

点击打开链接

细做的话,还可以考虑ensemble主题向量,以及模型融合,应该效果会更好一些。

你可能感兴趣的:(自然语言处理,算法经验)