《Exploiting Document Knowledge for Aspect-level Sentiment Classification》

《Exploiting Document Knowledge for Aspect-level Sentiment Classification》

这是一篇比较火的文章。

它的思想是,基于主题的情感分析的标签不好搞,尤其是主题,主题这个东西本身就不好得到,所以数据集都会很少。而迁移学习可以带来文档级别的情感分析中的知识,所以能提升效果。

模型的结构也不复杂。

Glove(embedding)

           LSTM             ATT

           dense

           softmax

 方法是,首先在文档级别的文本中进行训练,

 再用基于主题的进行fine-tuning.

 最后训练好了之后文档级别和基于主题级别会共同的使用LSTM和embedding,然后共同训练,两个损失函数相加。

在这个过程中,作者成功的取了20%的训练数据,80%的剩余数据,这是一个挺有意思的部分。损失方程的相加方法,dropout的比率,损失函数的选择。

 

 

评价:

这个过程中,fine-tuning的信息主要保存在了LSTM中,保存在LSTM的参数中。

transfer是非常有帮助的一个东西

 

这篇论文十分经典

 

你可能感兴趣的:(《Exploiting Document Knowledge for Aspect-level Sentiment Classification》)