面向社会媒体的文本情感分析

情感分析发展的七项关键技术:

  1. 情感分类
  2. 情感元素抽取
  3. 跨领域情感分析
  4. 个性化情感分析
  5. 隐式情感分析
  6. 情感原因发现
  7. 情感生成

1. 情感分类

1.1 基于传统机器学习方法的情感分类

最好的模型是:

SVM!(2002)

文本特征采用:

  • Bag of ngrams words + TFIDF
  • Bag of ngrams characters+TFIDF

1.2 基于深度学习方法的句子情感分类

发展:

  • RNN(2013)
  • TextCNN(2014)
  • 基于情感词典的BiRNN(2016)
  • 利用语言学约束的LSTM模型(2017)

1.3 基于深度学习方法的篇章级情感分类

发展:

  • CNN+GRU(2015)
  • HAN(2016)
  • 利用语篇关系的RecursiveNN(2015)

1.4 面向评价对象的句子情感分类

引入了Aspect Embedding!

发展:

  • LSTM+Attention每一层还引入了Aspect Embedding,考虑了评价对象的类别信息。(2016)
  • Memory network+Attention:显式地利用上下文对于不同评价对象的差异。(2016)

2. 情感元素抽取

任务:

  • 情感词抽取、情感词表示、情感词典
  • 评价对象抽取
  • 评价搭配抽取:<评价对象,情感词>

2.1 情感词表示的学习

情感词典资源

发展:

  • SSWE(2014)
  • 等等

2.2 基于情感词表示学习构建的情感词典

  • 构建大规模的twitter特定的情感词:一种表示学习方法。(2014)

2.3 评价对象抽取

传统机器学习方法:

  • 看成序列标注问题
  • CRF+特征

深度学习方法:

  • 深层、双向RNN(2014)
  • LSTM+词向量+POS特征(2015)
  • 结合融合依存路径信息的词向量和局部上下文特征(2016)
  • RecursiveNCRF(2016)

后两个基本上是想过最好的!

2.4 评价搭配抽取

评价搭配:<评价对象,评价表达>

  • 双向传播算法(2011)
  • 基于语法树进行句子压缩的搭配抽取算法(2014)

3. 跨领域情感分析

任务:从源领域到目标领域进行模型的迁移。

目标:标注少量或不标注目标领域的语料,利用源领域的语料在目标领域达到较好的性能。

发展:

  • 谱特征对齐算法(2010)
  • 堆叠去燥自编码器+SVM(2011)

4. 个性化情感分析

任务:在情感分析中加入个性化的元素。

4.1 基于用户用词习惯的方法

不同用户和群体情感倾向具有差异性。

传统的社会媒体分析往往仅依赖于文本正文的内容,**忽略了个体与群体信息和立场,**因而在一定程度上影响了情感分析的结果。

  • 立场不同
  • 打分偏好
  • 用词偏好

发展:

  • 引入用户嵌入产品嵌入,并将其融入到神经网络框架中。(2015)

4.2 基于认知理论的方法

用户画像:

  • 属性维度:自然欣喜
  • 性格维度:五大人格
  • 行为维度:用户偏好

可以结合用户信息进行更深入的情感分析与展示!

4.3 基于网络结构的方法

社交网络上用户之间的连接关系(关注、赞同、@等),这种连接关系表征了相同的情感倾向性。

发展:

  • 结合社交网络的用户级别的情感分析(2011)

5. 隐式情感分析

传统的情感分析方法多依赖显式情感词,不能有效处理社会媒体中大量存在的隐式情感表达。

社交媒体中文本情感表达方式复杂:

  • 多数没有显式情感词
  • 多使用语言修辞表达或事实性陈述

5.1 事实性隐式情感分析

发展:

  • 基于特征+规则的方法(2011)
  • 基于上下文的方法

5.2 修辞型隐式情感分析

  • 隐喻语料库
  • 隐式情感语料库

6. 情感原因发现

6.1 基于文本的情感原因发现

  • 基于融合卷积操作的记忆网络的方法(2017)

6.2 基于立场的情感原因发现

情感原因发现是文本情感全面理解的核心内容之一。

现有方法难以发现社交网络群体带来的情感立场原因,缺乏对情感原因的利用。

6.3 基于群体的情感原因发现

值得思考的问题:

  • 如何表示情感原因
  • 如何获取情感原因

7. 情感生成

7.1 评论文本生成

发展:

  • Affect-LM(2017)
  • Attribute2Sequence+Attention(2017)

7.2 情感回复生成

发展:

  • Emotional Chatting Machine(2017)

8. 情感分析六大趋势

  • 从粗粒度到细粒度
  • 从单领域到跨领域
  • 从文本到社会媒体
  • 从显式情感到隐式情感
  • 从情感分类到情感原因
  • 从情感分析到情感生成

你可能感兴趣的:(NLP,with,DL,情感分析与情感生成)