毕业设计-基于深度学习的短文本情感倾向分析

目录

前言

课题背景和意义

实现技术思路

一、深度学习相关技术

 二、基于深度学习篇章句子级粗粒度情感倾向分析

三、基于深度学习的目标/方面级细粒度情感倾向分析

实现效果图样例

最后


前言


    大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。

对毕设有任何疑问都可以问学长哦!

选题指导: https://blog.csdn.net/qq_37340229/article/details/128243277

大家好,这里是海浪学长毕设专题,本次分享的课题是

基于深度学习的短文本情感倾向分析

课题背景和意义

短文本情感倾向分析是自然语言处理领域的关键研究问题之一。情感倾向分析是用于检测语言所蕴
含主观倾向语义的一系列方法、技术和工具,是对文本深层语义理解的关键。短文本数据的随意性、高歧义性以及简短性使得传统基于特征工程和机器学习分类技术的情感倾向分析任务性能有限。随着深度学习技术在自然语言处理中的广泛应用,基于深度学习的短文本情感倾向分析模型取得了新的突破。随着网络的发展, 互联网中涌现大规模 带有用户主观情感的、内容短小且语义信息丰富的 短文本,这些海量数据是用户意识和观点的综合呈 现和重要体现,影响着网民对事物的看法态度和判断决策。其中, 短文本包括不仅限于社交平台 如微博、微信、 Twitter Facebook ),还包括文字信息、产品评论 、电影评论 、视频弹幕与字幕 等。如何准确高效地利用计算机技术从海量短文本中自动分析情感信息,这对于产品分析、话题监控、舆情监测、用户建模、观点分析等有着重要意义。

实现技术思路

一、深度学习相关技术

基于深度学习的短文本情感倾向分析一般流程 可分为五阶段:文本预处理、初始词向量表示、特征提取与上下文语义表示、深度学习模型训练与测试、实验结果分析与评估。

毕业设计-基于深度学习的短文本情感倾向分析_第1张图片

 二、基于深度学习篇章句子级粗粒度情感倾向分析

篇章级的粗粒度情感倾向分析

主/客观句子判断在篇章级的粗粒度情感倾向分析中至关重要,不相关的句子需删除,不重要的特征需过滤。借助神经网络自动从大量训练文档中学习可区分特征,该利用神经网络学习文本表示的方法较传统方法取得了明显成功,但只考虑了文本浅层语义,忽略了用户偏好和产品特征等客观因素对篇章情感极性的影响。

句子级的粗粒度情感倾向分析
利用双层 CNN 框架,第一层 CNN 通过学习带噪音的标签数据实现对输入数据去噪,第二层 CNN 将上层得到的“干净”数据用于句子级情感倾向分析,从而降低数据噪音影响。不同情感标签之间也存在相互影响,特别是中性情感标签,会影响对其他情感标签的判断。针对上述问题,  提出 RNN recurrent neural network )胶囊模型,为每类情感标签单独建立胶囊,根据胶囊内的状态激活条件判断当前输入句子的情感倾向。

三、基于深度学习的目标/方面级细粒度情感倾向分析

基于单任务的方法

1)经典神经网络模型
为充分考虑目标与上下文的关联语义,将句子按目标词分成左右两个子句,TD-LSTM(target- dependent LSTM )算法中目标是两个 LSTM的最后一个输入单元,最后隐层输出拼接作为最终的文本表示,该方法未充分考虑到上下文。现存大多数基于 LSTM 和注意力机制的双通道混合模型 ,经过 LSTM 层得到初始上下文表示和目标表示,注意力层用于提取对输入目标而言更重要的上下文信息,得到更高效的文本特征表示,最后 输入情感分类器中判断输入目标的情感倾向。

毕业设计-基于深度学习的短文本情感倾向分析_第2张图片

 基于 CNN 的情感倾向分析模型(如图 3所示)通过设计不同的门控机制,根据输入方面实体提取短文本内的局部情感特征,达到方面与短文本内观点词高效匹配的目的。

毕业设计-基于深度学习的短文本情感倾向分析_第3张图片

LSTM CNN 的隐层状态以及注意力机制的记忆存储能力十分有限,长距离建模过程中容易导致
部分语义信息的丢失。记忆网络结合注意力机制的方法 为上下文中除目标词外的每个词单独构建额外的记忆块,注意力层用于捕获记忆块中对于判断不同目标的情感倾向较为重要的信息。

毕业设计-基于深度学习的短文本情感倾向分析_第4张图片

2)融入外部先验知识的方法

短文本篇幅短且结构紧密,所含的信息量大但背景知识不足;另外,同一个词在不同的语境下可能表达出不同语义。针对以上问题,常见方法是结合知识图谱。

毕业设计-基于深度学习的短文本情感倾向分析_第5张图片

基于多任务联合学习的方法

1)基于多任务学习的序列标注方法
基于序列标注的细粒度情感倾向分析 采用联合方面信息标注任务和情感信息标注任务的方式,重新定义目标/方面级的细粒度情感倾向分析任务。 序列标注方法实现对文 本中所提及所有方面的位置信息及其情感信息进行标注。 位置标注方式包括 BIESO 方式 TO 方式;三分类的情感倾向标注方式为 POS/NEU/NEG ,即积极 / 中性 / 消极。
毕业设计-基于深度学习的短文本情感倾向分析_第6张图片
2)多方面多情感倾向分析
对于句中存在多个不同情感倾向的不同方面的多方面多情感(multi-aspect-based multi-sentiment MAMS )倾向分析问题,多方面多情感倾向分析实 现同时对文本中所提及所有方面的情感倾向判别, 这类任务比单方面单情感倾向分析更加复杂,但可以 看作是多个单方面单情感倾向分析任务的联合学习。
3)联合学习非情感倾向分析任务
联合学习情感倾向分析相关任务或其他非情感倾向分析任务时,通过在模型内部设计多任务交互模块,显式地建模任务间的互相学习过程,进而提高多任务学习模型的可解释性,成为了近几年短文本细粒度情感分析的研究热点。
对短文本先进行主题聚类 ,用于辅助情感倾向
分析。
基于迁移学习的方法
1)迁移学习方法简介
基于迁移学习的情感倾向分析方法,先利用源领域标注数据和目标领域少量甚至无标注的数据训练网络模型,再输入目标领域测试集对模型进行微调以适应目标领域的目标任务。迁移学习方法常用于跨任务 、跨领域 和跨语言 的细粒度情感倾向分析,其关键是找到源任务和目标任务之间的相似性。

毕业设计-基于深度学习的短文本情感倾向分析_第7张图片

2)基于迁移学习的细粒度情感倾向分析

重用模型内部部分语义结构是最常见的迁移学习方式。将在机器翻译任务中训练好的编码器用于情感倾向分析,为解决任务间的特征差异问题,还增加特征提取层,实现基于特征迁移的跨任务情感倾向分析。

实现效果图样例

基于情感相似度注意力机制的文本情感识别:

毕业设计-基于深度学习的短文本情感倾向分析_第8张图片

我是海浪学长,创作不易,欢迎点赞、关注、收藏、留言。

毕设帮助,疑难解答,欢迎打扰!

最后

你可能感兴趣的:(推荐算法毕业设计,深度学习,python毕业设计,python,深度学习,课程设计,人工智能)