一种改进的融合文本主题特征的情感分析模型

摘要

【目的】海量的用户评论对消费者和相关企业具有很大价值,针对评论信息长度过短导致的数据稀疏,主题不明确及分类准确率不高等问题。【方法】本文提出了一种融合主题特征的Bi-LSTM自注意力机制在线评论情感分析模型(TSC-BiLSTM)。与传统LSTM方法相比,该方法利用潜在狄利克雷分布(LDA)主题模型获得评论的主题词分布,与评论词向量拼接作为输入,通过Bi-LSTM挖掘全文特征信息,结合self-attention机制动态分配权重。【结果】本模型扩充了原短评论文本的特征空间,降低了数据的稀疏性,明确主题且提高了情感分类的准确性。【结论】在酒店和某外卖平台评论数据集上的实验表明,与相关模型比较,所提出的方法具有更好的性能,为主题情感分析方法提供了一种新的思路。

关键词: LDA; ; Bi-LSTM; self-attention; 情感分析

引言

随着互联网的飞速发展,大量包含用户意见的短文本数据出现在社交媒体的评论中。通过对这些评价数据进行情感分类,可以有效提取用户的真实想法,有助于对应产品或服务的

你可能感兴趣的:(行业数字化研究及信息化建设专栏,深度学习,人工智能)