基于 循环神经网络 (LSTM) 的情感评论文本分类

  • 基于循环神经网络 (LSTM) 的情感评论文本分类
    • 一、简介
    • 二、实现代码
    • 三、结合 CNN 和 RNN 进行特征提取

基于循环神经网络 (LSTM) 的情感评论文本分类

一、简介

  • 众所周知,区分用户发帖或者评论文本的情感分类问题,对商家来说是很重要的,不仅可以及时了解到用户的情绪,而且可以帮助商家进行产品迭代。例如,“汽车之家” 网站上的用户评论,进过情感词分类后,可以得到很多有用的信息,如 “发动机有问题”,“总是烧机油” 等,故下面,我们就来尝试解决。

  • 首先,对于情感分类问题,一般有两种解决方案,一是,基于情感词典的规则的解决方法,二是,基于机器学习以及深度学习的方法。这里我们采用后者方法。这里我们只是将情感倾向分为 支持,反对,以及中立。读者当然可以根据自己的需求,分的更加详细。一般基于词典的规则方法,优点是非常稳定,缺陷是对于不在词典中的词就效果很差,而深度学习的方法,需要人工标注语料作为训练集,提取出文本的特征,用特征构建一个分类器,在做情感分类。它因为具有一部分语境,而避免了部分情感词典的缺点。但是它由于特征抽取方法不同,而导致有噪音,通用性不好。必须针对特定语义环境特定训练模型才行。

  • 为了,克服这两种方法的缺点,一般有如下方法:

    • 利用已有的知识结构自动学习各种语料。比如用维基百科训练一个 Word2vec 模型。此外,知识图谱的建立和语境感知在情感分类中也是很重要的。

你可能感兴趣的:(#,NLP,Tensorflow,机器学习,#,TF,之,Deep,Learning演练场)