采用CNN-LSTM与迁移学习的虚假评论检测

摘要

随着互联网的发展,网购风行千家万户,商品服务在线评价对用户决策产生很大影响。但网上评价门槛较低,其中不乏虚假评价,极大影响了消费者与商家权益。针对此问题,提出一种基于CNN-LSTM模型与迁移学习相结合的虚假评论检测方法。使用CNN-LSTM算法,结合Doc2Vec与TF-IDF方法,将评价文本向量化后作为特征,利用Glove数据集进行迁移学习。与其他方法进行对比验证,结果显示该检测方法检测与识别准确率更高,在英文酒店评论数据集deceptive-opinion-spam-corpus上的实验测试中,正确率达到了93.1%。

引言

信息化时代,互联网逐渐成为人们获取信息的重要渠道,出现了大量带有用户主观情感、语义丰富的短文本[1]。面对还未接触或者不够了解的服务与产品,多数用户习惯于通过互联网获取有关信息,来自互联网的评价极大影响着用户的最终决策与选择。如用户在有关平台上预订酒店时,在其他条件合适的情况下往往会先参考酒店已入住者提供的评论,并根据评论做出是

你可能感兴趣的:(物联网及AI前沿技术专栏,cnn,lstm,迁移学习)