Mining and Summarizing Customer Reviews

挖掘顾客评论(摘要型,非主题)

关键字:文本挖掘,情感分类,摘要,评论


电商的发展积累了成千上万的用户评论和意见,但依然

海量的评论使得潜在客户很难捕获到关键决策购买信息

对于商家或商户也很难跟踪用户反馈和想法

本篇论文只关注挖掘顾客已表达的意见内容以及其情感极性(并不是以子集,子句的方式来重写表述) 实现步骤(pipeline)

1. 挖掘顾客提到的产品特征

2. 特征的情感极性判断

3. 整合上述内容,形如下图

该论文目标

按我的理解,其实这也是电商平台(阿里天池比赛中出现过很多次)商品情感分类的通用三元组

商品-特征-好坏(或情感词)  ,但是论文中的结构化表示形式不仅对顾客,对厂商都更友好


1. 句子情感分类-但这种方式存在很大局限:相较于评论,句子包含的信息要少得多

    所以论文作者在这篇文章的主要工作区别于此是:a. 不是将评论看作一个整体做情感分类,一条               评论一般来说,即会包含某个特征的正向情感,也会包含某个特征的负向情感 b.  情感分类并没有挖掘出商品的特征 c. 该工作不需要大量预料支持

2. 主题风格分类

与本文目的更为相近的是 句子主题分类并分析出客户的某个表示是客观的还是主观的,但依然,这些工作依然没有找到哪些特征上的哪些客观观点

3. 情感分类

通过外部搜索以及标注来对文章进行情感分类

4. 文本摘要

大致介绍了下文本摘要的两种分类:生成式和抽取式。但是文本摘要的主要目的还是抽取文章间的相似与不同点



PIPELINE

1. part-of-Speech Tagging

    利用NLProcessor 对句子进行分词及词性标注

你可能感兴趣的:(Mining and Summarizing Customer Reviews)