有关情感分析和观点挖掘的几个概念

  • 情感和主观观点分类(sentiment and subjectivity classification):情感分析(sentiment analysis)就是一个文本分类(text classification)问题,主要有两个级别:
    • 文档级别的分类:含有主观观点的文章表达的是正面的还是负面的观点(positive or negative opinion),有个专用名词表示这一类sentiment classification或者document-level sentiment classification
    • 句子级别的分类:主要目的
      • 句子表述的意思是主观的还是客观的,表示这一类的专用名词:subjectivity classification或者subjectivity/objectivity identification
      • 如果是主观的,是正面的还是负面的,还是中性的,表示这一类的专用名词:sentence-level sentiment classification
  • 基于特征的情感分析(feature-based sentiment analysis):做情感分析前首先要找出某观点针对什么目标所发,例如,目标可以是某产品、产品的部件、产品的特征、产品的属性等等,上述目标也可以 推及商品、服务、个人、组织、事件、话题等等。实际上也可以作为情感分析的除文档级别和句子级别以外的第三个级别。
  • 直接观点和对比观点
    • 直接观点:direct opinion或者direct appraisal,例如,The picture quality of this camera is poor
    • 对比观点:comparative opinion,例如,The picture quality of this camera is better than that of Camera-x。进行这类情感分析时,首先要确定观点的目标对象是谁。
  • 观点搜索和检索:opinion search and retrieval
  • 极性分类(polarity classification)和星级评分(multi-way scale):参看维 基百科,极性分类就是分成正面、负面或者中性,而星级评分分成的级别更多,例如, 1~5星级。
  • 垃圾观点(opinion spam)和观点效用值(utility of opinions):垃圾观点是为了故意误导读者或者自动信息处理系统而发布的虚假观点。所以应该为观点的效用进行评级。例如,刚刚发布的新闻大众点评网公正性受质疑,如果再加上:“保留好评差评是否存在“双重标准”?”,以及有中国特色的“删差团”和 “找公关渠道删除”,都给情感分析造成了很大障碍。

 

你可能感兴趣的:(情感)