9-6

背景:

某个论坛的帖子评论分成positive和negative两种,你已经拿到了sample(影评)和label(评价)两个集合,现在你想知道:

词汇 --- 评价

之间的关系,即情感倾向词汇。

这时候很容易想到的方法是:计算某个词汇的positive/negative的比例,就可以知道词汇的情感倾向,而不需要借助情感词典,假设:ratio = positive/negative,很明显ratio是一个以1为中心的评价指标,ratio=1可以将词汇看成中性词汇。如下图抽取影评结果:


9-6_第1张图片
around 1


而你会发现后期的计算尝尝要求指标以0为中心的,像这样:


9-6_第2张图片
around 0

这时候怎么办呢,答案就是对数变换!

你可能感兴趣的:(9-6)