有关javaeye“评判灌水”机制的瞎想

无疑javaeye是java开发者的温馨家园。

今天发生的这件事让我有了一些新的思考,是关于“javaeye评判灌水”机制的一个猜想。

事情是这样的——
看完一篇帖子,由衷的喜欢,于是就想跟帖回复,但是又要“答题”(大家都懂的)?不是答过了吗!?好吧,答吧!
紧接着发现收到一份站内信,大致内容是:“很不错!学习学习!”这条评论属于灌水行为,并扣除30分。

后来发现有的评论就引用别人的内容,发个类似 的表情,还可以躲过“评判灌水”机制的法眼,于是我想javaeye的这个机制到底是怎么实现的呢?

我猜想:
javaeye 有一个类似恶意灌水的“停用词表”,里面存放了诸如:不错、学习、mark、赞、顶等之类的词语,然后有一个后台线程定期对用户的评论信息做“评判灌水”的过滤。
过滤的机制有可能是:设灌水值为x,阈值y,对评论分词处理,然后计算累计的“停用词”的tf(term frequency),tf越大说明灌水的嫌疑越大,然后还要结合评论的长度l(l等于分词后term的数量),l和x成反比,c为常数。
x=((tf的和)/l)*c,然后x>y就认为是“灌水评论”

我猜想。。。。

反正就是一个转念的想法,这个机制可简单、可复杂。
开会去了~
以后大家评论、跟帖写长点没错的~!


你可能感兴趣的:(C++,c,C#,idea)