数据挖掘(1)——亲和性

亲和性,可以理解为相似性。例如两篇文章,用户看完第一篇之后,又看了什么文章,网站运营就可以把多个读者愿意同时阅读的文章放在一起。当运营收集到足够多的数据时,就可以对其进行亲和性分析,确定哪些文章适合放在一起。

在亲和性中,需要找出简单的规则,“如果用户看了A,那么他可能看了B”。首先要明确两个概念。

支持度——在样本中,规则应验的总次数,或百分比

置信度——规则应验的次数/当前规则中的条件成立的总次数

你可能感兴趣的:(数据挖掘(1)——亲和性)