关于召回率和hit rate

召回率:之前说过,这个博文中也详细说了,【实际为正例的(positive)有多少预测为正例】

这里还是要说下,在推荐中的具体含义。

从数据库中筛出来几百个用户感兴趣的item,这就是召回的过程,其中一个关键词是:用户感兴趣

什么是用户感兴趣的item,用户看过的?不一定,用户看过的再推一次就不一定感兴趣了,这就是长期兴趣和短期兴趣的问题,

比如我喜欢张国荣,即使很多我已经看过的视频,再推一次我还是会看的,当然这个时间间隔不能太短,我刚看完,你就又推同一个视频肯定不行(这里是不是有一个去重的过程,一般召回阶段不考虑吧)

短期兴趣的话就是及时的,我这时感兴趣可能就是因为我听到或者突然间接触到的,搜索了一下,你不能以后每天就推同一类东西给我吧,随着时间的delay的话,这个应该有权重问题吧。

啥是用户感兴趣的呢?

我看过同一类的东西,你给我推荐同一类的或者相似度很高的,这是我所喜欢的,当然如果用户感兴趣的不止一个类别,好,那么只要是与用户浏览过的相似度很高(0.95+??)的,都应该算作用户感兴趣的吧??

如果严格按照本文第一句的定义的话,那么在

你可能感兴趣的:(Recommendation,推荐召回,召回率,hit,rate,recall)