推荐系统冷启动问题笔记&Tips

什么叫冷启动?

分3种:

1、新用户冷启动:数据库没有该用户的历史行为数据

2、新商品冷启动:同上

3、新系统冷启动:啥都没


常见的基本的解决办法:

1、推荐热门榜

2、用户注册是采集一些粗粒度的信息,如年龄、性别;或者更细致一点的做法:让其指定一些偏好,或者喜欢的类别

3、利用用户的SNS账号登陆,授权导入用户的社交信息,推荐好友喜欢的

4、新加入的商品,利用内容进行推荐(just like 我的毕设)


方法1就不用说了,方法2:利用注册信息

利用用户注册信息进行推荐的核心是:计算一类用户(具有相同特征)喜欢的物品

p(f, i) 可以简单定义为具有 f 特征的用户喜欢物品 i 的程度

p(f, i) = | N(i) AND U(f) |, 其中N(i)代表喜欢物品i的人们,U(f)代表具有f特征的那一类用户。

因此可以比较准确地描述 某一类用户 喜欢 某一件商品 的程度,或者说是否喜欢。可以将| N(i) | 作为分母,去除热门商品的影响。

实验证明前者不靠谱,后者更可靠。(对于推荐系统来说,热门是毒瘤,总要想办法去除)。


若要用户在第一次登陆时对一些物品指定兴趣,那么这些物品最好具有代表性。也最好不是位于长尾的冷门物品(否则用户很可能不知道它是什么)。有paper利用决策树来完成这项任务,其算法简要捋一捋,如下:

1)用户分类

用一群用户对物品评分的方差来度量这群用户兴趣的一致性。如果方差大,这群用户兴趣不太一致;反之,则比较一致。


也就是说,该算法首先将用户分成3类,喜欢物品i的,不喜欢物品i的,不知道物品i的(没有给i评分)。如果以i划分的这3类用户群,对其他物品同样表现的很不一致,说明物品 i 很具有区分性。

2)决策树部分

构建决策树,用最具有区分性的物品作为决策树的根,以它划分用户群为3类;每一类中再选一个最具区分性的物品,再划分3类人群。依次往深里走。直到满足一定条件,如方差阈值或者树高度限制,停止。决策树构建完成。

使用决策树,最终可以通过对一系列典型物品的态度将用户进行分类。即让用户首先对根物品选择喜好,再根据用户的选择进入不同的分枝,直到进入最后的叶子节点。此时也就了解了该用户大致的兴趣。

推荐,根据用户的兴趣,个性化地推荐商品。


方法3 利用商品内容信息


你可能感兴趣的:(推荐系统冷启动问题笔记&Tips)