推荐系统冷启动的解决方案

冷启动问题是推荐算法或者计算广告算法岗位的面试官经常会问到一个问题,因此在这里做一个总结。

结论:
冷启动包括用户的冷启动、物品的冷启动和整个系统的冷启动
针对冷启动问题的解决方案大概分为三类:基于规则、基于特征、迁移学习。

1、基于规则:
基于规则的方法实际上就是前推荐系统时代进行内容分法的方法。比如使用最高评分榜、近期热门榜作为新用户的推荐;或者更进一步,根据用户注册时提供的一些基本信息,设置差异化的启动榜单
物品角度的基本思路大致相同,比如按照物品的一些基本属性进行k近邻,以距离最近的一些物品的推荐逻辑来初始化这些新物品。

2、基于特征:
冷启动面对的数据缺失是历史数据的确实,但是推荐系统中使用的特征不仅仅是历史数据。所以推荐系统可以基于其他更加丰富的及时特征(比如年龄、性别、行业、职业、IP、GPS等信息)来进行粗粒度的推荐。另一种思路是在注册时通过一些问题,比如电影网站会主动让选出感兴趣的10部电影,主动的引导用户进行一些交互来积累初始数据。
此外,一些第三方DMP会基于cookie等提供一些用户的基本特征,这也是可以拿来冷启动的

3、基于迁移学习:
比如cvr预估的embedding可以直接使用ctr预估的embedding

4、bandit算法:
可以查一下推荐系统的EE问题。简单来说就是在开始阶段去对各个类别的视频设计epsilon-greedy这样的算法来探索各个兴趣类别

参考资料:王喆《深度学习推荐系统》

你可能感兴趣的:(算法,推荐系统)