推荐系统----豆瓣

看到最近有人的总结,http://www.cnblogs.com/breezedeus/


系统看了一下豆瓣的几个推荐系统

豆瓣图书推荐,这个是我一直觉得很不确定的地方,我感觉他们应该是用的item-based cf,但是有时候又觉得吧,通过user-based也能给我推荐,因为我的好友里确实有人看类似的书目。豆瓣实际上是怎么做的呢?


content-based + weight-cf

也就是说,先把item按照content,这个豆瓣有很好的数据库,就是用户给书的标签,对书进行归类,比如算法导论、数据结构等是一类书,归一一类,而明朝那些事儿、万历十五年等是一类,然后在类内利用cf进行推荐,然后把各个类产生的推荐结果加权重结合,就形成了最后的推荐结果。上个图片真麻烦啊……摘自其中的ppt,来自:http://vdisk.weibo.com/s/gNupb。


推荐系统----豆瓣_第1张图片


另外一个就是电影推荐:


在这里,豆瓣采用的是专家cf推荐,也就是说豆瓣认为,友邻的推荐效果其实比不上和你相关的专家的推荐有用。这个具体文章可以参考:The Wisdom of the Few

在这里分析了,专家给电影评分的数据的稀疏性、可靠性和稳定性,即专家给电影评分比较多、再者,专家的评分比较可靠和稳定,受到热门等因素的影响小。因此,在豆瓣推荐电影时,使用的是专家cf,而不是基于友邻等的推荐。具体可以参考豆瓣阿稳的博客,不过我只能快照打开,郁闷。


这个豆瓣在做音乐推荐时,也用到了吧。但是看到他们的PPT里,加入了算法调度器,根据用户实际的反馈,比如加红心或者放入垃圾筐等的操作,会对推荐系统进行调整。


就像一个ppt里看到的,公司里,是数据----->算法,调整参数+规则的过程,而学校里是算法1改进------>数据测试,算法2改进等的思路。所以,要提高自己的动手能力,解决实际问题的能力啊……



你可能感兴趣的:(推荐系统)