基于Tag标签的推荐-推荐系统

推荐系统-基于Tag标签的推荐

文章目录

  • 推荐系统-基于Tag标签的推荐
    • 个人介绍
    • 基于标签的推荐
    • SimpleTagBased
    • TagBasedTFIDF
    • TagBasedTFIDF++
    • 文娱推荐举例——视频
    • 文娱推荐举例——豆瓣
    • 总结和个人看法
      • 基于内容的推荐优点如下:
      • 基于内容的推荐缺点如下:

个人介绍

杨晓栋,对世界保持好奇心。

可以使用Tensorflow,进行一些基础模型的搭建,修改和训练工作。

与叶言威,刘瀚乾同学一起努力完成一项大创项目。

未来希望可以有一家属于自己的书店。

基于标签的推荐

​ 基于标签的推荐在我们的生活中很常见。音乐网站,豆瓣,视频网站,这些与文娱相关的网站,随处可见标签的影子。豆瓣的电影标签、书籍标签,网易云音乐的音乐标签,B站的视频标签。属于基于内容的推荐算法。

​ 推荐系统遇到信息过载的时候才有必要,很显然,当书店是一个小书店的时候,书并不多,也不需要推荐系统,只需要简单的分类即可。

​ 我们这里主要讲一个简单的基于标签的推荐算法。

SimpleTagBased

p ( u , i ) = ∑ b n u , b n b , i p(u, i)=\sum_{b} n_{u, b} n_{b, i} p(u,i)=bnu,bnb,i
​ $n_{u, b} 是 用 户 是用户 u 打 过 标 签 打过标签 b 的 次 数 , 的次数, n_{b, i} 是 物 品 是物品 i 被 打 过 标 签 被打过标签 b$的次数。通过标签将用户将物品连接起来。可解释强,会让读者觉得标签是有道理的,基于标签推荐出书也是有道理的。

基于Tag标签的推荐-推荐系统_第1张图片

而标签这种特征表现形式,建立起用户和商品联系,标签是联系用户和物品的纽带。

TagBasedTFIDF

p ( u , i ) = ∑ b n u , b log ⁡ ( 1 + n b ( u ) ) n b , j p(u, i)=\sum_{b} \frac{n_{u, b}}{\log \left(1+n_{b}^{(u)}\right)} n_{b, j} p(u,i)=blog(1+nb(u))nu,bnb,j
​ SimpleTagBased不能反应用户个性化的兴趣,这里我们可以借鉴TF-IDF的思想,对这一公式进行改进。 n b ( u ) n_{b}^{(u)} nb(u)记录了标签 b b b被多少用户使用过

TagBasedTFIDF++

p ( u , i ) = ∑ b n u , b log ⁡ ( 1 + n b ( u ) ) n b , i log ⁡ ( 1 + n i ( u ) ) p(u, i)=\sum_{b} \frac{n_{u, b}}{\log \left(1+n_{b}^{(u)}\right)} \frac{n_{b, i}}{\log \left(1+n_{i}^{(u)}\right)} p(u,i)=blog(1+nb(u))nu,blog(1+ni(u))nb,i
​ 同理我们可以再加入对热门物品进行惩罚。 n b ( u ) n_{b}^{(u)} nb(u)记录了标签 b b b被多少用户使用过, n i ( u ) n_{i}^{(u)} ni(u)记录了物品 i i i被多少用户标记过。

文娱推荐举例——视频

p ( u , i ) = ∑ b Q n u , b log ⁡ ( 1 + n b ( u ) ) n b , i log ⁡ ( 1 + n i ( u ) ) R p(u, i)=\sum_{b} {Q}\frac{n_{u, b}}{\log \left(1+n_{b}^{(u)}\right)} \frac{n_{b, i}}{\log \left(1+n_{i}^{(u)}\right)}{R} p(u,i)=bQlog(1+nb(u))nu,blog(1+ni(u))nb,iR
​ 再加入我们考虑视频本身的质量因素 R R R(可以是带时间衰减的观看次数,也可以是上线之后的CTR),再考虑标签本身的质量 Q Q Q

文娱推荐举例——豆瓣

​ 对用户进行了引导,豆瓣利用标签讲用户的推荐结果作了聚类,显示了对不同标签下用户的推荐结果,增加了推荐的多样性和可解释性。

​ 最终组织页面,提高了推荐结果的多样性,因为读者的兴趣可能在长时间是广泛的,但是某一天比较具体,我们想要在某一天击中用户当天的兴趣,通过标签云,展示了所有读者的兴趣,让读者根据他今天的兴趣去选择相关的标签,得到参考结果,提高了推荐结果的多样性,是推荐结果更容易满足用户多样的兴趣。

总结和个人看法

​ 基于标签的推荐属于基于内容的推荐算法。

基于内容的推荐优点如下:

  • 用户之间的独立性。
  • 好的可解释性
  • 新的item可以立刻得到推荐

基于内容的推荐缺点如下:

  • item的特征抽取一般很难。优质的社区,会贡献优质的Tag,实现良性循环,一些电影,书的Tag是人类主观上,高层次的抽取。
  • 无法挖掘出用户的潜在兴趣。最后的组织页面在一定程度上解决这个问题(实质上没有解决)。
  • 无法为新用户产生推荐。在注册时让用户选一些标签。

​ 基于上面的分析,我认为对于文娱的推荐,基于标签的是不错的选择。文娱类作品区别于电商产品,文娱网站中的电影,书,视频是有内容的,自身都有区别与其他作品的特性,没有哪个作家希望自己的书和别人完全相同,而这些作品也有着一些共性,是有温度的,而用户的这些标签,像是书签,注脚,提炼概况他的内容。这些作品会容易引起人们的共鸣,优质的社区会有同样会有优质的评价和Tag。顾客和读者也就愿意分享他们的感受和评价,而这些Tag是他们的理解,他本身的内容就很好的特征,是人类主观上,高层次的抽取。

​ 因此我认为对于文娱的推荐,基于标签的推荐是不错的选择

愿意分享他们的感受和评价,而这些Tag是他们的理解,他本身的内容就很好的特征,是人类主观上,高层次的抽取。

​ 因此我认为对于文娱的推荐,基于标签的推荐是不错的选择

参考资料:《推荐系统实践》

你可能感兴趣的:(推荐系统)