杨晓栋,对世界保持好奇心。
可以使用Tensorflow,进行一些基础模型的搭建,修改和训练工作。
与叶言威,刘瀚乾同学一起努力完成一项大创项目。
未来希望可以有一家属于自己的书店。
基于标签的推荐在我们的生活中很常见。音乐网站,豆瓣,视频网站,这些与文娱相关的网站,随处可见标签的影子。豆瓣的电影标签、书籍标签,网易云音乐的音乐标签,B站的视频标签。属于基于内容的推荐算法。
推荐系统遇到信息过载的时候才有必要,很显然,当书店是一个小书店的时候,书并不多,也不需要推荐系统,只需要简单的分类即可。
我们这里主要讲一个简单的基于标签的推荐算法。
p ( u , i ) = ∑ b n u , b n b , i p(u, i)=\sum_{b} n_{u, b} n_{b, i} p(u,i)=b∑nu,bnb,i
$n_{u, b} 是 用 户 是用户 是用户u 打 过 标 签 打过标签 打过标签b 的 次 数 , 的次数, 的次数,n_{b, i} 是 物 品 是物品 是物品i 被 打 过 标 签 被打过标签 被打过标签b$的次数。通过标签将用户将物品连接起来。可解释强,会让读者觉得标签是有道理的,基于标签推荐出书也是有道理的。
而标签这种特征表现形式,建立起用户和商品联系,标签是联系用户和物品的纽带。
p ( u , i ) = ∑ b n u , b log ( 1 + n b ( u ) ) n b , j p(u, i)=\sum_{b} \frac{n_{u, b}}{\log \left(1+n_{b}^{(u)}\right)} n_{b, j} p(u,i)=b∑log(1+nb(u))nu,bnb,j
SimpleTagBased不能反应用户个性化的兴趣,这里我们可以借鉴TF-IDF的思想,对这一公式进行改进。 n b ( u ) n_{b}^{(u)} nb(u)记录了标签 b b b被多少用户使用过
p ( u , i ) = ∑ b n u , b log ( 1 + n b ( u ) ) n b , i log ( 1 + n i ( u ) ) p(u, i)=\sum_{b} \frac{n_{u, b}}{\log \left(1+n_{b}^{(u)}\right)} \frac{n_{b, i}}{\log \left(1+n_{i}^{(u)}\right)} p(u,i)=b∑log(1+nb(u))nu,blog(1+ni(u))nb,i
同理我们可以再加入对热门物品进行惩罚。 n b ( u ) n_{b}^{(u)} nb(u)记录了标签 b b b被多少用户使用过, n i ( u ) n_{i}^{(u)} ni(u)记录了物品 i i i被多少用户标记过。
p ( u , i ) = ∑ b Q n u , b log ( 1 + n b ( u ) ) n b , i log ( 1 + n i ( u ) ) R p(u, i)=\sum_{b} {Q}\frac{n_{u, b}}{\log \left(1+n_{b}^{(u)}\right)} \frac{n_{b, i}}{\log \left(1+n_{i}^{(u)}\right)}{R} p(u,i)=b∑Qlog(1+nb(u))nu,blog(1+ni(u))nb,iR
再加入我们考虑视频本身的质量因素 R R R(可以是带时间衰减的观看次数,也可以是上线之后的CTR),再考虑标签本身的质量 Q Q Q
对用户进行了引导,豆瓣利用标签讲用户的推荐结果作了聚类,显示了对不同标签下用户的推荐结果,增加了推荐的多样性和可解释性。
最终组织页面,提高了推荐结果的多样性,因为读者的兴趣可能在长时间是广泛的,但是某一天比较具体,我们想要在某一天击中用户当天的兴趣,通过标签云,展示了所有读者的兴趣,让读者根据他今天的兴趣去选择相关的标签,得到参考结果,提高了推荐结果的多样性,是推荐结果更容易满足用户多样的兴趣。
基于标签的推荐属于基于内容的推荐算法。
基于上面的分析,我认为对于文娱的推荐,基于标签的是不错的选择。文娱类作品区别于电商产品,文娱网站中的电影,书,视频是有内容的,自身都有区别与其他作品的特性,没有哪个作家希望自己的书和别人完全相同,而这些作品也有着一些共性,是有温度的,而用户的这些标签,像是书签,注脚,提炼概况他的内容。这些作品会容易引起人们的共鸣,优质的社区会有同样会有优质的评价和Tag。顾客和读者也就愿意分享他们的感受和评价,而这些Tag是他们的理解,他本身的内容就很好的特征,是人类主观上,高层次的抽取。
因此我认为对于文娱的推荐,基于标签的推荐是不错的选择
愿意分享他们的感受和评价,而这些Tag是他们的理解,他本身的内容就很好的特征,是人类主观上,高层次的抽取。
因此我认为对于文娱的推荐,基于标签的推荐是不错的选择
参考资料:《推荐系统实践》