基于内容推荐-读书笔记

推荐的起点:断物识人

基础原理:更好地了解待推荐的内容,更好地了解要推荐给的人,从而更高效的完成内容与人之间的对接

断物最简单的方式就是“贴标签”,标签是我们对多维事物的降维理解,抽象出事物更具有表意性、更为显著的特点。在不同的应用场景下,对标签全集进行有针对性地投射,有倾向性地选用不同的标签以换取信息匹配效率最大化。但在某些领域,标签很难准确地表意或概括

识人给目标用户贴标签,用户画像数据划分为静态、动态两类,

静态用户画像数据:独立于产品场景之外的属性,如性别、学历、年龄;

动态用户画像数据:显示行为通常大于隐式行为

包括:位置、搜索、评分、收藏、分享、评论、播放比例或播放时长


推荐算法:物以类聚,人以群分

协同推荐:

基于用户的协同:找到与你某一方面相似的人群,将这一人群喜欢的新东西推荐;用户a阅读内容1和2,用户b阅读内容1和2和3,就可以把内容3推给用户a

基于物品的协同:先确定你喜欢什么物品,再找到与之相似的物品推荐给你;内容1、2都被用户a、b读,当用户c读了1,所以就把2推给他

基于模型的协同:用用户的喜好信息来训练算法模型,实时预测用户可能的点击率。协同推荐基于用户行为的特点使我们不需要对物品或信息进行完整的标签化,更好的发现用户潜在兴趣偏好

场景划分:

交互界面的迭代辅助了用户的决策,引导用户按照系统所期望的方式前进,以实现提升系统指标的最终目的。因此,对推荐系统而言,有着“交互界面>数据>算法”的说法

推荐系统评估指标:

推荐准确度、推荐覆盖度(多样性)

冷启动:

对于主场景而言,用户留存一定是第一目标,只有把用户留下来才有持续探索的可能性。所以系统在新用户的冷启动推荐上也会更偏向于重大兴趣的收敛而非发散,尽可能地追求留存率的提升

对于冷启动的内容,我们可以基于文本分析抽离出内容的关键字、话题来建立内容画像;对于冷启动的用户,我们同样需要尽快完善信息的手机和预处理工作,建立对用户的初步认知

时空限定内容

为什么推荐会导致low?

1、三问内容质量:

由特定群体来判断,比如我是农民,我对于互联网、金融不感兴趣,但我对下河抓鱼、放羊的文章感兴趣,但这样的文章不能说是好文章,但也绝对不是low文章

真正的low文章:真实性上-歪曲事实,虚假信息;阅读体验上-无意义,错字连篇;价值引导-不正确价值观、色情;这些才是真正low的,不适合传播的

2、为什么会觉得推荐内容格调低劣

推荐准确定的问题:我在大学时读了一些知乎live的付费课,感觉讲的很好;现在再去看知乎live,感觉好low啊,没有干货、视听体验极差。这就表情了每个人的认知程度是不同的,一篇文章在不同人的眼里了的感受也不同

无意识反馈:每个人都有一种超我人格结构,是一个追求美好的心理,比如我愿意去看一些论文、讲座;人还会有本我的人格结构,他是追求快乐的,在我实际的阅读过程,我还是愿意去看nba、吐槽大会;本我会创造足够大的需求,所以我们如果根据点击、阅读时长、点赞来看,肯定接地气的内容更受欢迎(实际文章的稳步也符合马斯洛需求模型)

3、更平衡的产品设计

一篇有深度的文章相比于泛娱乐化的文章肯定属于少数,应该用更好的方式来引导推荐

内容稀缺度:越专业的文章越少,所以这种小类型的点击相比于大类型的点击更有价值

作者角度:每个领域都会有更专业的作者,我们在推荐时应该放大作者的权重,不止是基于内容相关性推荐

互动行为:可以提高分享的权重,分享意味着用户愿意去为之传播和背书


社交分发:遇到信息过载,广告刷屏

脸谱网最初采用边际排名算法:E=uwd,u用户与作者的亲密度分数、w不同反馈动作具有不同权重、d基于时间衰减,新内容权重越高

你可能感兴趣的:(基于内容推荐-读书笔记)