浅谈智能推荐思路(个性化推荐系统)

什么是个性化推荐?

避免用户花费大量的时间去找自己喜欢的内容(频道/帖子),能把你最想要的内容直接推到你面前。

维度:

文章特征:主题词、标签、热度、转载、失效、相似度

用户特征:性别、职业、年龄、兴趣、短期点击行为…

环境特征:时间、地域、天气、网络环境…

原理:

1.数据建模:推荐系统根据用户的某些信息给用户建模,同时给频道建模。

2.内容推荐:推荐系统根据不同的算法对用户兴趣与频道信息进行筛选匹配,找到用户感兴趣的频道,然后推荐给用户。

3.分类:根据用户行为记录等,对用户进行划分,对同一群体的用户推荐其余用户喜欢的;同理也可以根据内容元素给内容分类。

常用推荐算法:

比较普遍的个性化推荐算法有三种,分别是:基于热门排行榜推荐、基于内容的推荐算法和基于社交网络的推荐算法。

1.基于热门/排行榜推荐

这种推荐很简单粗暴,字面意思,我们只要定义好“热门”的概念。

如:点击率高、阅读深度、停留时间、赞的数量

2.基于内容的推荐算法

该算法的基本思想是根据用户的历史兴趣数据,建立用户模型,然后针对推荐频道的特征描述进行特征提取,最后将频道特征与用户模型相比较,相似度较高的频道就可以得到推荐。

流程:

优先定义频道的特征,用标签的形式进行描述。(需要建立一套描述频道的词库)

机器+人工对频道进行标签化描述。

把相似度较高的内容进行排重或合并(频道)

3.基于社交网络的推荐算法

如果你的好友加入了某个频道,那么你也很有可能会感兴趣;

或者你加入了一个频道,那么你很可能会喜欢与这个频道相似度很高的另一个频道。

如果你的好友赞了某条帖子,那么你都看到这个帖子的概率就会增加。

方案:

1.给“频道和帖子”进行归类,并建立评分规则:

用户不管在帖子中的行为还是在频道中的行为都会影响推荐的频道。

这是我们前面说到的给内容分类。简单说就是给“频道和帖子”贴标签,把相同/相似标签的归到一块。所以一个频道或帖子可能会被归到多个类别里。在推荐频道的时候可以根据高分数的标签的,给用户推荐带有这个标签的频道;

对用户在频道(或帖子)上的行为建立评分规则有助于更好分析用户的喜好从而进行更精确的推荐,比如以下行为:

2.建立用户模型

制定评分规则后,就可以得到和该用户相关的帖子和频道的一个得分,那么根据这些数据就可以给用户建立相应的模型从而为其做精确推荐。

3.寻找相似的用户

常用的计算相似度评价值的体系有两种:欧几里得距离和皮尔逊相关度;这里列举欧几里的距离

欧几里得距离非常直观,如下图,根据上面得出的评分,我们可以制作二维图,简单明了看出用户在哪个位置,比如 A 用户就与 D 用户距离最近,所以可以给 A 推荐 D 加入的频道。

关于排序的思路举例:

如:

自己关注的优先显示

推荐的频道,访问过的优先显示

热度高的靠前显示

精华贴推荐

后期我们将优质的文章主动推给用户,而什么样的内容才是优质的?

质量指数:垂直,原创,互动,活跃,健康顺序针对性工作

垂直:垂直领域帖子

原创:帖子在全网没有雷同或者相似的文章

互动:帖子评论较多、帖子质量好引发更多的转发

活跃:访问次数高

健康:拦截不适合推荐的内容(色情、反动、低值、旧闻)

2017-03-23

你可能感兴趣的:(浅谈智能推荐思路(个性化推荐系统))