读书笔记《推荐系统实战》| 利用社交网络数据

《推荐系统实战》这本书的下载地址:《推荐系统实战》

第一章 好的推荐系统
第二章 利用用户行为数据
第三章 推荐系统冷启动问题
第四章 利用用户标签数据
第五章 利用上下文信息
第六章 利用社交网络数据
第七章 推荐系统
第八章 评分预测问题

美国著名的第三方调查机构尼尔森调查了影响用户相信某个推荐结果的因素,90%的用户相信朋友对他们的推荐。基于社交网络的推荐可以很好的模拟现实社会。所以利用社交网络数据进行推荐可以增加用户对系统的信任度。另外利用用户在社交网络的数据可以解决冷启动问题。

6.1 获取社交网络数据的途径

主要方式:电子邮件(联系人);用户的注册信息(居住地和工作地);用户的位置信息(网页的IP和手机的GPS);论坛和讨论组(豆瓣);即时聊天工具(QQ);社交网站(以Twitter为代表的兴趣图谱和以Facebook为代表的社交图谱)。

6.2 社交网络数据简介

用图定义社交网络:用图G(V,E,w)定义一个社交网络,V表示顶点集合,表示用户,E是边集合,表示两个用户是否有关系,w表示了边的权重。以Facebook为代表的需要双向确认的网络,可以用无向图表示;以Twitter为代表的社交网络只需要单方面关注,所以需要用有向图表示。
读书笔记《推荐系统实战》| 利用社交网络数据_第1张图片
社交网络数据:双向确认;单向关注;基于社区的社交网络数据(同一个公司的人);

社交网络数据中的长尾分布:用户的出度和入度都服从长尾分布。横坐标表示出度x,纵坐标表示出度为x的用户的数量f(x)。

6.3 基于社交网络的推荐

基于社交网络的推荐算法:基于领域的推荐;基于图的推荐;

信息流推荐:每个用户都有一个信息墙,展示了用户的好友最近的言论。信息流的个性化推荐就是进一步帮助用户从信息墙中挑选有用的信息。目前最流行的信息流推荐算法时Facebook的EdgeRank。

6.4 给用户推荐好友

好友推荐算法在社交网络被称为链接预测,这里讨论比较简单和直观的算法。

基于内容的匹配:常用内容属性包括,用户的人口统计学属性(年龄、职业、性别等);用户的兴趣(喜欢的物品和发布过的言论);用户的位置信息(用户住址、邮编、IP等);

基于共同兴趣的好友推荐:利用UserCF的思想,如果两个用户喜欢相同的物品(比如微博),就说明他们具有相似的兴趣;此外,也可以根据用户在社交网络中的发言提取用户的兴趣标签,来计算用户的兴趣相似度。

基于社交网络图的好友推荐:通过用户u和用户v的出度和入度,定义Wuv。根据相似度Wuv进行推荐。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
这些相似度都是基于一些简单计算公式给出的。这些相似度的计算无论时间复杂度还是空间复杂度都不是很高,非常适合在线应用使用

你可能感兴趣的:(推荐,推荐算法与Tensorflow)