基于领域的社会化推荐

首先介绍几个概念:familiarity(u,v)=|out(u) & out(v)|/|out(u) | out(v)|   用户的熟悉度,社交网络中,看看有多少共同好友和共同关注(Facebook用这种方法),twitter一般用in(uv),来判断熟悉度。Facebook最出名的算法EdgeRank算法(信息流推荐算法):其他用户对当前信息流的回话产生过行为的行为。一般U*W*D(u代表相似度,w代表行为权重,d代表时间衰弱),但是没有考虑主题的相关性。一般好友推荐算法,从内容匹配上面可以分:基于统计学,兴趣,地址等。一般来说需要实时存储的数据,比如说是购物车购买数据,加入购物车数据,都要存储在数据库和缓存中,大规模非实时的数据存在HDFS中。

小知识点总结:

mysql中想要按照顺序排列,用order by,其中默认是按照升序排列,order by-----desc是按照降序排列。

数据库连接池:连接数据库是一个比较费时的开销,因此在第一次建立一个连接池,每一个连接共享数据库资源,这样以后可以省时间。


你可能感兴趣的:(基于领域的社会化推荐)