推荐算法

1.推荐算法

推荐算法(Recommendation System,RS)是计算机专业中的一种算法,通过一些数学算法,推测出用户可能喜欢的东西,核

心就是为用户推荐与其兴趣像是都比较高的商品。

在推荐系统中常见的推荐算法有六种:

基于协同过滤的推荐,基于内容的推荐,基于关联规则的推荐,基于效用的推荐,基于知识的推荐和组合推荐。

其中协同过滤(Collaborative Filtering,CF)算法是最基本的 推荐算法,在这其中,协同过滤算法可以分为基于用户的协同过

滤算法和基于的协同过滤算法。

2.协同过滤算法

协同过滤算法的核心是:通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似

的项。为了寻找与其品味相似的项,通常有两种方法:

(1)通过相似用户进行推荐,比较用户之间的相似性,其越相似表明两者之间的品味越相似。(2)通过相似项进行推荐,比较

项与项之间的相似性,为用户推荐其打过分的相似项。前者为基于用户的推荐,后者为基于项的推荐。

衡量其相似度有三种度量计算方法:

欧氏距离,皮尔逊相关系数,余弦相似度。

欧式距离在KNN中计算其相似个数。

公式为:|x| = √( x[1]^2 + x[2]^2 + … + x[n]^2 )

在不同特征量级差距很大的情况下,皮尔逊相关系数可以克服不易度量的缺陷,其对量级不敏感。

皮尔逊相关系数公式为:

你可能感兴趣的:(机器学习)