pyspark的ALS协同过滤推荐算法-小结1

ALS协同最小二乘法是用于推荐的常用算法,下面使用用户和电影的推荐作为例子解释其原理大致如下:
1.何为协同过滤:R[mn] = U[mk]V[nk],其中k就是矩阵的秩,可以解释为有多少个隐藏的特征(比如安静类的电影),U表示是用户对电影隐含特征的偏好矩阵,另一个是商品所包含的隐含特征的程度的矩阵
2.最小二乘法:ALS没有采用梯度下降法来求取目标值,他的代价函数是最小二乘法,也就是|R[- UV|平方和的最小值,但是一般为了得到的最终结果不会过拟合,求解损失函数的时候会加上一个正则化系数,如:
L1正则化后的损失函数: ||R[- UV|| 的平方 + 系数a
(|U| + |V|)
L2正则化后的损失函数: ||R[- UV|| 的平方 + 系数a*(|U|平方 + |V|平方),要解决的问题都是过拟合问题

你可能感兴趣的:(python机器学习,推荐算法,机器学习)