机器学习课程笔记(第九周-2)推荐系统

课程链接:https://www.coursera.org/learn/machine-learning
参考文章:https://www.cnblogs.com/maxiaodoubao/p/10220632.html

推荐系统 Recommender Systems

问题形式化 Problem Formulation

例子引入:电影评分
机器学习课程笔记(第九周-2)推荐系统_第1张图片
定义
n: 特征变量数,图中有两个特征变量。x1 代表电影的浪漫程度,x2 代表电影的动作程度。
θ^(j):用户j的参数向量。
x^(i):电影i的特征向量。第一项x0=1截距
用户j和电影i,预测其评分为
机器学习课程笔记(第九周-2)推荐系统_第2张图片
机器学习课程笔记(第九周-2)推荐系统_第3张图片

用梯度下降求最小值
机器学习课程笔记(第九周-2)推荐系统_第4张图片
不基于内容的推荐系统

协同过滤算法 Collaborative Filtering
如果既没有用户的参数,也没有电影的特征,可以使用协同过滤算法,同时学习这两者。
优化目标便改为同时针对x和θ进行。是一个:预测 θ,再反过来预测 x, 再预测 θ,再预测 x 的迭代过程.
机器学习课程笔记(第九周-2)推荐系统_第5张图片
算法:
合并两个函数,得到一个新的代价函数
机器学习课程笔记(第九周-2)推荐系统_第6张图片

(1)首先我们将会把 x 和 θ 初始为小的随机值
(2)用梯度下降 或者某些其他的高级优化算法把这个代价函数最小化
(3)最后给你一个用户,如果这个用户具有一些参数 θ ,以及给你一部电影带有已知的特征 x ,我们可以预测这部电影会被 θ 转置乘以 x 给出怎样的评分,或者将这些直接填入。如果用户 j 尚未对电影 i 评分,那我们可以预测这个用户 j 将会根据 θ(j) 转置乘以 x(i) 对电影 i 评分。
机器学习课程笔记(第九周-2)推荐系统_第7张图片
机器学习课程笔记(第九周-2)推荐系统_第8张图片

协同过滤算法的向量化实现
向量化:低秩矩阵分解 Vectorization: Low Rank Matrix Factorization

机器学习课程笔记(第九周-2)推荐系统_第9张图片
机器学习课程笔记(第九周-2)推荐系统_第10张图片

均值归一化 Mean Normalization

用户没有评分过电影的情况:
我们把所有评分放到矩阵Y里,全部是问号的这列 对应的是 Eve 没有给任何电影评分
机器学习课程笔记(第九周-2)推荐系统_第11张图片

计算每个电影所得评分的均值,存在向量μ中
把所有的电影评分,即Y的每一行都减去平均评分,所以每个电影在新矩阵Y中的平均评分都是0
用新矩阵Y当做数据集进行协同过滤,学习参数 θ(j) 和特征变量 x(i) ,即用均值归一化后的电影评分进行学习。
机器学习课程笔记(第九周-2)推荐系统_第12张图片

 

你可能感兴趣的:(机器学习与数据分析,机器学习,推荐系统)