机器学习-吴恩达9(2)-推荐系统

推荐系统 Recommender Systems

问题形式化

推荐系统应用的十分广泛：如果你考虑网站像亚马逊，或网飞公司或易趣，或iTunes Genius，有很多的网站或系统试图推荐新产品给用户。如，亚马逊推荐新书给你，网飞公司试图推荐新电影给你，等等。这些推荐系统，根据浏览你过去买过什么书，或过去评价过什么电影来判断。这些系统会带来很大一部分收入，比如为亚马逊和像网飞这样的公司。因此，对推荐系统性能的改善，将对这些企业的有实质性和直接的影响。

通过一个栗子来了解推荐系统

假使我们是一个电影供应商，我们有 5 部电影和 4 个用户，我们要求用户为电影打分

QaTZY4.png

前三部是爱情片，后面两部是动作片。Alice和Bob更倾向于爱情片，Carol和Dave更倾向于动作片。一些标记

用户的数量
电影的数量
如果用户j给电影i评过份则
代表的是用户j给电影i的评分
表示的是用户j评过分的电影总数

基于内容的推荐系统Content Based Recommendations

在一个基于内容的推荐系统算法中，我们假设对于我们希望推荐的东西有一些数据，这些数据是有关这些东西的特征。现在假设电影有两个特征：

浪漫程度
动作程度

Qa7nUS.png

那么每部电影都有一个特征向量，如第一部电影的是[0,9 0]

针对特征来构建一个推荐系统算法。假设使用的是线性回归模型，针对每个用户使用该模型，表示的是第一个用户的模型的参数。定义如下：

第个用户的参数向量
电影的的特征向量

针对电影和用户，预测评分标准

代价函数可以表示为（针对用户j）：误差平方和+正则化项

其中表示只计算用户评过分的电影。针对所有用户的代价函数求和：

使用梯度下降法求出最优解，更新参数

协同过滤Collaborative Filtering

上面基于内容的过滤算法是通过电影的特征，使用特征来训练出每个用户的参数。相反，如果使用用户的参数，也可以学习得出电影的特征：

如果没有用户的参数和电影的特征，协同过滤算法便可以同时学习这两者。
$J(x^{(1)},...x^{(n)},\theta^{(1),...,\theta^{(n_u)}}) = \frac{1}{2}\sum_{i,j:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)}) ^2+\frac {\lambda}{2}\sum^{n_m}_{i=1}\sum^n_{k=1}(x^{(j)}_k)^2+\frac {\lambda}{2}\sum^{n_u}_{j=1}\sum^n_{k=1}(\theta^{(j)}_k)^2$

对代价函数求出偏导数的结果是：

协同过滤算法的过程：

初始化为很小的值
使用梯度下降算法最小化代价函数
训练完算法后，预测用户j给电影i的评分

向量化：低秩矩阵分解Vectorization_ Low Rank Matrix Factorization

协同过滤算法可以做的事情：

给出一件商品，找到与之类似的商品
当一个用户浏览了一件产品，找出类似的商品推荐给他

假设5部电影，4位用户，存放在矩阵中：

Movie	Alice (1)	Bob (2)	Carol (3)	Dave (4)
Love at last	5	5	0	0
Romance forever	5	?	?	0
Cute puppies of love	?	4	0	?
Nonstop car chases	0	0	5	4
Swords vs. karate	0	0	5	?

推出相应的评分

image

找出类似的影片

image

均值归一化Mean Normalization

image

上图中，假设新来个用户Eva，他没有对任何的电影进行评分，那我们以什么依据来给他推荐电影呢？

对上面的Y矩阵进行均值归一化，将每个用户对某一部电影的评分减去所有用户对该电影评分的平均值，得到如下的矩阵：

image

利用新的矩阵Y来训练算法。如果我们要用新训练出的算法来预测评分，则需要将平均值重新加回去，预测，模型会人为其给每部电影的评分都是该电影的平均分。

机器学习-吴恩达9(2)-推荐系统

推荐系统 Recommender Systems

推荐系统概述

问题形式化

基于内容的推荐系统Content Based Recommendations

协同过滤Collaborative Filtering

向量化：低秩矩阵分解Vectorization_ Low Rank Matrix Factorization

均值归一化Mean Normalization

你可能感兴趣的:(机器学习-吴恩达9(2)-推荐系统)