用户画像和系统推荐

1.隐语义模型

2.word2vector模型在推荐系统当中的应用
3.推荐系统评估指标
打分系统:均方根,平均绝对误差
top n 推荐:准确率(推荐正确的/推荐的)vs召回率(推荐正确的/用户实际浏览的)
覆盖率(对平台而言):推荐系统消除马太效应,覆盖率计算商品的曝光率,引入信息商,每个商品曝光的概率一样时信息熵最大
多样性(对用户而言推荐item不是单一的):相似度
时效性等。。。

4.推荐系统(基于内容):文本相关的产品TF-IDM(词在文件中重要度的度量)会出现冷启动的问题

冷启动问题解决:新用户:注册阶段收集相关的信息 ,用些小游戏互动 ,推荐非常热门的信息 新商品

                           新物品:根据item本身的属性

5.协同过滤:近朱者赤近墨者黑,近邻算法(计算用户交互的物品的相似度)
计算向量间的相似度:曼哈顿距离、欧式距离、jaccard距离、余弦相识度、pearson相识度
基于物品的协同过滤:一个用户对俩物品的打分,计算两个向量的相似度,
基于用户的协同过滤和基于物品的协同过滤比较
6.协同过滤的优缺点:可解释性强、需要大量的用户行为,假定之前的行为,不会考虑当前,稀疏矩阵问题

 7.隐语义模型:打分的用户应该有一些隐形的因素(演员、主题、年代,还有一些说不出来的因素),找出隐含的因子
 把user和item给关联起来(因素个数小于user和item个数)
 svd矩阵分解的方法,facto个数在业界可能是4或8,可以作为超参数,用模型选择
 相比之下:协同模型的可解释型更强,隐语义模型
8. scikit网站: scikit-surprise:http://surpriselib.com/

你可能感兴趣的:(机器学习)