用户画像以及推荐系统

一.用户画像
1.什么是用户画像

根据用户目标,行为, 观点的差异,抽出典型特征进行区别,即打标签
2.建立用户画像作用
例如:啤酒与尿布的故事
推荐系统 猜你喜欢
精准营销 锁定用户 广告投放
3.建立用户画像的数据
数据:静态和动态数据
静态:性别 地域 职业 消费等级
动态:浏览网页 搜索商品 发表评论
4.一般步骤
数据预处理
特征选择
建模预测

待补充代码

二.推荐系统
1.协同过滤
(1)基于用户的协同过滤

确定其他用户是否跟自己相似,将邻居们的喜好组织成一个有序的目录,从而方便根据阈值挑选
步骤
收集用户偏好
找到相似的用户
计算相似的(欧氏距离,pearson相关系数 ,余弦相似度 )
根据相似的进行推荐(固定数量的邻居或者基于相似度门槛的邻居(比较好))

基于用户的协同过滤
目标:用户评分矩阵一般比较稀疏,推断矩阵中为0的值
存在问题
新用户没有任何信息,无法计算相似度
对于一个物品邻居没打分,那么该物品永远不会被推荐
改进
考虑共同打分物品的数目 ,归一化 
为啥不流行
稀疏问题 ,数百万客户时计算量大 ,人是善变的


(2)基于物品的协同过滤
计算性能高,用户数量远大于物品数量,物品不善变

用户冷启动方式有:
引导用户表达属性,推荐排行榜,根据用户注册属性

协同过滤的例子:
基于用户的推荐 :实时新闻
基于物品的推荐 :图书 电子商务 电影


2.隐语义模型
用户和物品有隐含的联系,将用户和物品通过中介隐含因子联系起来
将用户对物品的评分矩阵分解成两个矩阵:一个是用户对隐藏因子矩阵,一个是隐藏因子对物品的矩阵

正负样本的选取
正样本选取:有评分的
负样本选取:热门但用户没有行为

隐语义模型参数矩阵
隐特征个数,通常F=100
学习率 不要太大
正则化参数
正负样本比例
问题:
实时推荐比较难
指标:
准确率 rmse
召回率 给他推荐了这么多之后,有哪些是推荐对的
覆盖率  
多样性 
广告收益
 

你可能感兴趣的:(用户画像以及推荐系统)