用户画像-User Profile

@ 2018-05-27

    • 1. 用户画像
      • 1.1 什么是用户画像?
      • 1.2 用户画像与推荐系统的关系
    • 2. 用户画像的关键因素
    • 3. 用户画像的构建方法

1. 用户画像

1.1 什么是用户画像?

用户画像常见对应两个英文词Personas和User Profile,Personas属于交互设计领域的概念,后者原本常用于营销领域,营销人员需要对营销的客户有更精准的认识,从而能够更有针对性的对客户和市场制定营销方案。但是传统营销领域是以市场销售人员为第一视角去看待客户的,即用户画像为营销人员服务;这种用户画像和用在推荐系统领域的用户画像相差较大,最常见莫过于高大上的PPT上出现的用户画像,用标签云的方式绘制一个人的形状,或者在一个任务形象旁边列出若干人口统计学属性。

而一个赤裸裸的真相是:越酷炫的用户画像越没什么用。为啥?根本原因在于:用户画像应该给机器看,而非给人看。

1.2 用户画像与推荐系统的关系

推荐系统的使命是在用户(User)和物品(Item)之间建立连接,一般的方式是对用户和物品之间的匹配评分,也就是预测用户评分或者偏好。第一步是将用户和物品进行向量化,后续用于计算。而向量化后的结果,就是User Profile,所以用户画像并非推荐系统的目的,而是在构建推荐系统的过程中产生的一个关键环节的副产品。

2. 用户画像的关键因素

  • 维度
    • 每个维度的名称都是可理解的
    • 维度的数量
    • 有哪些维度
  • 量化,在实际生产系统上,用户画像每个维度的量化,应该交给机器去做,并且以目标为导向,以推荐效果好坏来反向优化出用户画像才有意义;
  • 效果,不要为了用户画像而用户画像,它只是推荐系统的一个副产品,所以要根据使用效果(排序好坏、召回覆盖等指标)来指导用户画像的量化。

3. 用户画像的构建方法

  • 第一类——基础信息,就是直接使用用户在注册时的原始数据,如人口统计学信息或者一些一旦发生就不再改变的行为信息,如第一次注册时间,第一次查看内容等,这部分内容也被称为静态信息(Static)。这个基础信息类似于查户口,其实没有什么技术含量,但是对于用户冷启动场景非常有用
  • 第二类——行为信息,这里就是不断的堆积用户的历史行为数据,做统计,也是最常见的用户画像数据之一,可以理解为是堆数据。这里如果要做得更细,也可以将行为信息分为以下两类:
    • 基本行为,通过单次统计就得到的行为信息,如登录次数,付费次数等;
    • 衍生行为,需要基于基本行为统计信息二次计算得到的行为信息,如近1个月的登录频次及消费频次;
  • 第三类——模型标签,其实就是黑盒子,通过机器学习方法或深度学习,学习出人类无法制管理界的稠密向量,也不被非技术人员重视,但实际在推荐系统中承担的作用非常大。也包括两类:
    • 可直观理解,在有标注数据的情况下用机器学习方法对用户或者物品进行分层或分群,这种层级是用户可以直接理解并使用的;
    • 不可直观理解,比如使用浅语义模型构建用户阅读兴趣,或者使用矩阵分解得到的隐因子,或者使用深度学习模型学习用户的Embedding向量。这类用户画像数据通常是不可解释,不能被人直接看懂。

以上的每个画像类别都会涉及数据挖掘的各个阶段,包括数据采集、清洗、融合、算法……

你可能感兴趣的:(用户画像)