用户画像简介

        随着我国电子商务的高速发展,越来越多的人注意到数据信息对于电商市场的推动作用。基于数据分析的精准营销方式,可以最大限度的挖掘并留住潜在客户,数据统计与分析为电商市场带来的突破不可估量。在DT时代,一切皆可“量化”,看似普通的小小数字背后,蕴藏着无限商机,也正在被越来越多的企业所洞悉。

用户画像简介_第1张图片

        数据已无处不在。信息化建设促进了数据爆发,全社会的信息化程度越来越高,越来越多的业务需要计算机应用,用户不这些应用交互产生大量数据 ;可穿戴设备的发展产生了大量数据,可穿戴设备甚至可植入设备将越来越多的出现在现实生活中 ;信息网络的高速发展,为大数据提供了实施空间,无处不在的网络将人和设备连接在一起,认识人,与人沟通的方法将发生本质性的变化 。如何从大数据中挖掘商机?建立用户画像和精准化分析是关键。

       在产品研发和营销过程中确定目标用是首要任务。不同类型的用户往往有不同甚至相冲突的需求,企业不可能做出一个满足所有用户的产品和营销。因此,通过大数据建立用户画像是必不可少的。

1、什么是用户画像?

        用户画像是根据市场研究和数据,创建的理想中客户虚构的表示。如:男, 31 岁,已婚,收入 1 万以上,爱美食,团购达人,喜欢红酒配香烟。这样一串描述即为用户画像的典型案例。如果用一句话来描述,即:用户信息标签化创建用户画像,这将有助于理解现实生活中的目标受众。企业创建的人物角色画像,具体到针对他们的目标和需求,并解决他们的问题,同时,这将帮助企业更加直观的转化客户。

        用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且计算机能够处理,如,可以做分类统计:喜欢红酒的用户有多少?喜欢红酒的人群中,男、女比例是多少?也可以做数据挖掘工作:利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌?利用聚类算法分析,喜欢红酒的人年龄段分布情况? 

 2、如何构建用户画像?

       在建立用户画像上,主要有三个步骤

  1. 基础数据收集,大致分为行为数据、内容偏好数据、交易数据,如浏览量、访问时长、偏好、回头率等等。
  2. 对收集到的数据进行行为建模,抽象出用户的标签
  3. 最后是把用户的基本属性、购买能力、行为特征、兴趣爱好、心理特征、社交网络大致的标签化

        一个标签通常是人为规定的高度精炼的特征标识,如年龄段标签: 25~35 岁,地域标签:北京,标签呈现出两个重要特征:语义化,人能很方便地理解每个标签含义。这也使得用户画像模型具备实际意义。能够较好的满足业务需求。如,判断用户偏好。短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。人制定标签规则,并能够通过标签快速读出其中的信息,机器方便做标签提取、聚合分析。所以,用户画像,即:用户标签,向我们展示了一种朴素、简洁的方法用于描述用户信息。

      在构建用户画像过程中,注重提取数据的多元性而不是单一性,譬如针对不同类型的客户提取不同的数据,又或者针对线上线下的客户分析其中差异。总而言之,保证数据的丰富性、多样性、科学性,是建立精准用户画像的前提。

2.1 数据源分析:

        构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。如,世界上分为两种人,一种是学英语的人,一种是不学英语的人;客户分三类,高价值客户,中价值客户,低价值客户;产品生命周期分为,投入期、成长期、成熟期、衰退期,所有的子分类将构成了类目空间的全部集合。这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景, 业务需求的不同,也许各有道理,按需划分即可。本文将用户数据划分为静态信息数据动态信息数据两大类。

用户画像简介_第2张图片

静态信息数据 用户相对稳定的信息,如图所示,主要包括人口属性、商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗工作,因此这方面信息的数据建模不是本文重点。
动态信息数据 用户不断变化的行为信息,广义上讲,一个用户打开网页,买了一个杯子;与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等都是用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多,如上图所示:浏览网站首页、浏览品类页、搜索具体物品、发表关于鞋品质的微博、赞“双十一大促给力” 的微博消息。等等均可看作互联网用户行为。本文以电商用户为主要分析对象,暂不考虑线下用户行为数据(分析方法雷同,只是数据获取途径,用户识别方式有些差异)。在互联网上,用户行为可以看作用户动态信息的唯一数据来源。如何对用户行为数据构建数据模型,分析出用户标签,将是本文着重介绍的内容。

2.2 目标分析
用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。如,红酒 0.8、李宁 0.6。
标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可
以简单的理解为可信度,概率。
2.3 数据建模方法

如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。

什么用户:关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。

用户的标识方式     效果 局限性
Cookie 互联网使用最广泛的方式,能够标识匿名、未注册的用户 通常有一定的有效期,不易跨浏览器、设备
注册ID     各家网站的用户标识,最常见的互联网会员管理 用户组册意愿越来越低,需要投入大量推广运营成本。
Email 互联网早期较为常用的用户标识方式,目前依然有一定的占有率。

一个用户可有多个Email,标识准确性降低

微博、微信、QQ 当下业内共识的第三方登录ID,提供OAuth授权机制 标识准确性,持久性上较好
手机号 移动端最精准的标识 较难获取,需要产品激励用户填写
身份证 官方用户标识 较难获取,需要产品激励用户填写

        什么时间:时间包括两个重要信息,时间戳+时间长度。时间戳,为了标识用户行为的时间点,如, 1395121950(精度到秒), 1395121950.083612(精度到微秒),通常采用精度到秒的时间戳即可。因为微秒的时间戳精度并不可靠。浏览器时间精度,准确度最多也只能到毫秒。时间长度,为了标识用户在某一页面的停留时间。
        什么地点:用户接触点(Touch Point)。对于每个用户接触点,潜在包含了两层信息:网址 + 内容网址:每一个 url 链接(页面/屏幕),即定位了一个互联网页面地址,或者某个产品的特定页面。可以是 PC 上某电商网站的页面 url,也可以是手机上的微博,微信等应用某个功能页面,某款产品应用的特定画面。如,长城红酒单品页,微信订阅号页面,某游戏的过关页。内容:每个 url 网址(页面/屏幕)中的内容。可以是单品的相关信息:类别、品牌、描述、属性、网站信息等等。如,红酒,长城,干红,对于每个互联网接触点,其中网址决定了权重;内容决定了标签。
        注:接触点可以是网址,也可以是某个产品的特定功能界面。如,同样一瓶矿泉水,超市卖 1 元,火车上卖 3 元,景区卖 5 元。商品的售卖价值,不在于成本,更在于售卖地点。标签均是矿泉水,但接触点的不同体现出了权重差异。这里的权重可以理解为用户对于矿泉水的需求程度不同。即,愿意支付的价值不同。
类似的,用户在京东商城浏览红酒信息,与在品尚红酒网浏览红酒信息,表现出对红酒喜好度也是有差异的。这里的关注点是不同的网址,存在权重差异,权重模型的构建,需要根据各自的业务需求构建。所以,网址本身表征了用户的标签偏好权重。网址对应的内容体现了标签信息。
        什么事:用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏 等等。不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。如,购买权重计为 5,浏览计为 1 。
        综合上述分析, 用户画像的数据模型,可以概括为下面的公式:用户标识 +时间 + 行为类型 + 接触点(网址+内容),某用户因为在什么时间、地点、做了什么事。所以会打上**标签。
        用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子 r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:标签权重=衰减因子×行为权重×网址子权重
如:用户 A,昨天在品尚红酒网浏览一瓶价值 238 元的长城干红葡萄酒信息。
标签:红酒,长城
时间:昨天,假设衰减因子为: r=0.95
行为类型:浏览,记为权重 1
地点:品尚红酒单品页,网址子权重记为 0.9(相比京东红酒单品页的 0.7)
假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。
则用户偏好标签是:红酒,权重是 0.95*0.7 * 1=0.665,即,用户 A:红酒0.665、长城 0.665。
上述模型权重值的选取只是举例参考,具体的权重值需要根据业务需求二次建模,这里强调的是如何从整体思考,去构建用户画像模型,进而能够逐步细化模型。
       当用户画像基本成型后,接下来就可以对其进行形象化、精准化的分析。此时一般是针对群体的分析,如可以根据用户价值来细分出核心用户、评估某一群体的潜在价值空间,以此作出针对性的产品结构、经营策略、客户引导的调整。

你可能感兴趣的:(大数据应用)