电商大数据应用之用户画像

用户画像项目介绍

用户画像(UserProfile)

也叫用户信息标签化、客户标签;从电商的角度看,根据你在电商网站上所填的信息和你的行为,可以用一些标签把你描绘出来,描述你的标签就是用户画像。

构建用户画像技术

  • 用户画像:基本属性、购买能力、行为特征、社交网络、心理特征、兴趣爱好

  • 行为建模:文本挖掘、自然语言处理、机器学习、预测算法、聚类算法

  • 数据收集:网络日志数据、用户行为数据、网站交易数据

用户画像简介

静态信息数据

  • 来源于用户填的个人资料,或者由此算出的数据

  • 如果有不确定的,可以建立模型来判断,比如用户性别如果不填,可以建立性别模型,根据用户的行为来判断其性别是什么及其概率
    性别、生日、城市、学历、星座、月收入、婚姻状况、职业

动态信息数据

  • 用户行为产生的数据:注册,浏览,点击,购买,签收,评价

  • 比较重要的行为:购买商品,浏览商品,放入购物车,关注商品
    注册时间、首单时间、纠结商品、最大消费、退货数量、败家指数、品牌偏好

确定的标签与根据算法猜测的标签

  • 确定的标签:比如用户购买了或者收藏了某个商品,用户送货地址和联系手机

  • 猜测的标签:比如用户的性别,是男性的概率0.8,另外还有很多模型:孕妇模型,潜在汽车用户模型,用户价值模型
    是否孕妇、孩子性别概率、疑似马甲标志、潮妈族、满减促销敏感度、败家指数

标签举例

用户画像的用途

  • 分类统计

  • 营销推荐

  • 数据挖掘
    根据用户的数据挖掘出一些有用的规律以支持决策

用户画像建模

客户消费订单表

根据客户消费的情况提取的客户标签;用于了解用户的消费总体情况,以根据用户消费习惯与消费能力做营销

主要数据来源表:订单表、退货表、用户表、购物车表

  • 订单表:第一次消费时间、最近一次消费时间、首单距今时间、尾单距今时间

  • 订单表+退货表构建的标签:近30天购买次数(不含退拒)、近30天购买次数(含有退拒)、近30天购买金额(不含退拒)、近30天购买金额(含有退拒)

  • 订单表:最小/最大消费金额、累计消费次数(不含退拒)、累计消费金额(不含退拒)、累计使用代金券金额;来判断用户总体消费情况

  • 订单表标签:客单价(含退拒)、近90天客单价(含退拒)——反应消费水平;常用收货地区、常用支付方式——常用消费属性,方便定向营销。

  • 购物车表标签:最近30天 购物车次数、商品件数、提交商品件数、放弃件数、成功率

  • 订单表+退货表:退货商品数量、金额;拒收商品数量、金额;最近一次退货时间。用户拒收和退货习惯

  • 订单表+用户表:学校、单位、家里、上午、下午、晚上下单总数

客户购买类目表

根据客户购买目的情况提取的客户标签;用于了解类目的购买人群情况和针对某一类目的营销等。

主要数据来源表:订单表、购物车、类目维表

  • 类目维表:一级分类ID、名称;二级分类ID、名称;三级分类ID、名称——用户购买过哪些类目

  • 电商的三级类目:

  • 客户购买类目:
    订单表+类目维表:近30/90天购买类目次数,近30/90天购买类目金额,近180天购买类目次数/金额,累计购买类目金额;近30/90天购物车类目次数/金额;最后一次购买类目时间——客户最近购买了什么,用户喜欢哪些类目;用户多久没有购买该类目

客户购买商店表

根据客户购买商店的情况提取的客户标签;用于了解商店及品牌的购买人群情况;常用来针对某一品牌的营销,某店铺活动的营销。

主要数据来源表:订单表、购物车表、商店表、退货表

  • 商店表:商店ID、商店名称、品牌ID、品牌名称

  • 商店表+购物车表:最近30天购物车次数/购物车商品件数/购物车提交商品件数/购物车成功率/购物车放弃件数

  • 商店表+购物车表:最后一次购物车时间/提交商品件数/次数——用户多久没有挑选该品牌

  • 商店表+订单表:最近90天排除退拒商品件数/金额、最近90天购买订单数(含退拒)、最近90天货到付款单数——用户最近购买商店与品牌的情况

  • 商店表+订单表:最近90天退换件数、拒收件数 、退换商品金额、拒收商品金额

  • 商店表+订单表:最后一次排除退拒订单时间、最后一次排除退拒订单购买商品金额/件数、最后一次退货时间、最后一次拒收时间

使用Hive进行数据开发

用户画像数据开发

你可能感兴趣的:(hive)