https://tianchi.aliyun.com/dataset/dataDetail?dataId=46
来源于阿里天池,是阿里巴巴提供的移动端淘宝用户行为数据集,包含2014-11-18至2014-12-18共计一千两百多万条数据
特征 | 说明 |
---|---|
user_id | 用户名(脱敏) |
item_id | 商品名(脱敏) |
behavior_type | 行为(点击,收藏,加入购物车,购买)对应1,2,3,4 |
user_geohash | 地理位置(大量缺失) |
item_category | 商品类别 |
time | 行为发生时间 |
一.PV,UV都呈现周期性的变化,双12波动最大
二. 平常,每到周五页面的流量变会出现波谷,此处下降原因应深入分析
三.漏斗分析
结论1:浏览到购买这一步转化率很低
猜想: 是因为用户找不到自己心意的物品.
建议:
1.对用户浏览到收藏行为埋点数据进一步分析,寻找哪个渠道的流失率过高
2.千人千面,应该对用户模型更加细分,达到更精准的商品推荐
结论2: 购物车到购买这一步的转化率与平日比较是否正常,若确出了问题
猜想: 是什么导致用户放弃付费?
正常情况: 出现了更符合心意或性价比更高的物品
不正常: 是否是支付时出了问题,比如双12系统较卡,或者用户忘记密码而无其他方式进行支付
建议:
对用户购物车到购买行为进行埋点,寻找哪个渠道的问题,及时进行优化
四:50%到75%箱重比例最大,大多数用户都处于7到17次这个消费次数
五:复购率为87%,说明产品已经较稳定,推测产品处于AARRR模型的Revenue阶段,应该稳定的向Refer阶段过渡,现在Refer阶段做的最好的是拼多多的参团砍价
六:
重要价值客户:予以关注并维护,如:定期举办促销产品活动
重要潜力用户:予以相应的价格刺激,如:折扣或捆绑销售
重要唤回用户:提高忠诚度和粘性,建立产品与客户之间的信任
流失客户:分析流失原因,建立流失预警模型
地理位置缺失太多,我们可以将此特征除去
对时间进行格式转换
2.1 时间维度对PV,UV分别进行分析
对PV,UV进行日拆解,并可视化展示
结论:
1. PV,UV都呈现周期性的变化,双12波动最大
2. 平常,每到周五页面的流量变会出现波谷,此处下降原因应深入分析
2.2 对PV,UV进行小时拆解,并可视化展示
结论:数据呈现正常,20~22点是用户访问的高峰
3.1
结论:可以看出点击到点击到收藏这一步有很大的落差,这部分转化率较低
结论1:浏览到购买这一步转化率很低
猜想:是因为用户找不到自己心意的物品.
建议:
1.对用户浏览到收藏行为埋点数据进一步分析,寻找哪个渠道的流失率过高
2.千人千面,应该对用户模型更加细分,达到更精准的商品推荐
结论2:购物车到购买这一步的转化率与平日比较是否正常,若确出了问题
猜想:是什么导致用户放弃付费?
正常情况:出现了更符合心意或性价比更高的物品
不正常:是否是支付时出了问题,比如双12系统较卡,或者用户忘记密码而无其他方式进行支付
建议:
对用户购物车到购买行为进行埋点,寻找哪个渠道的问题,及时进行优化
4.1消费次数维度
50%到75%箱重比例最大,大多数用户都处于7到17次这个消费次数
4.2 日ARPPU-产品的盈利能力
ARPPU=总收入/消费用户数量
总收入用消费次数代替
每日的用户消费在2次左右,双12消费次数大幅增长
4.2 日ARPU
ARPU=总收入/用户数量
总收入用消费次数代替
日ARPU在0.5附近波动,在11-21日波动较大
4.2 日付费率
付费率=消费人数/用户人数
4.2 复购率
复购率=复购行为用户数/消费行为用户总数
复购率为87%,说明产品已经较稳定,推测产品处于AARRR模型的Revenue阶段,应该稳定的向Refer阶段过渡,现在Refer阶段做的最好的是拼多多的参团砍价
4.3建立RFM模型
因为没有M(消费金额)列,因此只能通过R(最近一次购买时间)和F(消费频率)的数据对客户进行打分
RFM | Value |
---|---|
R | 1~6 |
F | 1~6 |
M | 无 |
划分打分维度,并对用户进行价值排序
重要价值客户:予以关注并维护,如:定期举办促销产品活动
重要潜力用户:予以相应的价格刺激,如:折扣或捆绑销售
重要唤回用户:提高忠诚度和粘性,建立产品与客户之间的信任
流失客户:分析流失原因,建立流失预警模型