一.分析背景
在互联网整体人口红利消失的背景下,电商平台流量成本不断提升,逐渐由流量思维开始向用户思维转变。本文希望通过对用户在平台上留下的的日常操作数据,进一步来分析用户的消费行为特点。
二.理解数据
1.数据来源
https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1
本数据集(UserBehavior.csv)包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、收藏),数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔
2.字段含义
userbehavior:表名
userid:用户ID,字符串类型,用户ID
itemid:商品ID,字符串类型,商品ID
categoryid:商品类目ID,字符串类型,商品所属类目ID
behavior:行为类型,字符串,枚举类型,包括('pv', 'buy', 'cart', 'fav')
timestamps:时间戳,行为发生的时间戳
注意到,用户行为类型共有四种,它们分别是
pv:商品详情页pv,等价于点击
buy :商品购买
cart :将商品加入购物车
fav:收藏商品
三.分析目的与思路
1.用户的粘性
通过群组分析方法,分析用户群体的跳出率,复购率,以及新增用户留存率
2.用户的消费习惯
分别按天和星期,分析用户各个时间的活动规律,便于更精细化运营
3.用户的流失情况
通过AARRR漏洞分析,在用户行为路径中,对各个环节用户流失情况进行分析,最后通过假设检验方法分析用户流失的原因
4.用户的价值分类
根据用户的消费间隔,消费频率,建立用户价值分类模型,对不同价值用户进行精准营销
四.数据清洗
1.选择工具并导入数据集
分析工具为navicat,mysql,可视化工具为powerbi
2.列重命名
3.缺失值处理
4.重复值处理
本次数据不需要重复值处理
5.数据一致化
由于源数据中时间为时间戳格式,故需全部改为时间格式
根据已提出的对用户消费行为的分析思路,还需要单独的日期列与时间列
6.异常值处理
本次数据选取的时间区间为2017-11-25至2017-12-3
发现有异常值,将异常值删除
五.业务分析
1.用户粘性
分析思路:
(1)跳出率
跳出率:用户产生pv行为后没有后续其他行为占总行为数的比例
用户跳出率仅为1.2%,说明平台中产品对用户吸引力较大
(2)复购率
复购用户:产生两次或两次以上不同时间购买行为的用户
复购率=复购用户/总用户人数
(3)用户复购次数占比
由以上复购率,以及复购购买次数占比的数据可以看出,有超过百分之五十的用户会在平台复购,并且复购用户的购买比率达到了百分之七十九,说明用户对平台商品的认可度很高,同时购买积极性也很高
(4)留存率
在今天的互联网行业,留存是比新增和活跃提到次数更多的指标,因为移动的人口红利没有了,用户越来越难获取,竞争也越来越激烈,如何留住用户比获得用户更重要。
通过对每天登录平台的用户进行分组,再从每天登陆平台的用户中筛选出第一次登陆的新用户,再计算几天后仍然使用平台的用户,从而计算出留存率
由以上结果可以看出,留存率基本都处于比较高的水平,可以反映出用户的忠诚度较高。
2.用户的消费行为习惯
(1)每日客户访问情况变化
uv(unique visitor):独立访客人数
pv/uv:每个独立访客平均浏览页面访问量,主要反映顾客的购买意愿,值越大,反映顾客的购买需求和欲望越强烈
可以看出,在11月26日和12月1日用户人均访问量达到峰值,在11月28日达到低谷,应该对这三日的运营等活动进行着重分析,查找原因。同时,用户整体访问量以及访客从12月1日开始显著上升,应该深层次挖掘原因,对未来运营提供有效经验
(2)用户每日购买行为变化情况
综合(1)和(2)的结果可以发现从12月1日开始,用户的访问量及行为量开始显著增多,经过查询可发现主要是由于双十二活动提前开始的预售活动。
(3)一天中用户活跃时段分布
从结果可看出,从0点到9点用户的活跃度符合正常作息规律,在晚上18-22时达到一天中的峰值,说明用户在晚上活跃度较高,可以在这个时刻加大推送活动和产品推荐,刺激用户进行消费行为活动
(4)一周用户活跃
从结果显而易见,周末用户行为数量大增,也证明运营活动应侧重周末或者在周末加大活动力度与与产品推送。
3.用户流失
(1)用户行为路径
(1)用户点击后流失的部分仅为5.9%,说明平台对于用户的吸引力很高。
(2)用户点击后直接购买的转化率为6.7%,相比于直接购买,用户更倾向于收藏加购后再进行购买,收藏后购买的转化率高达70%,故平台应通过优化产品交互界面或者营销机制等方面来引导用户对商品进行收藏或者添加购物车。
(3)用户添加收藏或者购物车后,流失概率为30%,反而比点击后直接流失要高出很多,因此需要对此部分进行优化,例如定期对用户推送/提醒添加购物车,收藏的商品。
(2)用户流失原因
通过假设检验,对用户流失原因进行假设,并逐一验证
(1)平台推荐商品用户不喜欢
找出浏览量前十和购买量前十的商品目录,并查找他们之间的相关性
有五处商品种类重合
再找出前十浏览量和前十购买量的商品并查找相关性
结果无一处重合
从平台浏览量前十的商品种类和商品与平台购买量前十的商品种类和商品重合度来看,此假设成立,高浏览量并没有为平台带来高购买量
(2)商品的种类不够丰富
检索出商品种类以及商品的数目
结果发现并非如此,商品的种类以及商品类别种类十分丰富,故假设二不成立
(3)商品的吸引力不够
按照购买次数将商品分类,查看不同购买次数商品的比例
从结果可以看出,96%的商品购买次数在4次以内,结合之前的用户复购率来看,表明了单个产品的复购率低,可说明产品对用户的吸引力不够。假设三成立。
总结:
(1)在对用户的吸引力上,平台起到了足够的作用,用户粘性高,在用户行为路径的分析过程中,用户通过收藏或者加购物车的路径购买的转化率最高,因此应该积极引导用户进行收藏或者加购物车
(2)用户流失的原因主要为,平台没能有效推荐用户喜欢的产品,平台缺乏足够吸引用户的有利产品。建议优化推荐机制,推荐更多用户购买量更多的产品,并通过直播等方式打造品牌和爆款产品