CD案例分析

数据集来源于CDnow网站的用户购买行为,数据集一共包含四个字段:user_id,购买日期,购买数量和购买金额。属于非常典型的消费行为数据集,非常适合利用pandas以及numpy对其进行分析。
数据集下载链接:
链接:https://pan.baidu.com/s/1WCObQB8naiRzyD8vqk3tTQ
提取码:p4qq

分析思路:

1.处理数据
2.进行用户消费趋势的消费(按月)
3.用户个体消费分析
4.用户消费行为
5.复购率和回购率分析

1.前言:

(1)输入需要用到的第三方工具:
(2)导入数据
(3)查看数据类型及具体描述

用户平均购买2.4个商品,标准差为2.3,中位数为2个商品,75分为数为3个商品,说明大部分订单的购买量都不多。单个用户购买商品最大值为99个。
一般而言,消费了数据都会呈现二八定律,即20%的客户贡献了80%的订单量或销量。


数据集不存在空值

(4)将日期转化成正确格式

2.进行用户消费趋势的消费(按月)

(1)每月的消费总金额

前三个月消费总额逐渐增多,在三月份的时候销售金额达到株高,在接下来的一个月,销售金额急剧下降。说明前三个月新用户增多,之后出现平稳期。在四月份后,波动不是较平稳。

(2)每月的消费消费次数

每月的消费次数与消费金额成正比。因此,它们变化趋势相似

(3)每月的产品购买量
(4)每月的消费人数

前两个月消费人数呈递增趋势,接下来的一个月消费熟人有所下降,但是消费金额确在增加,说明平均消费者的销售金额增加。接着,消费人数急剧下降。四月之后,消费人数逐渐平稳。

3.用户个体消费分析

(1)用户消费金额,消费次数的描述统计

由上图知,每个用户平均购买7张CD,最多购买了1033张。用户平均消费金额106元,然而中位数才只有43元,因此肯定存在少部分的高额消费用户。


由上图知,每个用户平均购买次数为是3,50%的用户消费是1次,而最大消费次数为217,说明少部分客户消费次数多。

(2)用户消费金额散点图

都未发现明显异常点,订单均价在10元左右。

(3)用户消费金额的分布图

从直方图上看到,大部分顾客的消费能力一般,高消费用户在图中几乎看不到,这也符合消费行业的一般规律

(4)用户累计消费占比

方法一:

方法二:
图中可以明显的看出,前20000个用户贡献了40%的消费,后4000位用户贡献了60%的消费金额。确实呈现二八倾向

4.用户消费行为

(1)用户第一次消费

观察消费的时间节点,用户初次消费月份,主要集中在前三个月

(2)用户最后一次消费

用户最后消费月份
同样主要集中在前三个月,后边也有用户消费,但数量逐渐减少

(3)新老客消费比
多少用户仅消费了一次

一半多的客户只消费了一次,需要采取措施将新客户转化成老客户

用户分层
RFM
新,老,活跃,回流,流失
第一步
第二步:

(1)

(2)
(3)
(4)

(5)

(6)
只看紫色和红色活跃用户和回流用户两个分层,他们的和就是消费用户占比。3月份之后,总量不再变化,说明后期没有新客。
用户购买周期(按订单)
用户消费周期描述
用户消费周期分布
用户生命周期(按第一次&最后一次消费)
用户生命周期描述

用户生命周期平均为134天。

用户生命周期分布

可见大部分用户只消费了一次,用户生命周期都集中在了0天,这并不是我们想要的。因此将只消费一次的用户删除掉,来计算消费两次以上顾客的生命周期。

虽然仍有不少用户生命周期集中在0天,但比第一张图好很多了,呈现双峰趋势图。部分质量差的用户虽然消费了两次,但仍旧无法持续,在用户首次消费30天内应该尽量引导。少部分用户集中在50天~300天,属于普通型的生命周期,高质量用户的生命周期,集中在400天以后,这已经属于忠诚用户了。

5.复购率和回购率分析

复购率(自然月内,购买多次的用户占比)

(1)

(2)
由上图可以看出,在再起,由于新用户的大量加入,早期新客的复购率并不高,但随着时间的推移,出现比较多忠诚的老顾客,复购率上升,维持在20%左右。
回购率(曾经购买过的用户在某一时期内的再次购买的占比)

(1)

(2)

(3)
可知,用户的回购率约为30%,大于复购率20%。
综合回购率和复购率可知,新客质量整体低于老客,老客忠诚度表现较好,这是CDNow网站的用户消费特征。

你可能感兴趣的:(CD案例分析)