Python数据分析经典项目 -------CD消费用户行为分析


前言:

根据一家CD网站上的用户消费记录,对此数据消费情况以及用户行为进行分析。

数据样式如下:


数据来源:

链接:https://pan.baidu.com/s/1x8FzbYsAVdhAv24LsNkLfQ 

提取码:cvuk

具体步骤:

1.数据清洗

2.进行用户行为销售分析(按月):每月消费总额、次数、产品购买量、人数

3.用户个体消费分析:重点关注消费金额和消费次数情况

4.用户消费行为分析:首购、最后一次购买、用户分层(新老客、RFM)、用户购买周期、用户生命周期

5.用户回购率和复购率分析

一.数据清洗

1.导入常用包及数据集


导入数据的前十行:


2.检查数据并且清理数据:



修改后的源数据:


按月分析故新列【month】字段

二.进行用户消费趋势分析(按月)

1.每月的消费总金额


导入可视化包



由上图可知,消费金额在前三个月达到最高分,后续消费金额较为平稳,有轻微下降趋势

2.每月的消费次数


前三个月消费订单数在10000笔左右,后续月份的平均消费人数则在2500人

3.每月的产品购买量


前三个月产品购买数在20000以上,后续月份的产品购买量在6000-8000左右。

4.每月的消费人数


每月消费人数低于每月消费次数,但差异不大。前三个月每月的消费人数在8000-10000之间,后续几个月,平均消费人数2000人不到。

5.直接利用数据透视表分析消费金额,产品购买量,消费次数



二.用户个体消费分析

1.用户消费金额,消费次数的描述统计


用户平均买了5.39张CD,但是中位数只有1,说明小部分用户购买了大量的CD。用户平均消费了3.7元,中位值有7.37,判断同上,有极值干扰

2.用户消费金额和消费的散点图


3.用户消费金额的分布图


4.用户累积消费金额占比(百分之多少的用户占了百分值多少的消费额)


按用户消费金额进行升序排列,由图可知50%的用户仅仅贡献了15%的消费额度。而排名前5000的用户贡献了60%的消费额度。

三.用户消费行为

1.用户第一次消费(首购)


用户第一次购买分布,集中在前三个月。其中,在2月11日至2月25日有一次剧烈波动

2.用户的最后一次消费


用户最后一次购买的分布比第一次分布广 大部分最后一次购买,集中在前三个月,说明很多用户购买了一次后就不再购买

3.新老客户消费比

3.1多少用户仅仅消费一次


有一半用户,就消费了一次

3.2 每月新客户占比?



利用布尔值筛选True

97年3至4月新用户数量由90%跌落80%,后几个月新用户量保持在80~82%区间,1998年6月后再无新用户。

4.用户分层-RFM







从RFM分层可知,大部分用户为重要保持客户,但是这是由于极值的影响,所以RFM的划分标准应该以业务为准。尽量用小部分用户覆盖大部分的额度。不要为了数据好看而划分等级

5.用户分层 -新,活跃,回流,消失






若本月没有消费

- 若之前是为注册,则依旧为为注册

- 若之前有消费,则为流失/不活跃

- 其他情况,为未注册

若本月有消费

- 若是第一次消费,则为新用户

- 如果之前有过消费,则上个月为不活跃,则为回流

- 如果上个月未注册,则为新用户

- 除此之外,为活跃




流失用户(unactive)正在增加

新用户暂停

活跃用户越来越少

运营差



由上表可知,每月的用户消费状态变化
- 活跃用户,持续消费的用户,对应的是消费运营的质量
- 回流用户,之前不消费本月才消费,对应的是唤回运营
- 不活跃用户,对应的是流失

6.用户购买周期(按订单)

- 用户消费周期描述
- 用户消费周期分布




- 订单周期呈指数分布
- 用户的平均购买周期是68天
- 绝大多数用户的购买周期都低于100天

7.用户生命周期(按第一次&最后一次消费)

- 用户生命周期描述
- 用户生命周期分布



用户的生命周期受只够买一次的用户影响比较厉害(可以排除)。用户均消费134天,中位数仅0天


四.复购率和回购率分析

复购率
- 自然月内,购买多次的用户占比
回购率
- 曾经购买过的用户在某一时期内的再次购买的占比



复购率稳定在20%左右,前三个月有大量新用户涌入,而这批用户只购买了一次,所以导致复购率降低

绝大多数用户购买了一次后不再购买,老用户回购率在30%徘徊

总结

1.cd网站的用户在前三个月内涌入绝大多数新用户,其前三个月的平均消费次数为10000笔左右,消费人次达8000~10000左右,后续的消费次数及人次下跌至2000左右。

2.根据二八法则,50%的用户仅贡献了15%的消费额度,而消费金额前5000名用户贡献了60%消费额度,同时根据用户购买次数,平均购买7张CD,而中位数只有3,说明小部分用户购买大量的CD,符合上述二八法则的分析。

3.根据用户首次购买、最后购买及新老客占比分析,绝大部分用户购买在前三个月,且购买一次就不再进行购买,这部分客户占50%(符合2的50%用户仅贡献15%消费额度)。

4.根据每月新用户占比分析,3至4月的新用户占比由90%跌落80%,后几个月新用户量保持在80%到82%区间,1998年6月后再无新用户,前三个月新用户平均8000人左右,后续新用户在1000至1500人波动。

5.根据用户分层-RFM分析,重要价值客户的消费金额高,但近期消费下降,大部分为重要保持客户。

6.按用户购买时间分析,用户平均购买周期68天,绝大部分用户购买周期都低于100天。

7.根据复购率和回购率分析,复购率稳定在20%左右,回购率稳定在30%左右。

你可能感兴趣的:(Python数据分析经典项目 -------CD消费用户行为分析)