Python数据分析报告

业务背景:B2B业务已收会员和服务费作为收益主要来源,目前会员类型分成钻石会员、金牌会员,销售合同一般会包含会员服务、增值服务、广告服务等等,销售过程可能会受到销售策略的影响,做一些业务的促销优惠或者折扣。每年的订单含新客户签约和老客户续约两种,同时合同期间也会出现服务加购或者变更的问题。
问题研究:自今年以来整体收益有明显提升,高级会员量也持续增加,钻石会员量相比去年同期也翻倍上涨,钻石会员回款额也在持续上升,钻石会员的金额远高于金牌会员,但整体均单额却相比去年同期没有显著增长,请根据所提供数据分析具体原因,并给出分析过程。


编程语言:Python
IDE:Jupyter Notebook
注:这是我之前校招参加XX科技公司的数据分析笔试题,分享一下自己的做题经历,如果需要代码的后台私聊我哈
数据分析报告
一、数据清洗
1、异常值 筛选出合同签订日期大于当前日期(2020-09-16)的异常数据,如图
这些数据我认为属于异常数据,将他们剔除,同时对于数据中的合同状态,我在 本次分析过程中只保留了合同状态为正式合同的数据,剔除合同状态为作废、草拟、待审核、审核未通过、客户待确认等数据,因此过滤得到 45783 样本数据;
Python数据分析报告_第1张图片
2、缺失字段
Python数据分析报告_第2张图片
经过检验,含有大量缺失数据(缺失比例超过 30%)的字段如图所示,由于 有的字段缺失是因为业务原因,属于正常情况,如会员产品开始日期、结束日期、 服务日期等,所以对于这种字段缺失问题无需处理,同时对于其他缺失比例较大 的字段,由于在本次的分析过程并未使用,因此这里就不做处理。对于缺失比例 较小的字段则可以采用众数填充
二、验证数据正确性
此处略
三、异常原因分析
1、分析结构
Python数据分析报告_第3张图片1.1、用户群体对比分析
Python数据分析报告_第4张图片
上面三幅图表明 2020 年新老用户数量均要高于 2019 年,表明公司的拉新和 留存做的比较好;
Python数据分析报告_第5张图片
Python数据分析报告_第6张图片
从这三幅图中,可以发现 2020 年新签、续约以及加购类型均要高于 2019 年, 尤其是加购类型,2020 年加购类型的数量要远远高于 2019 年,这表明 2020 年 有一大部分客户对于会员产品都持有观望谨慎的态度,尤其是对于新客户而言, 他们中大多数可能是被折扣和优惠金额所吸引,因而他们大都不敢购买会员产品, 因而存在会员产品购买转化率低的问题。而加购合同的平均金额是要低于续约合 同的平均金额的,这应该是 2020 年合同的单均额较去年没有显著上涨的原因之 一;
1.2、变更客户类型分析:
Python数据分析报告_第7张图片对比上面两幅图,说明相比于 2019 年,2020 年加购合同的变更率更高,而 续约合同的变更率更低,意味着客户对我们的会员产品的满意度在降低,高价值 合同(购买会员产品)客户在流失!
1.3、客户合同类型分析:
Python数据分析报告_第8张图片
根据这两幅图,说明对于新签合同下,2020 年的新用户比 2019 年新用户有 所增加,由于这部分新用户的增加,很大程度是被巨大的优惠政策和折扣吸引过 来,那因为这部分新用户的加入,总金额会增长,但是单均额就未必会增长,需要近一步观察用户转化情况,如下图
Python数据分析报告_第9张图片
可从这两幅图对比发现,2020 年在选择加购合同下的老用户的人数远远超过 2019 年的人数,具体表现在老客户更多的是选择了没有会员产品的或者是会员 产品小于 12 个月的,即这部分客户对我们的会员产品质量、服务等方面持有观 望态度,说明公司的会员产品购买的转化率较低;
Python数据分析报告_第10张图片
对比上面三幅图,可以明显发现对于 2020 年,新客户的折扣金额要远远超 过 2019 年的折扣金额,这就解释了为什么 2020 年新客户的数量较去年显著增 加,但是对于这部分的新客户的单均额却没有显著增长,因为这部分新客户大都 被巨大的折扣优惠所吸引;同时加购类型用户也是所有类型客户中折扣金额最低 的客户群;这意味着我们着重关注了新老客户的购买优惠,而对于这种中间类型 的客户也是需要给予适当的优惠,以提高他们对会员产品的购买意愿;
1.4、时间角度分析:
Python数据分析报告_第11张图片
从时间维度来看,发现在每年的 6 月合同的实际收款金额都会呈现骤降的现 象,而且在 2019 年 12 月的时候也是发生了合同实际收款金额骤降的问题;由于 当前数据时间跨度较短以及涉及的业务知识有限,无法确定这是否是一个正常的 周期现象,不过对于这种骤然下跌,需要和运营沟通,进一步的分析原因找出潜在的问题。
2、指标拆解:
单均额=∑合同总额/有效合同个数=∑(合同总价−优惠券抵扣金额−折扣金额)/正式合同个数
Python数据分析报告_第12张图片
Python数据分析报告_第13张图片

从上面两幅图可以看出,尽管2020年的合同总额要超过2019年,但是2020 年的合同的个数确实要远远高于 2019 年的,这说明 2020 年存在很多不包含会 员产品的合同,而这些合同他们的金额一般比较低,因此随着合同数量上升了, 即总金额上升了,但是单均额却有所下降;
Python数据分析报告_第14张图片
这幅图也是验证了我们刚才的想法,尽管 2020 年的正式合同的数量增多, 但是大部分的正式合同都不包含会员产品,意味着客户对我们提供的会员产品的服务/质量不是很满意;

3.原因分析:
由于篇幅原因,此部分省略
四、结论:
看到这么的分析,想必大家对结论应该很清晰了吧,大家可以尝试自己总结一下看看~

代码截图
由于分析代码太长,这里放不下,需要的话,可以后台私戳我~
Python数据分析报告_第15张图片
Python数据分析报告_第16张图片

如果觉得这篇分析报告有用的话,欢迎大家点赞+收藏,如果有其他需求的话,也可以后台私戳我,我看到会回复大家的!
【未经本人许可,禁止转载】

你可能感兴趣的:(python,进阶,数据分析,数据挖掘,python,jupyter,sklearn)