项目模拟:
boss说:你给我分析最近店铺的销售情况,以及如何提升.
然后发给我一份销售表
此时就需要数据分析师来完成boss提出的需求了.
根据数据分析流程:数据分析流程-CSDN博客逐步完成即可.
1. 分析目的
很明显,boss所提的需求太泛化,此时就需要剖解需求,细分需求.
对于问题:最近店铺的销售情况
结合给的销售表,可将问题分解为多个维度:时间,空间,其他
时间维度与销售额,销量的关系
空间维度与销售额,销量的关系
其他维度:邮费与销售额关系
而对问题:如何提升
如何提升应该是在第 6.结果应用 中提出,此处只需要知道分析需要什么条件,结合销售表可以从两个方面:内部的店铺和外部的客户
对于店铺内部,需要销售情况的分析结果
对外部的客户,需要知道哪些客户是要重点挽留,哪些客户是不需要关注的无价值客户,此时需要使用FRM模型分析客户
2. 数据获取
针对分析目的确定需要的数据,内部数据可以去公司相关的部门或者领导沟通获得,外部数据可以去各种机构网站获得.
3. 数据处理
获得数据后,先要备份好数据:右键 sheet1 ,点击 移动或复制,在弹出框勾选 建立副本 点击确定即可:
之后按照数据处理的步骤进行:
①选择子集:
审视已有的数据,按需保留数据列,此表所有数据均可保留.
②列名重命名:
处理需要重命名的列名,此表列名正常,不需要重命名.
③删除重复值:
按需删除不需要的重复值以达到唯一性
④处理缺失值:
首先计算出每列的缺失值有多少.
输入:=COUNTIF(L1:L28834,"") 计算出L列的空值个数,再向左填充即可求出全表每列的空值个数:
计算出空值个数后审视数据找出为什么是空值,通过观察可得空值是因为用户下单后退款,导致没有发货,所以发货时间为空,这些数据可以用来计算退款率,但此次项目就不纳入计算了,可以直接删除退款成功的行.但要注意不能直接删除空值,因为可能存在空值不是因为退款产生的,所以此处应该查找G列中退款成功项再删除.
操作为:选中G列,查找值为:"付款以后用户退款成功,交易自动关闭"替换为"" 点击 全部替换后 按Win+G 定位选择空值项:
→
再 右键 选中的第一个空值,点击删除,再 勾选 整行即可:
→
此时再次查看计算的空值:
发现城市列存在空值.
操作为:再次选中该列,按Win+G 定位选择空值项,找到后发现该值为空,看起来有值是因为前面一项太长覆盖了,因为该值不影响分析,所以只需让其不为空即可,可将省份复制过来:
→
再次检查计算的空值行,发现已经没有空值.
⑤一致化处理:
有的数据列的数据值标准不一致,此表无.要修改为一致,可以使用分列功能实现.
⑥异常值处理:
删除异常值,此表无异常值.可以点击数据-筛选 点击第一列的倒三角查看有无明显异常的值:
此时数据清洗完成,得到干净数据
4. 分析数据
根据第一步得出的目的来对数据进行分析
先分析客户(此处注意,如果RFM有参考值,可以先分析客户再做其他分析,会更方便快速,但如果没有参考值,需要先做其他分析得出参考值再分析客户),使用数据分析模型数据分析常用模型-CSDN博客的FRM模型进行分析:
首先对三个参数给定参考值:
- 最近一次购买(Recency):30天:30天内为1,否则为0
- 总购买频率(Frequency):2次:大于等于两次为1,否则为0
- 购买金额(Monetary):200元:大于等于200元为1,否则为0
然后数据透视:目的是方便分析.
审视需要哪些数据并整理提取到新增表数据透视,此处:
再新增表用户标签,根据RFM三个参数给用户打标签.
首先在数据透视中取出唯一买家昵称放入用户标签中
公式为:=UNIQUE(数据透视!$A$2:$A$27794,TRUE,TRUE)
然后依次计算
最近一次购买:=MAXIFS(数据透视!B2:$B$27794,数据透视!A2:$A$27794,A3#)
总购买次数:=COUNTIF(数据透视!A2:$A$27794,A3)
购买金额:=SUMIF(数据透视!$A$2:$A$27794,A3,数据透视!$C$2:$C$27794)
然后根据这三列的值判断用户性质并打标签,此处空出第一行是为了判断RFM值时更加方便.添加三列辅助列用于存放RFM的值:
然后依次判断是否符合参考值,是则标记为1,否则标记为0
R:=IF(DATEDIF(B3,$A$1,"MD")<=30,1,0)
F:=IF(C3>=2,1,0)
M:=IF(D3>=200,1,0)
然后根据打上的标签判断该用户应该为什么样的用户,先拼接标签再判断:
拼接标签:=CONCATENATE(E3,F3,G3)
判断客户种类:=IFS(H3="111","重要价值客户",H3="101","重要发展客户",H3="011","重要保持客户",H3="001","重要挽留客户",H3="110","一般价值客户",H3="100","一般发展客户",H3="010","一般保持客户",H3="000","一般挽留客户")
到此客户分类完成
再新建表数据透视表进行分析.建立数据透视表方法:
时间维度与销售额,销量的关系
客户种类计数
空间维度与销售额,销量的关系;其他维度:邮费和销售额的关系
;
5. 数据可视化
将分析得到的结果(数据透视表)利用可视化手段(如图表和报告)呈现,使决策者能方便且快速理解。
6. 结果应用
结果可以输出为Word文档,或者按boss的要求,此处就不做文档了
分析结果:根据得到的数据透视图和结合实际业务分析
- 根据月度表,2018年2月销售额和销量很低,此处是因为在春节前后,大部分快递服务暂停了.
- 根据月度表,销售额和销量的整体走势在下降,要查看相关业务具体调整.
- 根据地区销售额与销量表,可以看出有几个地区销售得很好,占比很高,可以重点关注.
- 根据地区邮费与销售额表,可以看出有存在高销售额地区得邮费也很高,可以通过其他方式降低该地区邮费从而提高销售额.
- 根据客户类别表,能看出总体客户类别占比,且根据用户标签表格针对不同类别客户实施不同指标.
至此分析结束,将上述分析结果做成文档发送给boss即可
(PS:此片文章由个人总结,如有错误欢迎指正)