制定数据分析项目计划

你好,我是Ericsome。我正在参加一个数据分析课程,以下是我数据分析项目计划制定的作业,分享给你,欢迎与我交流。

背景知识
百联集团拥有购物中心,商超,综合百货等核心业务,遍布全国25个省市7100余家营业网点,涵盖了国际商贸流通集团现有的各种业态,如百货,标准超市,大卖场,便利店,购物中心,品牌折扣店等。

在目前中国商品零售总额增速趋缓,而网络零售占比不断上升的今天,百联集团也面临着巨大的竞争压力。以线下为主的经营模式,在物业和人力成本不断增长的今天,对于单店营业额的要求越来越高。对线下客户缺乏感知,缺乏良好的客户体系,使得高净值客户失联。在这背后,是底层缺少对客户的数字化沉淀,无法进行客户价值挖掘,会员运营方式单一。消费者的理解停留在消费结果上,对商品选择历史,消费动机等缺乏认知手段。

为了能够线上线下融合,提高单店绩效,同时实现精准营销个性化服务,提升顾客粘性,百联集团于2015年成立了全渠道电子商务公司,初步建立了会员一体,营销一体的线上数据中台体系。加上对店内智能wifi,智能货架,以及各种智能摄像头的应用,对于人,货,场等三个方面的数据有了全链路的关联。

目前主要数据举例:

目前百联会员体系已经联通了旗下所有零售业态,百联对于优选会员会定期发放优惠券和其他激励措施,鼓励在各商场进行消费。

作业:基于现有数据体系,请给出完整的数据分析项目计划(包含重点数据收集到分析方法等),以论证对会员体系的投入是对百联业务发展有积极作用的。

分析思路:

1.要论证会员体系的投入是对百联业务发展有积极作用,需要基于对业务的理解确定重点关注数据,也就是企业认为对百联业务发展有积极作用的指标;
2.通过这些指标在实施会员体系前后的变化来证明会员体系的投入促进了业务发展;
3.还需要考虑定期发放优惠券和其他激励措施的成本,从中得到投入与产出之间的回归模型,用于之后发放优惠券的参考;
4.通过聚类分析发现定期发放优惠券效果较好的门店特征,好门店的做法可以推广到其他门店。

界定业务问题:

WHAT
1.实施会员体系前后,营业额、毛利润和人均消费是多少;
2.实施会员体系后,会员为营业额和毛利润贡献百分比是多少;
3.会员体系的投入与产出之间存在什么样的数量关系。

HOW
通过对门店的分析,发现会员体系投入产出效果好的门店,分析总结经验推广到其它门店。
1.定义会员体系投入产出效果好的门店,从流量、转化、粘性和商品数据数据中识别具体特征;
2.从数据中找门店针对性需要提高的方向,并进行实施,跟踪实施后的情况。

数据收集:

分析单位为门店
1.收集不同门店不同时间的营业额、毛利润和人均消费;
2.收集不同门店不同时间会员用户消费额以及产生的毛利润;
3.收集投入会员体系后,不同门店发放优惠券总面值和使用的优惠券总面值;
4.收集投入会员体系后,不同门店使用的优惠券总面值和使用优惠券的交易的毛利润;
5.收集投入会员体系后,不同门店每天进店人数、在店停留时长、密度分布、商圈到进店转化率、门店到不同区域停留转化率、不同区域停留到支付转化率、用户留存率、到店间隔、品类区域集客到货架停留转化率、货架停留到商品触达转化率、商品触达到交易转化率。

评估整体数据状况

1.评估各个数据源的完整和及时:客户数量应当与实际接近数量差别较大时,则需要检查数据库;数据来源的时间要符合会员体系投入前后至少一年的数据,不然难以得出有效结论;
2.评估汇总数据的准确性和一致性:随机检查抽取的数据是否与数据库中一致,保证数据准确。

数据清洗和整理

1.检查是否有数据有明显违背常识的错误和数据的离群值,发现后,先检查同一客户原表是否是同样的数值,再检查此数据是如何收集而来,最后才是如何从技术角度评估是否是离群,通过相关统计指标和诸如设定上下限的方法来处理离群值;
2.对于特殊数字,先标注“缺失值”,有完善的数据字典查询这个字段的实际情况,如果没有就去和相关团队沟通证实此类问题。

数据整理

1.对数据进行统一的格式化和命名规则处理;
2.对某些信息进行重新编码以满足后续分析需求。

数据可视化与探索

1.用直方图展现会员体系前后,营业额、毛利润和人均消费是多少,横轴表示时间,纵轴表示对应的金额;
2.用饼图展现会员体系后,会员为营业额和毛利润贡献百分比是多少;
3.用散点图展现同一门店不同时间发放优惠券总面值和使用的优惠券总面值;
4.用散点图展现同一门店不同时间使用的优惠券总面值和使用优惠券的交易的毛利润;
5.热力图展现不同门店使用的优惠券总面值和使用优惠券的交易的毛利润,横轴为门店使用的优惠券总面值,纵轴为使用优惠券的交易的毛利润。

数据分析与模型

1.聚类分析:根据门店数据,会用聚类分析,将会员体系投入产出效果好的门店合成门店集,确定会员体系投入产出效果好的门店特征;
2.回归模型:通过计算不同门店发放优惠券总面值和使用优惠券的交易毛利润的回归方程,确定使用的优惠券总面值与使用优惠券的交易毛利润之间的线性关系,以此为依据来反推优惠券发放计划的规模。

你可能感兴趣的:(制定数据分析项目计划)