数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析...

一、分析背景

近年来,随着新零售业的快速发展,消费者购买商品时有了更多的对比和选择,导致超市行业的竞争日益激烈,利润空间不断压缩。超市的经营管理产生了大量数据,对这些数据进行分析,可以提升超市的竞争力,为超市的运营及经营策略调整提供重要依据。

本文数据来自2019 年“泰迪杯”数据分析职业技能大赛,数据集下载链接如下:

2019A8669.zip - 蓝奏云

二、分析目标

  • 对销售数据进行统计分析,并作可视化展示。
  • 分析顾客的消费行为。
  • 研究促销对销售的影响。

三、分析思路

将数据清洗之后可视化,然后根据可视化的图表找出业务问题并提出解决方案。

本文是将2019 年“泰迪杯”数据分析职业技能大赛的题目用Excle实现一遍,并形成数据分析报告。

四、数据清洗

清洗之前,首先将下载的csv数据复制一份到新的xls文件中,并将该sheet命名为源数据,这份源数据后面就不做改动了。接着将原csv文件关闭,把源数据sheet再复制一份到sheet2中,并将sheet2命名为清洗数据,本次数据分析中的所有数据清洗步骤都将在清洗数据sheet中完成。

4.1选择子集

将sheet2分析中暂用不到的数据进行隐藏,这里我选择了三类编码、销售月份、商品编码以及单位这6列数据。因为有了销售日期,所以销售月份可不用,三类编码和其他两项本次分析暂用不到。

4.2列名重命名

源数据命名都是中文很好理解,所以不用重命名

4.3删除重复值

由于是超市的销售数据,重复数据说明是用户多次购买,所以不能删除重复值,跳过这一步骤。

4.4缺失值处理

首先使用Ctrl+A全选数据然后使用Excle中的快捷键Ctrl+G来定位缺失值,由于本数据集数据较多,缺失值较少,只有个别缺失值,所以将缺失值所在行删除,对数据分析结果没有影响。

4.5一致化处理

清洗数据sheet中的销售日期不是日期格式,所以要使用Excle中的分列功能将销售日期设置为YMD日期格式。

4.6异常值处理

①日期异常

这里异常值比较难找,选中刚刚处理好的销售日期列,筛选之后发现还有两行日期显示为20150229的数据,这里我设置了很久,怎么都变不成规范的日期格式,后来恍然大悟,2015年的2月没有29日,于是这里算是异常值,所以手动将20150229改为20190228即可。

②数据异常

1)在规格型号列的数据筛选时发现,有大量缺失值,按理说该将其删去,但是看左边的小类名称发现可以根据其他完好的数据对其进行补充完整,所以这里算作了异常值处理。

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第1张图片
图4.1补充缺失值演示图

2)在筛选销售金额数据时发现销售数量有负值存在,于是查看了一下销售金额果然也有负值,这里是属于异常值,并且经过计算发现值只是负数但是数值本身还是正确的。所以将两列的负值筛选出来调正即可。

五、数据分析

5.1统计每个大类商品的销售金额

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第2张图片
图5.1各大类商品销售金额分布图
据图5.1可知,各大类商品销售金额最多的是日配大类,销售金额达到82396.2元,而销售金额最低的是烘焙大类,销售金额仅为110.9元。

5.2统计每个中类商品的促销销售金额和非促销销售金额

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第3张图片
图5.2.1各中类商品促销销售金额分布图

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第4张图片
5.2.2各中类商品非促销销售金额分布图

这里由于分类数据过多柱状图不易观察,我又制作了各中类商品的促销销售金额和非促销销售金额的前十排行分布图。

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第5张图片
图5.2.3各中类商品促销销售金额前十分布图

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第6张图片
图5.2.4各中类商品非促销销售金额前十分布图
据图5.2.1至图5.2.4可知,与想象中不同的是,非促销商品销售金额反而更高。在非促销中类商品前十排行中,水果、蔬菜和猪肉占据了半壁江山,而这些都是人民日常生活所必备的商品。所以可得出结论是否促销对生活必需品的销售金额没有影响。

5.3统计生鲜类产品和一般产品的每周销售金额

首先使用Excle中的roundup函数和datedif函数将日期转成对应的第几周,然后使用Excle中的分类汇总功能将销售金额按周分类汇总

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第7张图片
图5.3.1生鲜类产品每周销售额变化趋势图

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第8张图片
图5.3.2一般类产品每周销售额变化趋势图
据图5.3.1和图5.3.2可知,一般类产品销售额总体高于生鲜类产品销售额,但是一般类产品销售额在第7周有较大的下滑,生鲜产品销售额相对来说较为稳定。第17周到第18周两类商品销售额都大幅度下滑,达到数据的最低点。

5.4统计每位顾客每月的消费额及消费次数

由于数据较多不方便展示,此处两个数据均统计4月总计消费金额前20的顾客和总计消费次数前20的顾客。

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第9张图片
图5.4.1每位顾客每月消费金额

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第10张图片
图5.4.2每位顾客每月消费次数

5.5绘制生鲜类商品和一般商品每天销售金额的折线图,并分析比较两类产品的销售状况

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第11张图片
图5.5生鲜类商品和一般商品销售金额折线图

据图5.5可知,一般商品每日销售金额基本都高于生鲜类商品。一般商品销售金额在2月2日至2月19日期间有剧烈波动,生鲜商品每日销售金额较为稳定。

5.6按月绘制各大类商品销售金额的占比饼图,并分析其销售状况

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第12张图片
图5.6.1一月各大类商品销售金额占比饼图

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第13张图片
图5.6.2二月各大类商品销售金额占比饼图

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第14张图片
图5.6.3三月各大类商品销售金额占比饼图

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第15张图片
图5.6.4四月各大类商品销售金额占比饼图

5.7绘制促销商品和非促销商品销售金额的周环比增长率柱状图

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第16张图片
图5.7促销商品和非促销商品销售金额的周环比增长率
据图5.7可知,前7周促销商品环比增长率高于非促销商品,第8周两种商品全部销售金额下滑严重导致环比增长率大幅度降低,其中促销商品环比增长率降低至-400%。第9周至第16周促销商品环比增长率总体还是高于非促销商品。第17周两种商品环比增长率再次下降。

5.8分析各大类商品的销售情况,总结其销售规律

数据增长率怎么算_2019 年“泰迪杯”数据分析职业技能大赛A题 超市销售数据分析..._第17张图片
图5.8各大类商品月销售金额对比图
据图5.8可知,大类商品多数销售金额波动较小,其中家居、熟食、针织、水产、问题、家电、烘焙类商品几乎没有波动,每月销售金额非常稳定。可知用户对这几类商品需求频率较低。另外2月份是春节的月份,所以用户需要买酒饮过节或送礼导致2月份销售金额大幅上升。

六、总结

你可能感兴趣的:(数据增长率怎么算)