黑五数据——基于Excel分析

大数据分析已经迅速成为数据驱动业务的一个组成部分,并在使品牌和企业更容易在用户运营中发挥重要作用。企业建立的内容传播和推广活动受到来自各种渠道的影响越来越大,尤其是关于其受众、其用户的在线行为和个人喜好的数据洞察。本文尝试我从kaggle大数据平台上下载了Black Friday的销售数据,对其进行分析,以挖掘出对该电商企业制定促销策略有价值的信息。

一、电商数据分析指标及数据分析方法
1.电商数据分析指标在知乎上找到了一篇详细的文章,想借此引用猕猴桃电商数据分析指标总结
2.数据分析方法也同样引用猕猴桃常用数据分析方法及模型
具体自我总结等学完python,再总结《数据化管理》。
二、业务理解并提出问题

黑五数据——基于Excel分析_第1张图片
image.png

前期思考借用了 猪可飞大佬的一些思考,基于框架提出问题,
(1)根据消费者的性别比例、年龄分布、职业分布、所在城市居住时间分布和婚姻状况,商家该怎样针对顾客发促销广告
(2)销售额最高的产品类别和产品是什么?销量最高的产品类别和产品是什么?
(3)各城市的产品销售额和销量是怎样的?
(4)找出销售数量最高的TOP10商品,来分析最受欢迎的商品有什么特点?
(5)不同居住年数的购物习惯是怎样的?
二、这次数据集中的数据量共计有657677条。一共包含了12个字段,如下:
User_ID:用户编码
Product_ID:产品编码
Gender:性别(F-女性,M-男性)
Age:年龄(分为7个年龄段:0 17、1825、26 35、3645、46 50、5155、55+)
Occupation:职业(分为21个类别:0-20)
City_Category:城市类别(分为3个类别:A、B、C)
Stay_In_Current_City_Years:在当前城市的居住年数(分为5个类别:0、1、2、3、4+)
Marital_Status:婚姻状况(0-未婚,1-已婚)
Product_Category_1:商品所属分类1,不可为空
Product_Category_2:商品所属分类2
Product_Category_3:商品所属分类3
Purchase:购买金额(美元)
三、数据清洗
1-列名重命名
image.png

2-选择子集
根据要分析的问题,将不会用到的列进行隐藏。可以将商品所属分类2还有商品所属分类3进行隐藏。
3-删除重复值
(1)在分析有关销售金额时,由于同一个用户可以买不同的产品,同一个产品可以被不同的用户购买,所以用户对应的唯一值——用户编码,和产品对应的唯一值——产品编码都不能作为本表的唯一列去判断是否有重复项,新建一个辅助列,将用户编号和产品编号放在一起,去判断购买信息是否有重复列。
选择整个区域——数据-删除重复值——取消全选——选择辅助列——确定。结果显示未发现重复值。
(2)在分析消费者时,由于同一个用户可以买不同的产品,所以应检查用户编号是否有重复,删除重复值。
黑五数据——基于Excel分析_第2张图片
image.png

4-缺失值处理
分析需要用到的列无缺失值,计数均为537578。
5-一致化处理
为了方便分析和阅读,将表中性别那一列中的F全部替换为女,M全部替换为男。将表中婚姻那一列中的替换“0”为“未婚”,“1”为“已婚”。
6-数据排序
对该数据检查,该数据集默认以用户ID从小到大排序,其他分析需要用到的列无需特定排序,因此未进行数据重新排序。
7-异常值处理
对该数据检查,分析需要用到的列均无异常值,无需异常值处理。
四、数据分析
1、通过数据透视表找出消费者的性别比例、年龄分布、职业分布、所在城市居住时间分布和婚姻状况。
(1)消费者的性别比例
image.png

从性别看,消费者中大部分为男性,男性人数是女性人数的两倍多。
(2)消费者的年龄分布
黑五数据——基于Excel分析_第3张图片
image.png

从年龄看,消费者的年龄集中在18岁至45岁,以中青年为主。在七个年龄分段中, 26岁至35岁的消费者为购买该产品的主力,大约占全部购买该产品类别的消费者的40%。
(3)消费者的职业分布
黑五数据——基于Excel分析_第4张图片
image.png

从职业看,消费者从事职业4、职业0和职业7的人数较多,分别占全部消费者的12.56%,11.68%和11.36%。其他职业占比均低于10%。
(4)消费者的所在城市居住时间分布
黑五数据——基于Excel分析_第5张图片
image.png

从消费者所在城市居住时间看,居住时间满一年且不足两年的消费者为“黑五”消费的主力军,占全部消费者的35.41%。
(5)消费者的婚姻状况
image.png

从消费者的婚姻状况看,未婚消费者占全部消费者的58.00%,接近六成。
通过对消费者的性别、年龄、职业、所在城市居住时间、婚姻状况这5个角度分析得出,从黑五中的消费者性别分析得出71.72%为男性,23.21%为女性。消费者主力的年龄范围在26-35岁这个范围,处在这个年龄段的消费者大都数已经工作了,能够经济独立了,其次是36-45岁和18-25岁之间的消费团体。从消费者的职业分析,职位是4,0,7的消费者的消费金额都在10%以上,可以判断从事这几个行业的收入应该不错。
在商品分类1对客户属性分析
性别
黑五数据——基于Excel分析_第6张图片
image.png

年龄
黑五数据——基于Excel分析_第7张图片
image.png

职业分布
黑五数据——基于Excel分析_第8张图片
image.png
由于职业太多,只选取了消费金额排名前15的职业
城市
黑五数据——基于Excel分析_第9张图片
image.png

居住年数
黑五数据——基于Excel分析_第10张图片
image.png

婚姻
黑五数据——基于Excel分析_第11张图片
image.png

通过消费者性别、年龄、居住年数、婚姻以及职业和产品购买金额之间的百分百排名,发现商品分类1中的第1、5、8这三种类型的产品的购买金额都在总体购买金额的10%以上,说明这3类产品的需求量很大。其中第1类产品一直销售金额排名第一,而第5、8这两类产品由于消费者的年龄和职业不同,排名会发生变化。商家可以好好开拓这3类产品,为消费者提供更好的商品。同时有些销量特别低的产品类目,商家可以根据自己的需求决定是否还需要保留。
2、通过数据透视表找出销售额最高的产品类别和产品,以及销量最高的产品类别和产品。
(1)销售额最高的产品类别
黑五数据——基于Excel分析_第12张图片
image.png

从上图可以看出,销售额最高的是产品类别1,销售额为1,882,666,325美元。
(2)销售额最高的产品
黑五数据——基于Excel分析_第13张图片
image.png

从上图可以看出,销售额最高的产品是P00025442,销售额为27,532,426美元。
(3)销量最高的产品类别
黑五数据——基于Excel分析_第14张图片
image.png

从上图可以看出,销量最高的是产品类别5,销量为148,592。
(4)销量最高的产品
黑五数据——基于Excel分析_第15张图片
image.png

从上图可以看出,销量最高的产品是P00265242,销量为1,858。
3、通过数据透视表找出各城市的产品销售额和销量。
(1)各城市的产品销售额
黑五数据——基于Excel分析_第16张图片
image.png

从上图可以看出,销售额最高的为城市B,销售额为2,083,431,612美元;其次为城市C,销售额为1,638,567,969美元;最后为城市A,销售额为1,295,668,797美元。
(2)各城市的产品销量
黑五数据——基于Excel分析_第17张图片
image.png

从上图可以看出,销量最高的为城市B,销量为226,493;其次为城市C,销量为166,446;最后为城市A,销量为144,638。
4、找出销售数量最高的TOP10商品,来分析最受欢迎的商品有什么特点?
根据产品编号,购买金额两个字段绘制出数据透视表,然后根据数据透视表制作如下的表格。
黑五数据——基于Excel分析_第18张图片
image.png

从中可以看出购买金额排前10的产品,其中有7个都在产品所属分类1中的第一个档次中,这10中产品在总的购买金额中都占了0.44%以上。商家可以根据这几类产品分析推出更加符合消费者偏好的产品,也可以根据这些产品找出和它们相关联的产品。
5、不同居住年数的购物习惯是怎样的?
黑五数据——基于Excel分析_第19张图片
image.png

黑五数据——基于Excel分析_第20张图片
image.png

根据消费者的居住年数与购买金额的百分百得出,消费主力为居住年数是1年的人,这类人往往大多数可能是居住稳定了,可以购买自己想要的东西了。消费金额最少的是居住年数为0的,这可能是才到这个城市几个月,只购买自己的必需品。
根据消费者居住年数和产品类别的分析得出,1、5、8这三类产品仍然是热销品,可能是和生活衣食住行息息相关的产品。后期商家可以根据不同居住年数,推荐不同的商品。比如居住1年的,可以推荐 家居品,比如洗衣机等;居住2年以上的可以推荐儿童用品等等。
五:结论
通过数据分析可得:商家应把主要精力放在1、5、8这三类商品上面,优化提供更多好的商品,可以真的居住年数在一年以上两年以上的,年龄在26-35,以及职位是4,0,7的这些顾客上进行精准营销,提高企业营业收入增长。
注意:1.
黑五数据——基于Excel分析_第21张图片
image.png

黑五数据——基于Excel分析_第22张图片
image.png

注意透视表计数项和求和项之间的不同
2. 数据透视表占比的使用方法
3.注意数据删除重复值

你可能感兴趣的:(黑五数据——基于Excel分析)