数据分析项目实战之淘宝女装店铺销售分析(二)excel数据分析篇

淘宝的XX店铺女装信息已经都放到数据库里了,这篇主要是记录一下把得到的数据合理整合分析。

读完本文可以了解到:

  • 店铺的的销售额在哪个价位相对稳定的,如果有不稳定的有改进的方式吗?
  • 不同商品的价格区间的销售情况,提高那个价位的销量能更快提升销售额?
  • 线上价位热销是否受爆款影响?

使用数据的大小是1126*5

数据属性包括 衣服名称,现价,原价,销量,评论数 

 数据分析项目实战之淘宝女装店铺销售分析(二)excel数据分析篇_第1张图片

 

一  :数据导出:

先对提取数据,把数据库里的数据全部提取出来放入excel中,先查看数据的存储位置是否设定好了 :

mysql> show global variables like '%secure_file_priv%';
+------------------+-------+
| Variable_name    | Value |
+------------------+-------+
| secure_file_priv | NULL  |
+------------------+-------+
1 row in set (0.00 sec)

如果是上图那样情况,首先给数据库配置放文件的位置可以找到数据库的配置文件my.ini,用记事本打开文件在文件的末尾添加:[mysqld]
secure_file_priv=""

添加完毕之后保存,打开数据库,这时候就可以给文件放到任意位置了。进入数据所在的数据库输入“select * into outfile  "文件存放的位置" from  数据库表名”。

二:数据清洗与准备:

拿到导出的数据之后给数据先去重:选中衣服名称,在工具栏里搜索删除重复项然后把重复的所在行删除

数据分析项目实战之淘宝女装店铺销售分析(二)excel数据分析篇_第2张图片

删除重复项之后检查一下数据的数据类型(type函数),看是否符合自己的要求,浏览一遍看是否存在空值(ctrl+键盘方向下键)。

三:数据分析:

首先来看一下这家店铺女装的价格阶段与销售额百分比以及销量百分比之间的关系:

用if函数把现价进行分类,我分成了5类,价格分别是 0-10,10-20,20-30,30-40,40-50,50-60,因为整个价格最大值就在50-60,所以最大区间就是50-60这个范围。然后计算销售额百分比以及销量百分比。在这里之前要先给这个表格自定义下一排序方式,这样生成的透视表机会按照自定义的方式去排序。

数据分析项目实战之淘宝女装店铺销售分析(二)excel数据分析篇_第3张图片

数据分析项目实战之淘宝女装店铺销售分析(二)excel数据分析篇_第4张图片

对数据插入数据透视表:

数据分析项目实战之淘宝女装店铺销售分析(二)excel数据分析篇_第5张图片

 

把价格分段作为行,销量占比和销售额占比作为值。从图中数据来看,价格区间在20-30的销量占了总销量的几乎二分之一,消费额占比也是最高37.57%,相比之下价格区间在30-40的销量占据总销量三分之一排行第二,但是消费额占比跟价格区间在20-30的几乎一样多,拉高消费额可以考虑通过各种途径提高30-40商品的销量。但是仅仅知道要提高这一块的销量但是还需要知道具体是在哪一种衣服种类上进行提高达到的效果最优。

数据分析项目实战之淘宝女装店铺销售分析(二)excel数据分析篇_第6张图片

 

然而再把商品进行简单的分类,分为背心,衬衫,短袖,裤子,两件套,其他。

商品分类后插入透视表按照商品的类别进行分组,值为销量占比和销售额占比。

数据分析项目实战之淘宝女装店铺销售分析(二)excel数据分析篇_第7张图片

同等商品中销量和消费额基本是持平的,差别最大的也就背心的销量占比大于消费额占比,相比同等销量的衬衫背心的销量占比低了衬衫消费额占比的三分之一左右。由于没有成本做支撑不能确定盈利最大的销售方向,但是可以基本归纳出销售额最大的营销方向。从图中看出短袖的销量占比还是相当高的占据整个销量的三分之一,销售额的占比基本与销量占比持平 ,但是裤子的销量占比要低于销售额三个百分点左右,其他类型的包括连衣裙帽子短裤之类的销量和销售额都占比了近三分之一。

下面再来看一下各类商品的价格状况:

数据分析项目实战之淘宝女装店铺销售分析(二)excel数据分析篇_第8张图片

上图是各类商品再不同价格区域内的销量状况以及销售额状况,背心的销售主要集中在10-20价格区间,衬衫的价格而区间主要集中在20-30,30-40区间,短袖的销售情况主要集中在20-30这个区间,30-40区间内也占了一部分。裤子的销售主要是30-40的区域,并且销售额占比百分之十,比销量占比要高一些可以考虑加大裤子的促销力度提升30-40价格区间的销售额来提高总体的销售额。继续看,两件套的销量占比比较小,销售额占比也相对比较小才占比百分之二左右。对与其他一些衣服来说总体价格区间在30-40,也可以针对性的提高一些销量。

数据分析项目实战之淘宝女装店铺销售分析(二)excel数据分析篇_第9张图片

 上图的饼图是销量占比,看起来更加直观一些。接下来再来看一下商品的销售是否受爆款影响:

数据分析项目实战之淘宝女装店铺销售分析(二)excel数据分析篇_第10张图片

图中很明显可以看出背心这类商品中受爆款影响严重,有一款的销量竟然达到了占比3.5%,这款衣服是比较受大家的欢迎的,其余的一些类型受爆款影响都不是太大。 

总结:这家淘宝店铺的销量以及销售额基本服从正态分布,销售占比最多的是20-30元的衣服,最低价以及最高价占比极少,其中30-40元的价格区间销量占比仅次于20-30的,但是销售额占比则近似于20-30阶段的销售额占比,对商品分类之后发现此价格区间销量最集中的是裤子和其他一些商品,可以尝试向客户推荐裤子(根据购物车和收藏量指标针对不同客户推荐)。

爆款商品可能存在毛利低同时销量竭力,可调查追踪使用情况(如背心),若达到回购率指标,可相应新品在60以上价位的同类产品再对客户进行微信公众号文章推送。

 

你可能感兴趣的:(数据分析)