京东订单交易数据分析

目录

数据说明

数据说明

数据预处理​​​​​​​

数据分析

区域分析

价值分析

产品分析

各字段的交互分析

结论说明


数据说明

        本次数据来源于京东2020年5月25日 大家电-冰箱的订单数据 按照10%的随机抽样后进行数据脱敏最后得到的订单数据,共有订单数据大约70K,数据来源于公开网络数据。

        数据来源:京东冰箱订单数据集 - Heywhale.com

        数据乱码参考代码:电商数据分析项目总结!_51CTO博客_电商数据分析项目

数据字段说明:

        1、用户账号、父订单号、订单号仅仅是一个id,本文因为时间问题,不作为分析目标(如果时间允许,可以分析用户的购买情况,包括复购率之类的)。

        2、订单日期没用,因为只有一天且订单时间里面包含了日期及其具体时分秒的数据。

        3、商品SKU也用不到分析中,商品SKU在实际中是对商品属性的数字化,可以根据这个信息追踪到具体的商品。

       4、一、二、三级品类名称无用,因为每个品类只有一种,没有分析意义。

       5、用户会员等级的范围在50~100左右,根据京东的会员等级,这些等级隶属于同一个等级所以不具备分析意义。

        综上所述,得到如下的分析字段及其分析思路。

京东订单交易数据分析_第1张图片

数据预处理

 1、对品牌名称进行名称统一,剔除掉品牌名称的英文名

京东订单交易数据分析_第2张图片

京东订单交易数据分析_第3张图片

 2、商品名称与品牌名称无法匹配,统一匹配数据

京东订单交易数据分析_第4张图片

        这类相关的评语数据被当成购买数据,可能出现同一次购买记录多次出现的现象,故考虑剔除相关数据。

京东订单交易数据分析_第5张图片3、 订单数据与城市位置数据匹配,并剔除匹配后的缺失数据

京东订单交易数据分析_第6张图片

4、获取有效完成订单的数据,并计算以小时为单位的时间、附加金额和时间差等数据

京东订单交易数据分析_第7张图片

         其中,有效订单标志为1,且取消订单标志为0的数据被认为是完成购买行为的记录。但其他组合的数据并不知代表的含义!附加金额包含两部分,一部分是产品购买后的运费险、三年保修之类的保险附加产品,另外一部分是用户叠加优惠价值,本文缺少其中一个数据,在实际中若有其中一个数据可以进行计拆解计算折损率、附加产品价值等指标。

数据分析

区域分析

京东订单交易数据分析_第8张图片

        从省份的订单量上看,广东省、北京市、上海市的订单量最多, 其次是江苏省和四川省。从地区划分看,沿海、中部地区的省份具有较多的订单量。

京东订单交易数据分析_第9张图片

省份交易金额的分布,同省份订单量的分布结果大致相同。

        结合省份的销售数量和交易金额分布,可以对当前地区的物流商进行整合调优。对盈利较小的地区固定低价高性价比的物流商或者直接取消对该地区的销售渠道;例如:综合实力较弱的企业对新疆、西藏、云南、黑龙江、内蒙古等区域暂时考虑不进行销售,降低企业的物流成本,集中精力主攻主要销售省份的销售目标。对盈利较大的地区应根据当前的物流成本信息进行调整。其中,tw地区的数据是为了让图片不违反规定的处理的。

价值分析

1、优惠前单价的数据分布

京东订单交易数据分析_第10张图片

        冰箱产品的销售价格主要是高低端的较多,中端产品的分布相对于其他两个层次的较少。特高端的产品订单量有所分布,但数量很少。同时,超低价产品的销售情况也存在,这是薅羊毛还是上架错误导致的?

2、优惠价格的数据分布

京东订单交易数据分析_第11张图片

        优惠价格主要是商家考虑的成本折损率,优惠价格小于100元的产品优惠是占大多数的,其次是价格为100-700元之间的产品优惠,大额优惠价格也存在,但数量少,估计是特高端产品的优惠策略。

 3、当天各时段的实际支付价格、销售数量及其优惠情况

京东订单交易数据分析_第12张图片

京东订单交易数据分析_第13张图片        实际支付价格和销售数量在当前的0点时是最大值,可能0点是活动开启的时间,此时商家给到的优惠力度是当天最大,所以呈现这个现象。由于一点到七点是休息时间,故此时间段内的人流量最少,销售情况也最为低迷。之后的时间段,销售情况有一定的提升,但提升不大,总体较为平均。

4、下单时间与支付时间间隔的分布情况

京东订单交易数据分析_第14张图片

        下单后立刻支付的销售数量较多,间隔时间大于1分钟的客户开始逐渐减少,说明多数用户对商品的购买意愿较强,一定的促销活动能够促进客户对商品的购买行为。

5、下单与支付间隔时间的支付均价

京东订单交易数据分析_第15张图片

         间隔为1分钟左右的实际支付价格的均值较小,间隔大于1分钟后的实际支付价格的均值较大,且在四个半小时时出现了最大值。结合各时段的订单量、销售数量和优惠占比分析可知,原因是间隔小于1分钟时是促销力度最大的时候,此时主打的促销策略可能是薄利多销。

产品分析

京东订单交易数据分析_第16张图片

京东订单交易数据分析_第17张图片

京东订单交易数据分析_第18张图片

        在完成订单情况下,海尔的销售量最多,其次是容声、康佳、西门子、美的、志高等品牌。

        从销售量和销售金额分析,西门子的销售数量小于容声,但销售金额大于容声,说明西门子的单价要比容声大。同理,低单量高单价的品牌有松下、海信、美菱、格力、卡萨帝等品牌。根据西门子和容声的关系进行方向分析可知,康佳的销售量位居第三,但销售量位居第八,是一种高单量低单价的产品品牌。同理,高单量低单价的品牌有容声、TCL、奥克斯等品牌。

        从优惠金额分析,容声的销售数量不如海尔的销售数量,但容声的优惠金额高于海尔的优惠金额,且容声属于高单量低单价的产品品牌,在价格方面具有较大的优惠性;若在其他方面相同时,容声品牌的产品具有较大的性价比。同理、类似属性的有西门子、海信、格力、美的等品牌。

京东订单交易数据分析_第19张图片

        京东自营品牌中海尔、容声、西门子、康佳、海信等品牌的占比量较大。非京东自营的品牌中海尔、志高、奥克斯、美的、现代的品牌占比量较大。分析可知,是否为京东自营的品牌具有较大的差异性。

各字段的交互分析

1、时间与地区的交互分析

京东订单交易数据分析_第20张图片

         从图中可知,北京、上海、广东、江苏等省份具有较大的销售分布。在销售当天,北京和广东全天都有销售情况,广东销售主要分布在0~4点和11点之后,北京全天的销售较为平均,并无太多重点销售时段。上海在2点的销售低迷外,4~13点之间是该地区的销售重点时段,其他时段的销售情况较为均衡。江苏在除了4、21、23点三个时间点较为低迷,10~12点有较大的峰点,其他时段较为平均。

2、时间与品牌的交互分析

京东订单交易数据分析_第21张图片

         从时段和品牌的分析中可知,西门子、海尔、容声三大品牌的销售情况较好。西门子主要销售时段集中在0~7点和22~23点两个时间段,其他时段销售情况稍弱些。海尔主要销售时段集中在8点之后,8点之前的销售情况也稍弱些。容声的销售情况主要集中在3点和23点,但总体上销售能力较为均衡。

3、地区与品牌的交互分析

京东订单交易数据分析_第22张图片

         从地区和品牌的销售情况分析,先科、申花、多方达三个品牌在各地区的销售情况都较差。

        特定地区销售品牌:长虹的主要销售区域在安徽,格兰仕的主要销售区域在四川和北京,小米的主要销售区域在安徽和浙江,统帅的销售区域主要在上海。

        高销量区的品牌分布情况:广东地区除先科、多方达、小米、格兰仕、申花、统帅和长虹等品牌外均有较好的销售情况;北京地区除先科、多方达、小米、小鸭牌、杨子、申花和长虹等品牌外均有较好的销售情况;上海地区除上菱、先科、多方达、小米、杨佳、杨子、格兰仕、澳柯玛、申花、长虹和长城。

4、品牌与是否自营的交互分析

京东订单交易数据分析_第23张图片

        结合之前的饼图也可知,海尔在是否自营方面销售情况都较好;西门子、美菱、海尔、海信、格力、松下康佳和容声等主要分布还是京东自营。美的、志高、奥克斯为京东非自营。

5、时段与自营属性的交互分析

京东订单交易数据分析_第24张图片        非自营的产品在0点时有一定的销售量,在其他时段内的销售量较为惨淡。自营产品在0点时销售量最多,其次是6~12点和20~23点两个时间段的销售量较多,其他的时段的销售量较为平均。

结论说明

 区域分析:

        产品的销售订单主要分布在沿海和中部的地区,其中,一线城市和江苏等地销量最高。

    值分析价:

        冰箱行业,低高端产品的购买量较多,中端产品相对其他两个层次的购买量较少。优惠价格方面,主要分布在0~100元,100~700元也有较少分布。

    时间分析:

        在0点时,产品的销售量和促销力度是最大的,其他时段的销售量较为平均。同时,一分钟内的交易订单数量较多,说明大多数客户在促销活动前已经有购买意向。

    产品分析:

        根据销售数量和销售金额可知,冰箱产品分为两种类型——低单量高单价(松下、海信、美菱、格力、卡萨帝等品牌)和高单量低单价(康佳、容声、TCL、奥克斯等品牌)。在销售产品中,京东自营产品占大多数。

   交互分析:

        时间与地区:北京、上海、广东、江苏等省份具有较大的销售分布,其中上海和广东全时段的销售量都较大。

        时段与品牌:西门子、海尔、容声三大品牌的销售情况较好,其中海尔和西门子全时段的销售情况较好。

        地区与品牌:先科、申花、多方达三个品牌在各地区的销售情况都较差;长虹、格兰仕、小米、统帅有特定的销售区域以及其他品牌的产品有高销售区域。

你可能感兴趣的:(python,python,数据分析)