母婴用品消费数据分析报告

一、分析背景

为了分析电商销售中影响销量的主要因素,帮助商家从不同维度提高销售量增加营收,本分析借鉴的数据集为2012年7月至2015年2月期间淘宝天猫平台有关婴幼儿产品的销售数据。
本次分析的主要目的是帮助商家明确自身所面向的主要消费群体,以及如何合理有效的吸引该群体并充分满足其需求,实现商家营业收入的稳步提升。

二、理解数据

本次拟分析的数据包含两个数据集:
表1:淘宝或天猫上用户2012~2015年购买母婴用品的交易记录
包含字段:
user_id:用户id
auction_id:购买行为编号
cat_id:商品种类ID
cat1:商品所属大类
property:商品属性
buy_mount:购买数量
day:购买时间
表2:淘宝或天猫用户提供的婴儿基本信息
包含字段:
user_id:用户id
birthday:出生日期
gender:性别(0 男性;1 女性;2 未知)

三、分析思路

分析思维导图

四、清洗数据

利用PowerBI进行数据清洗
  • 新建时间维度列表
时间维度 = GENERATE(
                    CALENDAR(date(2012,1,1),date(2015,12,31)),
                    var currentDay=[Date]
                    var year =YEAR(currentDay)
                    var quarter="Q"&FORMAT(currentDay,"Q")
                    var month=FORMAT(currentDay,"MM")
                    var day=DAY(currentDay)
                    var weekid=WEEKDAY(currentDay,2)
                    return row(
                        "年度",year,
                        "季度",quarter,
                        "月度",month,
                        "日",day,
                        "年度季度",year&quarter,
                        "年度月度",year&month,
                        "星期几",weekid))
  • 根据婴儿信息表关联匹配交易表,得出婴儿年龄等信息
    存在婴儿年龄>28岁的异常值,剔除


    婴儿信息完善
  • 利用pandas进行销售量的描述统计:


    销售量的描述统计.png

可知单次销量的平均数为2.54,中位数为1,最大值为10000,有极值影响数据准确性;利用切比雪夫定理,可判定单次销量大于322.44的极有可能为异常值,故将单次销量限定在0-323之间。

五、数据分析

1.网站整体运营情况:

1)各年度订单量走势

由于2015年数据截止至2月5号,15年Q1数据不完整,故不纳入统计


2012Q3-2014Q4销量

由图可知,该网站销量呈波动上涨趋势,说明整体运营状况较好,但是否能够长期保持这种态势,应当运用PEST方法进行分析:

  • 政治环境:
    2016年全面二孩政策的实施,可以明确感受到国家对于提高生育率以缓解人口老龄化的需求非常迫切,预期将在短期内带来新生儿数量的大幅增长,对母婴用品行业来说是重大利好。
  • 经济环境:
    虽然国民经济在持续向好发展,但青年人的生活成本也在不断增加,线下实体母婴用品的销售往往存在价格偏高的问题,而线上购物平台则以其方便快捷、可多方比价的优势成为年轻人的首选购物方式,这无异于有利于母婴电商行业的发展。
  • 社会环境:
    据统计,我国2015大概有1700万的婴儿出生,随着政策的开放,短期内新生儿的数量可能进一步增加,但当二孩生育意愿充分释放之后,面对高昂的生活成本,我国新生儿数量是否能够持续保持增长态势,尚未可知。
  • 技术环境:
    随着互联网及移动支付技术的发展,大量商品交易转移至线上,网购开始成为主流销售渠道。
2)用户复购率
  • 利用pandas确定各用户的首次购买日期和最后购买日期,计算留存天数
user_life=grouped_user.day.agg(['max','min'])
user_life['staytime']=user_life['max']-user_life['min']
user_life.sort_values('staytime')
(user_life['staytime']=='0days').value_counts()
留存天数是否大于1天

可知仅有0.08%用户有重复购买行为,说明网站的用户粘度非常低,主要靠新客户支撑销量。应当考虑用户购买体验不佳以致不再购买的可能性,同时考虑我国孕产妇是否具有一次性购足所有产品的习惯。

3)主要用户群体特征
用户婴儿的年龄
婴儿年龄分布

网站用户婴儿的年龄段主要集中在0-3岁区间段,占比超过84%


销量帕累托

同时,0-2岁的婴儿用户也是支撑网站销量的主力军,占比78%,因此网站也许应该着重开发适用于0-3岁婴儿的产品。

用户婴儿的性别
婴儿性别

从婴儿性别占比来看,该网站主要用户群体以男婴为主,但男女婴占比的差距并不太大,考虑到开放二孩以来男女出生比例失衡较为严重的情况,应当意识到男婴市场可能还有很大的开发潜力。

2.促销活动如何开展

1)最佳时间
  • 根据网站月销量走势图,可以看出,该网站的销量在一年中有明显的波动,11月与5月是销量的高峰期,而2月份往往销量低迷,应当据此分析出现波动的原因,确定应当在何时进行促销活动。


    月销量走势
  • 首先分析影响销量的因素,销量=下单次数*平均单次购买量


    平均单次购买量

    可知单次购买量基本在1.5-2.0之间波动,波动范围很小,对月度销量波动的影响程度非常有限。


    下单次数

    对比可知,该网站月下单次数的波动趋势与月销量的波动趋势非常相近,可以得出下单量决定销量的结论。因此应当着重分析是什么原因推动了销量的增长,以此作为开展促销活动时点的参考。
  • 分析11月和5月销量上涨的原因


    由上开始为12-14年
13-14年

可以看出11月和5月的日消费次数都高于年均日消费次数,区别在于11月份的消费次数仅有一个高峰点,出现在11月11日附近;而5月份的消费高峰有多个,且主要集中在5月中下旬。考虑到双十一和母亲节及儿童节是全网促销活动开展的时点,基本可以得出促销活动推动销量上涨的结论。

2)活动商品的确定
  • 促销活动商品的确定需要考虑两个因素:商品的日常销量基数和促销活动带来的销量增幅。


    促销增幅比例

2013-2014年销量最高的商品为28及50008168,若以5月、11月为固定促销活动月份,则50022520商品的销量增幅最大,但结合基础销量考虑,该商品对销量的总体贡献并不大。


销售数量/订单量

38子商品每单购买量

38商品每单销售量是最高的,可以在促销活动时搭配28及50008168等类目的商品进行销售,尤其是211122,针对该商品设计促销活动可能会大幅度提高网站销量。

3.用户画像

1)不同年龄区间的用户购买偏好
不同年龄段婴儿对商品的偏好情况
各类商品受众的年龄区间

综合比较,0-2周岁的婴儿对商品的需求量相对较大,其中50014815的需求量是最大的。其他3岁以上的用户首要需求产品是50008168,5岁以上的用户对50022520和38商品几乎没什么需求。

2)不同婴儿性别的用户购买偏好
不同性别用户的商品购买量

从整体上看,男婴对50014815类商品的需求量最大,其次是50008168类商品,而女婴则对50008168、28、50014815类商品的需求更大些;其中50014815类商品的女婴受众群体偏多,而50022520类商品的女婴受众群体偏多。


不同性别单均购买量

从数据上看,不同性别婴儿的人均购买量差距较大,男婴的人均购买量比女婴的多了49%,结合男婴较高的用户数量占比,可以得知男婴的销售贡献率大于女婴。

六、结论

1.网站整体运营状况:

  • 网站销售情况呈总体向好态势,年度销量不断提升,通过PEST分析,在现有政策下,可以预计销量可以保持增长势头,经营状况良好;
  • 复购率等数据表明网站的用户粘度很低,忠诚度差,几乎没有老用户,同时新增用户的购买欲望也不是很高,应当从提高客户购买体验、根据客户定位合理配置商品定价、时刻关注竞争对手的营销策略等方面进行改进,减少用户的流失率;
  • 从网站用户的性别构成来看,男婴儿对销量的支撑力度相对女婴要大,但是差距不是特别明显。

2.促销活动的开展:

  • 网站一年中的销量高峰主要分布在5月和11月,正值淘宝天猫的母亲节、儿童节、双十一等大型促销活动,消费次数有明显提升;
  • 50022520类商品平均销量不高,但在促销期间销量增幅较为明显,可以针对该类商品设计专门促销活动;28类及50008168类商品销量基数大,促销增幅居中,可以将该类产品放在推广位以吸引顾客;38类商品平均每单购买量最高,应当将其中的211122商品与如28等热销商品捆绑,提高销量。

3.用户特征方面:

  • 用户中男女婴的数量占比差距不是特别大,但单均购买量存在49%的差额,导致男婴的总体消费贡献要大于女婴。男女婴对不同商品的需求量存在差异,应当尝试根据不同性别用户的需求,开发相应的产品组合。同时,面对预计会持续增长的男婴市场,应当深入研究该群体的需求,进行产品配置;
  • 在用户年龄方面,网站主要受众集中在0-5岁之间,基本对各个大类的商品都有需求,同时50008168类商品各年龄段用户的需求量都相对较大,可以根据不同年龄段的商品需求,将50008168类商品与其他品类商品组合成套餐进行销售,面向不同年龄的受众。

你可能感兴趣的:(母婴用品消费数据分析报告)