本文将进行电商唯品会商品的复盘问题,在此将会按照数据分析的流程进行以下操作:
1.目标确定:
1.1 背景介绍
唯品会上各种折扣、特卖的实用商品深受大家的喜爱。最早的线下模式(实体店打折促销、街边的大甩卖、一时兴起的两元店等)到如今的快速分销、消除内存的线上模式(唯品会,直播带货)无不显示着电商的繁荣发展,当业绩达成率,业绩增长率,销售利润率各个指标都在一片向好,老板提出更快更好的促销需求时,优化商品结构,完成复盘分析已经成了必须的数据分析要求。
1.2 目标确定
主要进行描述性分析,首先对此次促销活动的结果进行各项指标的统计,并以此指标数据表为依据,挑选可行的角度来优化商品结构,以达到更快促销的效果。
2.数据获取
dt1 = pd.read_excel(’商品信息表.xlsx')
dt1[:5]
dt2 = pd.read_excel('商品热度表.xlsx')
dt2[:5]
dt3 = pd.read_excel('用户销售明细表.xlsx')
dt3[:5]
商品信息表dt1:
商品信息表dt2:
客户销售明细表 dt3:
3.数据清洗
将用户明细表中的"是否退货"字段改为数字变量(是=1,否=0)
dt3['是否退货']=dt3["是否退货"].map({"是":1,"否":0})
dt3[:5]
清洗后的客户销售明细表:
4.数据整理
- 将上述三个表合并为同一个表,得到每一件商品的具体信息。
- 合并商品信息表和商品热度表得到dt_product表 。
- 用户销售明细表以商品名进行聚合处理得到product_sales表。
- 将 dt_product表和product_sales表合并得到总商品信息表dt_product_sales表。
dt_product = pd.merge(dt1,dt2,how="left",on="商品名")
dt_product[:5]
product_sales = dt3.groupby("商品名").agg({"购买数量":"sum",
"购买金额":"sum",
"退货件数":"sum",
"退货金额":"sum",
"购买单价":"mean",
"用户id":pd.Series.nunique}).reset_index() # nunique去重计数
product_sales.columns = ['商品名','商品销售数量',"商品销售金额","商品退货数量","商品退货金额","商品销售单价","购买用户数量"]
dt_product_sales = pd.merge(dt_product,product_sales,how="left",on="商品名")
dt_product_sales[:5]
商品销售明细表如图所示:
5.描述分析
5.1 总体流程图解:
5.2 总体指标分析
确定各指标:
- GMV:总消费额,包括退货额
- 销量:累计销售量,包含退货量
- 实际销售额:GMV – 退货额
- 客单价:GMV / 客户数
- UV:unique view 商品所在页面的独立访问数。
- 转化率:客户数 / UV
- 折扣率:GMV / 吊牌总额(吊牌总额 = 吊牌价 * 销量)
- 备货值:吊牌价 * 库存数
- 售卖比:售罄率,GMV / 备货值
- 收藏数:收藏某种商品的用户量
- 加购数:加购物车人数
- SKU数:最小品类单元
- SPU数:款号
- 拒退量:退货总数量
- 拒退额:退货总金额
#1、GMV:销售额
gmv = dt_product_sales["商品销售金额"].sum()
#2、实际销售额=GMV - 退货金额
return_money = gmv - dt_product_sales["商品退货金额"].sum()
#3、销量
all_sales = dt_product_sales["商品销售数量"].sum()
#4、客单价:GMV / 客户数
custom_price = gmv / dt_product_sales["购买用户数量"].sum()
# 5、UV:商品所在页面的独立访问数
uv_cons = dt_product_sales["UV数"].sum()
# 6、转化率:客户数 / UV。
uv_rate = dt_product_sales["购买用户数量"].sum() / dt_product_sales["UV数"].sum()
# 7、折扣率:GMV / 吊牌总额(吊牌总额 = 吊牌价 * 销量)
tags_sales = np.sum(dt_product_sales["吊牌价"] * dt_product_sales["商品销售数量"])
discount_rate= gmv / tags_sales
# 8、备货值:吊牌价 * 库存数。
goods_value = dt_product_sales["货值"].sum()
# 9、售卖比:又称售罄率,GMV / 备货值。
sales_rate = gmv / goods_value
# 10、收藏数:收藏某款商品的用户数量。
coll_cons = dt_product_sales["收藏数"].sum()
# 11、加购数:加购物车人数。
add_shop_cons = dt_product_sales["加购物车数"].sum()
# 12、SKU数:促销活动中的最小品类单元(一般指货号)。
sku_cons = dt_product_sales["SKU"].sum()
# 13、SPU数:促销活动中的SPU计数(一般指款号)。
spu_cons = len(dt_product_sales["商品名"].unique())
# 14、拒退量:拒收和退货的总数量。退货件数
reject_cons = dt_product_sales["退货件数"].sum()
# 15、拒退额:拒收和退货的总金额。
reject_money = dt_product_sales["商品退货金额"].sum()
# 汇总统计
sales_state_jin = pd.DataFrame(
{"GMV":gmv,"实际销售额":return_money,"销量":all_sales,"客单价":custom_price,
"UV数":uv_cons,"UV转化率":uv_rate,"折扣率":discount_rate,"货值":goods_value,
"售卖比":sales_rate,"收藏数":coll_cons,"加购数":add_shop_cons,"sku数":sku_cons,
"spu数":spu_cons,"拒退量":reject_cons,"拒退额":reject_money},index = [0]
)
sales_state_jin_s = sales_state_jin.T.reset_index()
sales_state_jin_s.columns = ["指标","今年双11"]
sales_state_jin_s
sales_state_qu = pd.DataFrame(
{"GMV":2261093,"实际销售额":1464936.517,"销量":7654,"客单价":609.34567,
"UV数":904694,"UV转化率":0.0053366,"折扣率":0.46,"货值":12610930,
"售卖比":0.1161,"收藏数":4263,"加购数":15838,"sku数":82,
"spu数":67,"拒退量":2000,"拒退额":651188.57} ,index = [1]
)
sales_state_qu_s = sales_state_qu.T.reset_index()
sales_state_qu_s.columns = ["指标","去年双11"]
sales_state = pd.merge(sales_state_jin_s, sales_state_qu_s,on="指标")
sales_state["同比"] = (sales_state["今年双11"] - sales_state["去年双11"]) / sales_state["去年双11"]
sales_state
对比图如下:
从上表可以看出今年双十一比去年规模更大,范围更广。销售额和销量同比增加超过50%,说明今年的营销宣传、造势和效果是不错的。但是客单价和折扣率呈下降趋势,在此首先猜测客单价下降原因,因为客单价=GMV/(UV*UV转化率),这三个指标同比全部增长,所以可能的原因是客户质量下降(高付费客户流失,买低价产品的客户过多;促销价格过于低廉,销量增长成倍数增加)。接下来折扣率是也是促销运营的重要节点,上述表可看出打的折扣过猛,所以需要对折扣寻找合理区间。
5.2 从价格区间来优化商品结构
我们在这里采用的是经典细分思想方法:ABC分析法,因为多个特征可以充分满足ABC分析法的应用范围,所提采用此方法进行商品结构的优化。我们需要做的是,深入探究不同区间的数据,以此来优化后期的促销结构。首先我们需要找到在本次促销中此区间的销售源数据,源数据要求显示具体的款号、销售额、销量等信息。第二步,计算出每个款的转化率、折扣率等指标。
查看指标:销售额,销量,件单价,客户数,UV,转换率,库存,货值,售卖比
# 划分价格区间段
listBins = [0,200, 400, dt_product_sales['售卖价'].max()]
listLabels = ['1_200','200_400','400及以上']
dt_product_sales['价格分组'] = pd.cut(
dt_product_sales['售卖价'],bins=listBins,labels=listLabels,include_lowest=True)
dt_product_sales[:5]
#价格区间销售情况统计指标:
价格区间、货值、货值占比、销售额、售卖比、销售占比、销量、客单价、UV、收藏数、加购数、转化率
dt_product_sales_info = dt_product_sales.groupby("价格分组").agg({ "货值":"sum", "商品销售金额":"sum","商品销售数量":"sum", "UV数":"sum", "购买用户数量":"sum", "收藏数":"sum", "加购物车数":"sum" }).reset_index()
# 货值占比 售卖比 销售占比 客单价 转化率
dt_product_sales_info['货值占比'] = dt_product_sales_info['货值']/dt_product_sales_info['货值'].sum()
dt_product_sales_info['售卖比'] = dt_product_sales_info['商品销售金额']/dt_product_sales_info['货值']
dt_product_sales_info['销售占比'] = dt_product_sales_info['商品销售金额']/dt_product_sales_info['商品销售金额'].sum()
dt_product_sales_info['客单价'] = dt_product_sales_info['商品销售金额']/dt_product_sales_info['商品购买用户数量']
dt_product_sales_info['转化率'] = dt_product_sales_info['商品购买用户数量'] /dt_product_sales_info['UV数']
价格区间销售表如下:
如上图所示,价格在400以上的商品,销售占比、客单价均比另外两个价格区间的商品占优,转化率也不分伯仲,因此选取价格在400以上的商品单独分析。
product_400 = dt_product_sales[dt_product_sales["价格分组"]=='400及以上']
#利用转换率和售卖比这两个指标进行商品分类
product_400['转换率'] = product_400['商品购买用户数量']/product_400['UV数']
product_400['备货值'] = product_400['吊牌价'] * product_400['库存量']
product_400['售卖比'] = product_400['商品销售金额']/product_400['货值']
# 提取出 商品名,商品销售金额,商品销售数量,商品销售单价,购买用户数量,UV数,转换率,库存量,备货值,售卖比
product_400[["商品名","商品销售金额","商品销售数量","商品销售单价","购买用户数量","UV数",'转换率',"库存量","备货值","售卖比"]]
# 1、A类商品:转化率大于0.7%的商品予以保留
select_product=product_price_400[product_price_400['转换率'] > 0.007]
# 2、B类商品:找出转化率小于0.7% 但是售卖比大于33%的部分予以保留
select_product_info=product_price_400[(product_price_400['转换率'] < 0.007) & (product_price_400['售卖比']>=0.33)]
# 3、C类商品,找出转化率小于0.7%并且售卖比小于33%的部分进行清仓处理
delect_product=product_price_400[(product_price_400['转换率'] < 0.007) & (product_price_400['售卖比']<0.33)]
统计得出A类保留商品共12种,B类保留商品共1种,C类清仓处理商品共10种。
5.3 从折扣区间来优化商品结构
listBins = [0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55, 0.6, 0.65, 0.7, 1]
#设置切分后对应标签
listLabels = ['0.15_0.2','0.2_0.25','0.25_0.3','0.3_0.35','0.35_0.4','0.4_0.45','0.45_0.5','0.5_0.55','0.55_0.6','0.6_0.65','0.65_0.7','0.7_1']
dt_product_sales['折扣区间'] = pd.cut(dt_product['折扣率'], bins=listBins, labels=listLabels, include_lowest=True)
dt_product_sales[:5]
# 折扣区间销售情况统计:价格区间、货值、货值占比、销售额、售卖比、销售占比、销量、客单价、UV、收藏数、加购数、转化率
dt_product_discount_info= dt_product_sales.groupby('折扣区间').agg({'货值':'sum',
'商品销售金额':'sum',
'商品销售数量':'sum',
'UV数':'sum',
'收藏数':'sum',
'加购物车数':'sum',
'购买用户数量':'sum'
}).reset_index()
# 求货值占比、售卖比、销售占比、客单价、转化率
dt_product_discount_info['货值占比']=dt_product_discount_info['货值']/dt_product_discount_info['货值'].sum()
dt_product_sales_info['售卖比'] = dt_product_sales_info['商品销售金额']/dt_product_sales_info['货值']
dt_product_discount_info['销售占比']=dt_product_discount_info['商品销售金额']/dt_product_discount_info['商品销售金额'].sum()
dt_product_discount_info['客单价']=dt_product_discount_info['商品销售金额']/dt_product_discount_info['购买用户数量']
dt_product_discount_info['转化率']=dt_product_discount_info['购买用户数量']/dt_product_discount_info['UV数'].sum()
dt_product_discount_info
折扣区间商品信息表:
如折扣区间的销售额所示,0.35-0.4的折扣所卖出的商品销售额是最高的,所以对该区间进行商品优化。
product_354 = dt_product_sales[dt_product_sales["折扣区间"]=='0.35_0.4']
#利用转换率和售卖比这两个指标进行商品分类
product_354['转换率'] = product_354['商品购买用户数量']/product_354['UV数']
product_354['备货值'] = product_354['吊牌价'] * product_354['库存量']
product_354['售卖比'] = product_354['商品销售金额']/product_354['货值']
# 提取出 商品名,商品销售金额,商品销售数量,商品销售单价,购买用户数量,UV数,转换率,库存量,备货值,售卖比
product_354[["商品名","商品销售金额","商品销售数量","商品销售单价","购买用户数量","UV数",'转换率',"库存量","备货值","售卖比"]]
# 1、A类商品:折扣率大于37%的部分找出售卖比大于36.5%且转化率大于0.7%的商品予以保留
stay_stocks1 = product_354[(product_354["折扣率"]>0.37)&(product_354["售卖比"]>0.365)&(product_354["转换率"]>0.007)]
# 2、C类商品:折扣率大于37%的部分找出售卖比小于36.5%或转化率小于0.7%的商品进行清仓处理
stay_stocks2 = product_354[(product_354["折扣率"]>=0.37)&((product_354["售卖比"]<=0.365)|(product_354["转换率"]<=0.007))]
# 3、B类商品:在折扣率小于37%的部分找出售卖比大于36.5%且转化率大于0.7%的部分予以保留,留作下次促销活动
stay_stocks3 = product_354[(product_354["折扣率"]<=0.37)&(product_354["转换率"]>0.007)&(product_354["售卖比"]>0.365)]
# 4、C类商品:在折扣率小于37%的部分找出售卖比小于36.5%或转化率小于0.7%的商品进行清仓处理
stay_stocks4 = product_354[((product_354["折扣率"]<0.37) & ((product_354["售卖比"]<0.365)|(product_354["转换率"]<0.007)))]
最终统计,A类保留商品共1件,B类保留商品共1件,C类清仓商品共23件.
注:
本文只阐述了热门价格区间(400及以上)的ABC类商品分类,热门折扣区间的ABC商品。其余的区间也可以同等分析,将这些商品进行有效的剥离分类,可以实现商品更好的销售情况。
结论
获得当期和同期的销售额、售卖比、UV、转化率等数据指标,两者进行同比对比分析,得出客单价有20%的下降,折扣率有9%的降低,因此从这两个细分维度着手,进行商品结构优化。
对于热点价格区间或热点折扣区间的A类商品,可以将它们放在网页首页作为主推商品,以及下次促销的同类商品。
对于热点价格区间或热点折扣区间的B类商品,可以将他们放在页面尾端,占据流量少的地方进行处理,如果库存少的话,可以进行少量销售;如果占据了主推位置,建议将主推位置留给A类商品。
对于不热门的商品(C类商品)建议更换主图,降价,快抢或者清仓处理。