数据来源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1
数据背景:基于阿里巴巴电商平台上某店铺的真实用户商品行为数据,通过数据分析了解数据背后更深入的意义,并对商家提出适当的运营建议
实战工具:Python、tableau、Excel
实战过程:
一、数据清洗及整理
数据量约有104万,时间节点从2014年11月18日至12月18日,利用Python进行数据清洗(Excel跑不动的)
1. 导入数据并了解数据属性:数据不存在异常值,地址信息缺失值不影响数据分析,故不需要进行异常值及缺失值处理
2. 日期类数据类型处理:将日期与时间段分列,有利于每日及每个时间段的数据整理
3.分组获取所需数据:
3.1 获取每日或每时间段的点击/收藏/加购/购买浏览量(代码可用循环进行优化)
3.2 获取相对应的每日或每时间段的点击/收藏/加购/购买独立访客数
3.3 获取每日或者每时间段的总访问量及总访客数
3.4 获取一个月内不同用户总购买次数
注:
访客数(UV):一天之内网站的独立访客数,一天内同一访客多次访问网站只计算1个访客
浏览量(PV): 即页面浏览量或点击量,若同一用户多次打开或刷新同一个页面,PV值会累加
(本文说的访问量与浏览量同义)
4.数据计算及整理
将Python获取的数据填入Excel中,利用Excel函数工具进行简单的计算并整理出一份数据表
运营数据计算:
(1)平均每付费用户收入=付费总收入/付费总用户数(用购买次数代替消费金额)
(2)平均每用户收入=付费总收入/付费总用户数(用购买次数代替消费金额)
(3)付费率=付费总人数/活跃用户数=购买访客数/访客数
(4)跳出率=浏览单页即退出的次数 / 访问次数=单日点击数/单日浏览量
(5)转化率=产生下一行为的访客人数 / 上一行为的访客人数
如:点击-购买转化率=购买访客数/点击访客数
二、数据分析
将Excel表格数据导入tableau,利用tableau进行数据分析及可视化操作
注:文中分析所说平日指的是不包含12月12日的数据值,当日指的是12月12日的数据值,所计算的平均值均是平日的数据
1. 用户行为箱线图分析:每日的点击量/收藏量/加购量/购买量的中位数分别31167/657/885/299,数据分布都比较集中,说明每日用户行为的数据波动性不大;因为12月12日是“双十二”促销,所以该天的用户行为数均比平常值高很多,临近的12月11日的用户行为也较为活跃
2. 每日用户行为数据概况分析:“双十二”狂欢节对用户行为影响非常明显,当日点击量比平日增长1.77倍,购买量增长4.33倍,访客量增长1.29倍,浏览量增长1.80倍,付费率增长2.86倍,ARPPU增长1.14倍,ARPU增长3.24倍,跳出率降低2个百分点,说明促销效果非常好,给商家带来明显的营业收入增长
另外,受”双十二“影响,浏览量从12月9日开始明显增长,付费/购买行为也开始明显减少
3. 转化率分析:平日的用户行为路径为:点击——>加入购物车——>收藏——>购买,平均转化率分别为0.1379—0.6886—0.5958,而点击——>购买的转化率为0.0566;当日的用户行为路径为点击——>加入购物车——>购买,转化率分别为0.2253—0.7346,而点击——>购买的转化率为0.1655
页面跳出率约为94%,点击到下一步的操作转化率低于30%,说明该商品本身的属性偏向于吸引有需要的人群,用户的加购、收藏、购买的转化率均高于50%,说明店家应该提高商品页面质量更容易吸引有需要的顾客进行购买
另外,12月12日的收藏数少于购买数,也就是当日用户偏向于先加入购物车再购买,或者当日直接购买,减少收藏这一环节,可能是为了在促销期间提高消费效率
4. 每个时段的用户行为分析:
一天的时间内用户从17时开始持续活跃至23时,店家应该利用这个黄金时间段,譬如开展更多的促销、优惠、直播卖货等活动,吸引更多用户关注并购买,提高转化率
10-16时的转化率较高,说明用户偏向于在这个时间段完成购买活动,建议点击在此时间段开展促销活动,能够提高用户消费金额
5. 其它数据分析:
一个月内的用户购买次数分析:4330个用户ID中只有55个用户的单月购物次数大于10次,也就是87%的用户单月购买次数在10次以下
复购率分析:复购率=重复购买客户数量/客户样本数量(重复购买即为购买次数大于1)
购物次数大于1的用户数量为2295位,占总用户数的53%,也就是一个月内的复购率为53%
三、数据可视化
利用tableau仪表板展示上述的数据分析结果