背景介绍
淘宝是中国深受欢迎的电商平台,经常网购的人少不了逛逛淘宝,随便看看有什么想买的或者有目的想买什么,在逛淘宝的过程中,我们会留下足迹。通过这些足迹,也就是用户的行为,我们可以对这些行为进行分析挖掘。
使用的工具是Python,主要用到了Numpy,Pandas、Matplotlib及Msno这几个包。
数据来源于阿里云天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46
1 提出问题
本文主要围绕这几个点展开:
1.漏斗模型用户行为分析
2.平台用户使用情况分析
3.时间维度用户行为分析
4.RFM模型用户价值分析
5.商品销售情况分析
6.商品销售类目分析
2 数据读取与数据探索
2.1 数据说明
数据集包含了2014年11月18日至2014年12月18日之间,有行为的约100万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。
数据主要包括5个字段,用户ID,商品ID,商品类目ID,行为类型,时间戳。一共有12256906条记录。
2.2 数据读取
总共的数据有1亿左右,虽然pandas可以处理这么多的数据,但是电脑配置不够,所以这里只取了1200多万条数据。使用pandas读取数据只需要几秒钟的时间,Excel大半天都打不开。
2.3 数据探索
查看数据信息
1200多万的数据大小有561.1M,要是全部数据大小差不多有4G
查看是否有缺失值
user_geohash 缺失值过多,需做剔除处理
3 数据清洗
3.1 删除重复值
3.2 处理缺失值
3.3 数据一致性转换
4 数据分析
4.1 漏斗模型用户行为分析
a.上述分析说明,需要优化商品的推荐机制,优化用户搜索商品的效率;
b.提升用户从点击到收藏和加入购物车这一环节的转化率,这样才能最终提升用户购买的比例。
4.2 平台用户使用情况分析
4.3 时间维度用户行为分析
可以发现在双十二当天访问量达到顶峰,可以利用这个巨大的流量优势,提升用户购买的几率。
分别分析浏览和其他三种行为在一天的变化情况,可以发现:
a.用户从0点到6点处于一个休息状态,而从6点开始,到10点活跃的人数越来越多,10点达到了一个巅峰,然后又逐渐回落,预测是用户起床上班,利用路上通勤时间进行浏览以及购买,而到了上班时间,则只能抽空购物;
b.晚上6点到12点用户数量又开始激增,成交率也增加,证明用户下班,吃饭等等有较多的空闲时间进行购物了,22点之后浏览慢慢下降,是准备要休息了。
在用户的空闲时间安排营销活动,比如早上通勤时间,中午吃饭时间,晚上6-10点,能够提升用户成交率。
4.4 RFM模型用户价值分析
最近一次消费 (Recency)
消费频率 (Frequency)
消费金额 (Monetary)
a.重要价值用户是优质客户,可以有针对性地给这类客户提供VIP服务,比如现在的淘宝VIP会员卡等等;
b.重要挽留客户占比也很大,他们消费时间间隔较远,并且消费频次低,需要主动联系客户,调查清楚哪里出现了问题,比如通过短信,邮件,APP推送等唤醒客户;
c.重要保持客户,消费时间间隔较远,但是消费频次高,有可能就是需要买东西的时候,就高频购买,不需要就不再购物,对于这类客户,需要主动联系,了解客户的需求,及时满足这类用户的需求(提供优惠券促使消费);
d.重要发展客户,消费频次低,我们需要提升他的消费频率,可以通过优惠券叠加等活动来刺激消费。
4.5 商品销售情况分析
大量商品只被购买一次
用户浏览的商品和最终购买的商品存在着很大的差异,我们需要优化推荐系统,让用户真正找到自己想买的商品,将浏览量转换为购买量。
从浏览到加购/收藏的转化率较低。
收藏之后购买的高于加入购物车之后被购买的转化率。
a.收藏是比加购有更高转化率的途径,可以针对收藏夹的商品发放优惠券,促使转化;
b.用户收藏和加入购物车之后的购买率达到了35.8%,说明商品只要被用户喜欢和加入购物车,那就有相当大的几率被购买,所以我们应该采取相应措施,比如让客户去收藏和加入购物车,这样能够增大转化率。
4.6 商品销售类目分析
a.可以尝试将销量较低的商品和销量较高的商品捆绑销售,并且优化商品的展示,将畅销类的商品和非畅销品展示在一起,提升商品购买转化率;
b.优化商品的推荐算法,将流量更多地聚焦于畅销的商品,打造爆款的产品,并利用爆款产品带动整体商品类目的销售。
5 结论
1.需要优化商品的推荐机制,优化用户搜索商品的效率,提升用户从点击到收藏和加入购物车这一环节的转化率,这样才能最终提升用户购买的比例;
2.有过购买行为的用户占总用户的比例为88.8%,需要采取措施引流;
3.双十二当天访问量达到顶峰,可以利用这个巨大的流量优势,提升用户购买的几率。在用户的空闲时间安排营销活动,比如早上通勤时间,中午吃饭时间,晚上6-10点,能够提升用户成交率;
4.大量商品只被购买一次,用户浏览的商品和最终购买的商品存在着很大的差异,我们需要优化推荐系统,让用户真正找到自己想买的商品,将浏览量转换为购买量;
5.收藏是比加购有更高转化率的途径,可以针对收藏夹的商品发放优惠券,促使转化。用户收藏和加入购物车之后的购买率达到了35.8%,说明商品只要被用户喜欢和加入购物车,那就有相当大的几率被购买,所以我们应该采取相应措施,比如让客户去收藏和加入购物车,这样能够增大转化率;
6.可以尝试将销量较低的商品和销量较高的商品捆绑销售,并且优化商品的展示,将畅销类的商品和非畅销品展示在一起,提升商品购买转化率。优化商品的推荐算法,将流量更多地聚焦于畅销的商品,打造爆款的产品,并利用爆款产品带动整体商品类目的销售。