淘宝用户行为分析-探索性分析EDA

背景介绍

淘宝是中国深受欢迎的电商平台,经常网购的人少不了逛逛淘宝,随便看看有什么想买的或者有目的想买什么,在逛淘宝的过程中,我们会留下足迹。通过这些足迹,也就是用户的行为,我们可以对这些行为进行分析挖掘。

使用的工具是Python,主要用到了Numpy,Pandas、Matplotlib及Msno这几个包。

数据来源于阿里云天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46

1 提出问题

本文主要围绕这几个点展开:

1.漏斗模型用户行为分析

2.平台用户使用情况分析

3.时间维度用户行为分析

4.RFM模型用户价值分析

5.商品销售情况分析

6.商品销售类目分析

2 数据读取与数据探索

2.1 数据说明

数据集包含了2014年11月18日至2014年12月18日之间,有行为的约100万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。

数据主要包括5个字段,用户ID,商品ID,商品类目ID,行为类型,时间戳。一共有12256906条记录。

2.2 数据读取

总共的数据有1亿左右,虽然pandas可以处理这么多的数据,但是电脑配置不够,所以这里只取了1200多万条数据。使用pandas读取数据只需要几秒钟的时间,Excel大半天都打不开。

2.3 数据探索

查看数据信息

1200多万的数据大小有561.1M,要是全部数据大小差不多有4G

查看是否有缺失值

user_geohash 缺失值过多,需做剔除处理

3 数据清洗

3.1 删除重复值

3.2 处理缺失值

3.3 数据一致性转换

4 数据分析

4.1 漏斗模型用户行为分析

a.上述分析说明,需要优化商品的推荐机制,优化用户搜索商品的效率;

b.提升用户从点击到收藏和加入购物车这一环节的转化率,这样才能最终提升用户购买的比例。

4.2 平台用户使用情况分析

4.3 时间维度用户行为分析

可以发现在双十二当天访问量达到顶峰,可以利用这个巨大的流量优势,提升用户购买的几率。

分别分析浏览和其他三种行为在一天的变化情况,可以发现:

a.用户从0点到6点处于一个休息状态,而从6点开始,到10点活跃的人数越来越多,10点达到了一个巅峰,然后又逐渐回落,预测是用户起床上班,利用路上通勤时间进行浏览以及购买,而到了上班时间,则只能抽空购物;

b.晚上6点到12点用户数量又开始激增,成交率也增加,证明用户下班,吃饭等等有较多的空闲时间进行购物了,22点之后浏览慢慢下降,是准备要休息了。

在用户的空闲时间安排营销活动,比如早上通勤时间,中午吃饭时间,晚上6-10点,能够提升用户成交率。

4.4 RFM模型用户价值分析

最近一次消费 (Recency)

消费频率 (Frequency)

消费金额 (Monetary)

a.重要价值用户是优质客户,可以有针对性地给这类客户提供VIP服务,比如现在的淘宝VIP会员卡等等;

b.重要挽留客户占比也很大,他们消费时间间隔较远,并且消费频次低,需要主动联系客户,调查清楚哪里出现了问题,比如通过短信,邮件,APP推送等唤醒客户;

c.重要保持客户,消费时间间隔较远,但是消费频次高,有可能就是需要买东西的时候,就高频购买,不需要就不再购物,对于这类客户,需要主动联系,了解客户的需求,及时满足这类用户的需求(提供优惠券促使消费);

d.重要发展客户,消费频次低,我们需要提升他的消费频率,可以通过优惠券叠加等活动来刺激消费。

4.5 商品销售情况分析

大量商品只被购买一次

用户浏览的商品和最终购买的商品存在着很大的差异,我们需要优化推荐系统,让用户真正找到自己想买的商品,将浏览量转换为购买量。

从浏览到加购/收藏的转化率较低。

收藏之后购买的高于加入购物车之后被购买的转化率。

a.收藏是比加购有更高转化率的途径,可以针对收藏夹的商品发放优惠券,促使转化;

b.用户收藏和加入购物车之后的购买率达到了35.8%,说明商品只要被用户喜欢和加入购物车,那就有相当大的几率被购买,所以我们应该采取相应措施,比如让客户去收藏和加入购物车,这样能够增大转化率。

4.6 商品销售类目分析

a.可以尝试将销量较低的商品和销量较高的商品捆绑销售,并且优化商品的展示,将畅销类的商品和非畅销品展示在一起,提升商品购买转化率;

b.优化商品的推荐算法,将流量更多地聚焦于畅销的商品,打造爆款的产品,并利用爆款产品带动整体商品类目的销售。

5 结论

1.需要优化商品的推荐机制,优化用户搜索商品的效率,提升用户从点击到收藏和加入购物车这一环节的转化率,这样才能最终提升用户购买的比例;

2.有过购买行为的用户占总用户的比例为88.8%,需要采取措施引流;

3.双十二当天访问量达到顶峰,可以利用这个巨大的流量优势,提升用户购买的几率。在用户的空闲时间安排营销活动,比如早上通勤时间,中午吃饭时间,晚上6-10点,能够提升用户成交率;

4.大量商品只被购买一次,用户浏览的商品和最终购买的商品存在着很大的差异,我们需要优化推荐系统,让用户真正找到自己想买的商品,将浏览量转换为购买量;

5.收藏是比加购有更高转化率的途径,可以针对收藏夹的商品发放优惠券,促使转化。用户收藏和加入购物车之后的购买率达到了35.8%,说明商品只要被用户喜欢和加入购物车,那就有相当大的几率被购买,所以我们应该采取相应措施,比如让客户去收藏和加入购物车,这样能够增大转化率;

6.可以尝试将销量较低的商品和销量较高的商品捆绑销售,并且优化商品的展示,将畅销类的商品和非畅销品展示在一起,提升商品购买转化率。优化商品的推荐算法,将流量更多地聚焦于畅销的商品,打造爆款的产品,并利用爆款产品带动整体商品类目的销售。

你可能感兴趣的:(淘宝用户行为分析-探索性分析EDA)