UserBehavior为淘宝用户行为的数据集,数据集包括了2017年11月25日至2017年12月3日之间,有大约82万随机用户的用户行为(行为包括点击pv,购买buy,加购物车chart,收藏fav)数据。
通过对用户行为的分析,主要实现下面两个目的:
1、为客户提供更精准的隐式反馈,帮助用户更快速找到商品;
2、为提高公司的交叉销售能力,提高转化率,销售额,提升公司业绩。
主要从以下四个维度对用户行为进行分析和建议:
1、用户行为间的转化情况分析:利用漏斗模型分析用户从商品浏览到购买整个过程中,常见的电商分析指标,确定各个环节流失率,提出改善转化率的建议。
2、用户的行为习惯分析:利用pv、uv等指标,找出用户活跃的日期以及每天的活跃时间段。
3、用户类目偏好分析:根据商品的点击、收藏、加购、购买频率,探索用户对商品的购买偏好,找到针对不同商品的营销策略(购买率较高的类目和产品,优化产品推荐)。
4、用户价值分析:找出最具有价值的核心用户群,针对这个群体推送个性化推送,优惠券或者活动。
逻辑如下:
主要使用工具:Navicat for MySQL,MySQL, power BI。
阿里云天池:
https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1
使用Navicat导入功能,导入后结果如下图,这里会出错卡在导入步骤的5/8位置。
使用代码直接导入,结果如下图,未出现上述卡住现象。
本数据主要包含了大概82万条数据,每一行分别表示一个用的行为,由用户ID(User_ID)、产品ID(Item_ID)、类目ID(Category_ID)、行为类型(Behavior_type)、时间戳(Timestamp),行为类型又分为点击(pv)、收藏(fav)、加购物车(chart)、购买(buy)。
Timestamp列,无法直接分析,需要将其划分为三列,分别为时间,日期,小时。
--添加新列,根据Date_time返回日期时间
--添加新列,根据Date返回日期时间
--添加新列,根据Time返回小时
由于项目背景是需要对2017年11月25日至2017年12月3日之间用户行为数据集进行隐式反馈推荐问题的研究,所以需要对不在这个时间内的数据进行删除。
--先检查是否有在2017-11-01和2017-11-20之间的时间值。
--删除掉这段时间以外的行
使用SQL语句发现,有出现重复字段。
全字段重复有两行,下面去重方法并不对全字段的奏效,我采用的是直接删除,删除数据仅4行针对现有的380万行数据影响较小。
对所有列进行了计数查询后,发现‘Timestamp’字段有null值,然后我们删除空值所在的列。
数据清洗完毕。
导入数据集大小预览:
结果均为先使用sql分析数据,获得分析结果,然后将分析结果导出到excel或者power BI中进行可视化。
a、总体uv、pv、人均浏览次数、成交量
b、日均uv、pv、人均浏览次数、成交量
使用power BI处理数据后将其导出后分析对应的每个指标与时间之间的关系。
c.用户整体行为数据
d、用户的复购率和跳失率
2017年11月25日至2017年12月3日之间,用户的复购率为66.4%且流失率为0,说明淘宝对用户有较大的吸引力使用户停留且用户的忠诚度非常高。可以进一步提高复购率,鼓励用户更高频次的购物。
a、用户转化率及流失分析
上图统计了各个行为的总数量,点击后,到加购物车或者收藏概率在3%-6%之间,而最后真正购买的概率降到了2.4%,说明用户的行为在浏览了商品详情页后出现了大量的流失。但是用户是否也是在点击后产生了大量的流失呢?
对此,对各个用户行为类型的用户数进行了统计,并使用漏斗转化模型进行了处理,建立了用户转化漏斗图。
上图可以看出,用户并未点击后就大量流失,并且最后付费用户比例达到了69%,购买率达到了7成,说明用户的购买意愿较为理想。结合用户行为数统计推断用户的点击行为远远超过了收藏和加购物车的行为,说明用户有较大的可能在购物时有“货比三家”的习惯。
所以针对大部分点击后转化到加购物车和收藏的概率较低有较大的提升空间,APP可以通过优化推荐商品的功能和筛选商品的功能,让用户不用浏览较多的网页获得心仪的商品。
那么再回到用户转化漏斗图,从浏览到购买每个环节的转化率又是多少?为什么收藏比加入购物车少?
由于用户点击后到最后购买有四条不同的路径,分别为:
点击——购买(用户留存)
点击——收藏——购买(用户留存)
点击——加购物车——购买(用户留存)
点击——收藏和加购物车——购买(用户留存)
从四种购买行为的留存,可以看出用户点击后,若存在后续行为则主要是加入购物车,其次是收藏和加购物车,再接下来是收藏,除此之外还与一部分用户是点击后直接购买的。可以着重研究一下各类路径用户购买的什么产品以及用户的标签,通过优化商品推荐和精准运营加强这部分的转化。
推断在收藏的用户转换率较低的原因在于用户在点击时较为喜欢此商品或者说活动时间还未开始,通过提醒用户等方式精准运营提高这部分用户的购买率。
最后,对用户从收藏到购买,加购物车到购买和收藏和加购物车到购买的转化分析来看,加购物车到购买的转化率最高达到了34.79%,说明直接加入到购物车最后购买的概率较高,故引导客户加入购物车及时购买可以提高购买转化率。
这里主要是对用户购买时间点进行分析,找出用户活跃的时间段规律。
a、行为习惯分布(日均)
上图可以看出,在研究日期范围内,用户活跃度均比较平稳,但是在12月2日和12月3日出现小幅度的增长,其中点击量和收藏,尤其是加购物车增幅增大,但是购买没有较大增幅,分析其原因是由于周末空余时间较多,用户流量增大;再加上双12很多活动预热导师用户提前添加收藏和加购物车,是双12批量购买的前置动作,符合常规预期。
b、一天内用户行为习惯的分布
对一天内的用户行为分析可以看出在每天的1点至5点用户活跃度骤减,6点至10点迅速攀升,10点到18点趋势平稳,然后快速上升,在21点时达到高峰,到23点开始下降,这与大部分人的作息规律相一致,据此可以考虑在20点至23点间举行促销活动或者上架新商品来提高转化率和曝光率。
统计所有商品的购买次数,同时找到购买次数、浏览次数、收藏次数和加入购物车次数最多的商品。
a、商品销售情况分析
上图看出,用户购买的商品总共有4001种,购买次数在1次的商品占绝大部分,其次是购买次数为2商品,未出现购买次数集中的商品,说明商品的售卖主要是依靠商品的长尾效应,而非爆款商品。
b、商品品类浏览的top20
上图可以看出,4756105这类商品的浏览次数是最高的。
c、商品品类收藏top20
上图发现收藏的次数最多的商品品类与浏览次数最多的商品品类相同都是4756105,说明点击和收藏同步几率很大。
d、商品品类加购物车top20
商品加购物车的品类中有15种在点击top20中,有14种在收藏top20中,这些商品都具有较高的吸引力。
e、商品品类购买top20
通过以上四个树状图对比发现,点击、收藏、加购的top5中均均有一个商品品类即4145813,在商品购买同屏以内,说明点击、收藏、加购所吸引的用户注意力和流量并不能很好的转化为实际的商品销量,这是销量增长的突破点。
此外, 我们发现商品销量的主要集中在几个品类,所以可以根据商品的销量来优化商品的展示,提高商品销售额。
在本次分析中由于没有提供金额,所以这次分析主要以R、F两个维度对用户群进行分析。
首先,定义一下本次分析用户群的分类标准:
F(3-4) |
重要保持客户 |
重要价值用户 |
F(1-2) |
重要挽留客户 |
重要发展用户 |
|
R(1-2) |
R(3-4) |
由于数据集的时间仅有9天,设定一下规则,对每个用户最近一次购买时间和12月03日之间的间隔设立等级:
间隔>7天为1;
间隔在5-7天为2;
间隔在3-4天为3;
间隔在0-2天为4;
同样对购买频次设定以下规则,对每个用户购买次数设立等级:
购买次数在1-10之间为1;
购买次数在10-20之间为2;
购买次数在20-300之间为3;
购买次数在>30之间为4。
根据上面最后一次购买时间和购买次数的等级规则,用四象限法划分出来的用户群如下:
根据用户群体划分,可以群体数最多的是最重要发展客户,针对这部分用户可采取针对性营销策略提高其复购率,增加购买频次。
总体来看用户从点击到购买的的转化率达到了69%,达到了比较高的水平;细分来看,对用户从收藏到购买,加购物车到购买和收藏和加购物车到购买的不同路径转化分析来看,加购物车到购买的转化率最高达到了34.79%,说明直接加入到购物车最后购买的概率较高,故引导客户加入购物车及时购买可以提高购买转化率。而从点击直接到购买的转化率较低,仅为7.2%,故这部分转化率是一个提高的重点。针对这一环节的建议有:
1、优化平台的搜索匹配度和推荐策略,提高筛选精度,对搜索和筛选的结果排序的优先级进行优化。
2、可以给用户提供同类产品比较的功能,让用户不需要多次的返回搜索结果点击查看,方便用户确定心仪的产品,增加点击
后续行为的转化率。
3、优化收藏到购买的擦操作过程,增加用户收藏并加购的频率,提高转化率。
1、用户活跃度最高的时间段是每天的21点-23点,因此可以将促销活动安排在每周的晚上这个时间段,此时流量最高,通过引流并转化。
2、在研究9天内共有2个周末,第一个周末用户活跃度未有明显变化,推测双11活动刚过去,用户的消费需求和意愿不高;第二个周末用户活跃度有明显变化,尤其是加购物车变化最为明显,推测与双12活动预热有关,故建议扩大时间范围对周末对用户活跃度的影响,来进一步确定周末推出营销活动是否奏效。
可以看出目前商品主要靠长尾效应来增加销量,而不是爆款带动销量。但是通过对商品品类的分析可以看出吸引用户注意力的商品用户购买转化率并不高,这是一个提高销量的突破口,建议可从以下几方面着手:
1、商品在详情页突出展示用户感兴趣的信息,优化信息呈现的方式,减少用户的时间成本。
2、从商品本身考虑,根据客户反馈对商品进行改进优化,增加点击后的购买率。
3、对客户购买率较高的商品优先显示,满足用户的购买需求。
4、对某些点击量较高但是购买率不高的的商品可采取直播带货的方式进行讲解促销,增加客户购买欲望。
对不同类型的用户群可采取不同的营销策略,达到高效率精准营销的效果。
1、对重要价值客户,需要重点关注,提高用户的满意度,增加留存;
2、对重要发展客户和重要保持用户,可以采取适当的折扣或者捆绑销售来增加用户的购买频率;
3、对重要挽留客户,需要关注他们的购物习惯做精准营销,换醒其购物欲望。
在整个分析过程中,不管选取多少维度数据,画多么精美的图形,得出多么精妙的结论,归根结底还是要有最后真正落地解决问题的措施,而这也是本次数据分析报告最大的不足,但是需要经验需要一个累积的过程,希望下一个数据分析报告能够取长补短,查缺补漏,内容更加充实,继续加油!!!