淘宝用户数据分析

目录

第一章、绪论... 2

1.1.研究背景及现状... 2

1.1.1.研究背景... 2

1.1.2.国内外研究现状... 2

1.2.本论文研究的目的意义... 3

第二章、相关的理论基础... 4

2.1.RFM模型... 4

2.2.AARRR漏斗模型... 4

第三章、数据分析... 5

3.1.数据来源... 5

3.2.数据介绍... 5

3.3.数据预处理... 5

3.4.用户行为分析... 6

3.4.1.用户整体行为分析... 6

3.4.2.用户消费行为分析... 9

3.5.用户转化漏斗分析... 14

3.6.用户时间维度分析... 17

3.6.1.用户行为周期分析... 17

3.6.2.用户行为时段分析... 18

3.6.3.用户量(UV,交易用户数)时段分析... 19

3.7.用户价值分析... 20

3.7.1.用户价值分析(RFM分析)... 20

3.7.2.对付费用户进行分类... 21

3.8.用户行为数据中商品信息分析... 23

3.8.1.热门商品top. 23

3.8.2.热门商品类目top. 25

3.8.3.帕累托分析(贡献度分析)... 26

第四章、结论建议... 27

4.1.通过AARRR模型对用户使用的各个环节建议... 27

4.2.不同时间尺度下用户的行为活跃规律建议... 28

4.3.通过RFM用户价值分析的建议... 28

4.4.用户行为数据中商品信息的建议... 29

摘要

        先从阿里天池获得淘宝用户数据集,接着通过数据库工具(SQL SERVER 2019)和EXCEL进行数据预处理——对数据进行筛选和清洗,然后结合RFM模型,AARRR漏斗模型等相关理论对用户的购买行为、用户的价值以及商品的不同维度进行分析,并把分析结果图表可视化,从图表中发现用户购买的规律,对用户和商品进行分类,并最终得出结论。根据结论,针对不同类型用户和商品的特点,给淘宝商家相应的营销建议,以达到降低商家的营运成本,增加商家的营业收入的目的。

关键词:RFM模型,AARRR漏斗模型,用户行为。

第一章、绪论

1.1.研究背景及现状

1.1.1.研究背景

随着互联网信息技术的快速发展和普及化,电子商务不断得到扩大,以及各个企业应用电子商务网络平台的推广和相关政策法规对电子商务行业市场发展的重视,电子商务已经开始逐渐改变人们日常的生活观念,渐渐地影响国人的消费理念。

据中国电子商务研究中心发布的调查报告统计数字显示,2019年下半年中国网上零售市场交易额达到 103200亿人民币,增长 20.56%。2019年国内网络零售用户规模达7.32亿人,较2018年的5.7亿人,同比增长28.42%。以上数据表明,随着电子商务市场的繁荣和快速发展,使得网络购物已经成为一种拉动消费的重要渠道,中国的电子商务企业获得了前所未有的发展机遇和挑战。

然而,在繁荣发展的电子商务市场背后也出现了两类难题:

一是,突出表现在规模庞大的用户行为信息的合理利用上,如何高效、准确、及时地发现潜在客户。因为用户在网站上的浏览方式表达了用户购物的习惯、爱好、购买意向等潜在利用信息;而对于一个电子商务企业来说,利用好这些用户行为信息,从中发现潜在客户群体变得十分重要。如果挖掘出某些客户群体为网站上潜在的价值客户,就可以对这部分潜在客户推行新一轮的个性化服务战略,使他们尽快转换成为真正的客户群体。这对于企业来说,就代表着交易订单次数的增多,利润的提高。在大数据时代,谁可以最大限度地挖出并留住潜在客户成为许多电子商务企业客户关系管理的核心。

二是,如何吸引客户、提高服务质量和满意度,更好地提升消费者的购物体验和服务个性化。当下随着电子商务市场的快速发展,市场竞争日益激烈,哪个电商企业能在更短时间发现及获得客户更多的信息,它就能掌握更多经济资源。

1.1.2.国内外研究现状

       本文主要从客户行为分析、潜在客户挖掘两个大方面对国内外研究现状进行梳理分析。

(1)用户行为分析研究

Lopez Jose等人利用Hopfield人工神经网络技术对电力行业客户行为数据进行了分类分析。牛文博等[33]人以 B2C电子商务交易过程为基础,以客户行为分析的目标出发,建立基于B2C电子商务环境下的客户行为分析模型,并且对B2C

环境下的客户消费心理和行为进行了深入分析,提出了 B2C 环境下的客户保留策略。

(2)潜在客户挖掘研究

       陈晓琴应和不响应客户两大类,接着利用建立响应客户预测模型,实现潜在客户的分类识别效果。齐丽丽等引入粗糙集的思想对 ID3 算法加以改进,用以挖掘预测高价值的潜在客户,并提出了获取零售业中潜在客户信息的营销策略。

1.2.本论文研究的目的意义

世界经济全球化步伐的不断加快以及科技信息技术的加速演化和发展,使电子商务企业迈进了一个崭新的经济活跃时代,同时也使电子商务行业竞争变得越来越激烈,如:企业之间良性竞争发生重大改变,电子商务网站增加与淘汰加速,客户流失率大等。

目前电子商务领域最大的优势就是易于获取规模庞大的客户行为数据,而且这些数据信息每天都在成千万倍地增长。若是把用户在网站发生的浏览行为和购买行为的数据进行整合处理,则可以收集到海量复杂的客户购物产生的行为信息。如果能有效利用这些客户行为信息数据,电子商务企业就可以进行相应的营销调整策略,不断获得新客户资源。

因为这些行为信息可以较为准确描述潜在客户的行为特征,有效反映出客户的潜在购物心理和购物倾向。对于一个电子商务企业来讲,不断获得新客户是企业持续成长的核心竞争力,而且潜在客户群体是无限的,有很大的开发和增值潜力。在竞争激烈的电子商务市场环境中,如何充分利用这些行为信息进行挖掘和提取客户的行为特征,就能更高效、准确、及时地识别出潜在客户。

总而言之,认真对待客户行为分析将使电子商务企业掌握领先其它竞争对手的重要手段,同时也意味着企业将赢得更多市场的销售份额。

潜在客户是电子商务企业今后发展的强大驱动力,重视潜在客户的挖掘和管理,企业就可以长期立足于市场当中,并且在激烈的市场竞争中取胜。相反,如果仅仅了解和关注潜在客户,不重视该类型客户群体的开发,那么企业将会在激烈的市场竞争中处于被动地位。

现代互联网技术、数据库技术和数据挖掘技术的飞速发展,商家与客户一对一的需求营销服务已经成为可能,并逐渐成为各大在线购物网站个性化服务的主要策略。除此之外,移动互联网时代的全面到来,使得电子商务市场发展环境越来越激烈,同时消费者获取信息的途径和方式将变得更加容易,主动性和能动性的需求也更加强烈,而且也具有个性化的选择空间。

因此,随着电子商务不断发展,如何在海量的客户行为数据中有效地获取新的客户,如何辨别获得的客户是否为高价值的潜在客户,企业就能够开展有针对性和目的性的市场营销策略,就可以大大降低服务的成本,同时也可以不断开展客户引导服务措施,更重要的是可以提前确定客户购买的意向,大大降低营销服务费用,并及时调整相应决策来捕获客户的个性化需求,提高客户在线的购物体验及服务满意度,从而牢牢地吸引住自己的客户群。

所以,研究如何从海量信息资源中快速准确地获取潜在的客户知识,并为其提供个性化服务,成为各大电子商务网站追求的热点,也是一种信息知识发现模型的新型识别技术,具有较高的实际应用研究价值和现实意义。

第二章、相关的理论基础

2.1.RFM模型

在众多客户关系管理的客户分析模式中,RFM (Recency,Frequency,Monetary)分析是比较受欢迎的分析方法,是衡量客户价值的重要评价指标。 RFM 模型最初由 Hughes 于 1994 年提出,曾被广泛应用于直销领域,它包括 R( Recency) 、F( Frequency) 、M( monetary) 3个变量。

R 表示最近一次购买时间,也叫近度( Recency) ,理论上最近一次购买时间越近的用户对提供即时商品或服务也最可能有反应,因此 R 越小越好; F 表示消费者在某个时间段中的购买次数,也叫频度( Frequency) ,经常购买的消费者越有意向再次购买,客户忠诚度高,因此 F 越大越好; M 表示某个时间段中客户购买的总金额,也叫额度( Monetary) ,购买金额越大,给企业带来的价值越大,因此 M 越大越好,即客户的价值与 R 成反比,与 F、M 成正比。

企业可以使用 RFM模型测量客户价值,并使用 RFM 模型指标对客户进行分类。 RFM 模型计算客户价值公式如式( 1) :

RFM=ωR ×R+ωF ×F+ωM ×M ( 1)

其中 RFM 指客户的综合 RFM 值,ωR、ωF和 ωM分别是 R、 F 和 M 在计算客户价值的权重,R、F 和 M 在本文中的含义,如表 1 示。

表 1 RFM 模型及各指标在文中的含义

R( 近度)

F( 频率)

M( 总金额)

客户在最后一次消费的日期距离分析点的时间

客户一定时期内的购物频率

客户在一定时期内购买产品的总金额

2.2.AARRR漏斗模型

AARRR(用户增长漏斗)模型是产品从最开始的外部获客,转向产品内部的使用体验,再转向外部传播的这么一个过程。分为:

1.获取(ACQUISITION):自然流量的获取;运营推广的获取;社群自传播。

2.激活(ACTIVATION):进入产品后的操作引导;产品本身是否能激起用户的探索欲。

3.留存(RETENTION): 活跃用户的留存;沉默用户的激活。

4. 转化(REVENUE):产品内的变现体验路径;是否在完成指定路径和操作后,能够再次继续吸引用户使用。

5. 传播(REFER):正向传播。

第三章、数据分析

3.1.数据来源

阿里天池

3.2.数据介绍

Id

用户身份

Item

商品名称

Behavior

用户行为

Category

商品类别

Data

时间

3.3.数据预处理 

1.数据选择

通过将原始数据通过EmEditor工具导入Excel,由于数据集说明中写的是本数据集的日期范围是11月25日至12月3日,所以剔除这日期以外的数据。

behavior_type列的数据大多是非购买信息,不利于后面RFM分析。

2.异常值处理

通过观察数据集的四分位数,总数,平均值,方差等,发现数据集并无异常值存在。

3.重复值处理

用户的购买行为由于时间精确到小时,确实会存在少量用户在一小时内重复购买或浏览统一商品的行为,因此不对此部分数据进行处理。

4.一致化处理

将原有列名简化,为了方便展示,将pa、fav、cart、pay改为数字点击,收藏,加入购物车,购买。

同时观察数据集,时间数据是时间戳类型,不直观,也不方便分析,通过修改数据的格式,把时间改为年月日时分的类型。

时间数据中的日期和小时存在于一列中,需要将其分开以便分别研究每日和一段日期内的数据变化,故将其拆分成'时间'列数据拆分为'日期'列和'小时'列进行分析。

完成数据清洗后的数据:

淘宝用户数据分析_第1张图片

 

3.4.用户行为分析

3.4.1.用户整体行为分析

对于用户行为,为了方便展示,将数字1,2,3,4(1=浏览、2=收藏、3=加入购物车、4=购买)改为pv、fav、cart、pay

淘宝用户数据分析_第2张图片

 

代码:

UPDATE user SET behavior=REPLACE(behavior,1,'pv');

UPDATE user SET behavior=REPLACE(behavior,2,'fav');

UPDATE user SET behavior=REPLACE(behavior,3,'cart');

UPDATE user SET behavior=REPLACE(behavior,4,'pay');

淘宝用户数据分析_第3张图片

 

得到新表:

淘宝用户数据分析_第4张图片

 

代码

SELECT COUNT(DISTINCT id) AS UV,(SELECT COUNT(*) FROM user WHERE behavior='pv') AS PV,(SELECT COUNT(*) FROM user WHERE behavior='pv')/COUNT(DISTINCT id) AS 'PV/UV'

FROM user

利用AARRR模型分析用户行为,此处数据主要涉及用户刺激和购买转化的环节,通过用户从浏览到最终购买整个过程的流失情况,包括浏览、收藏、加入购物车和购买环节,一个月内的各项指标如下

访问用户总数(UV)7870

页面总访问量(PV):724806

淘宝用户数据分析_第5张图片

 

跳失率=只点击一次浏览的用户数量/总用户访问量

代码:

SELECT COUNT(*)

FROM (SELECT id

FROM user GROUP BY id

HAVING COUNT(behavior)=1) AS A

淘宝用户数据分析_第6张图片

 

当统计时间为30天时,只有61个人只浏览过一个页面就离开了APP,占总访问量806757数量的0.007%,占比几乎可以忽略不计,说明淘宝拥有足够的吸引力让用户停留在APP中。

3.4.2.用户消费行为分析

用户总行为数漏斗计算:

代码:

SELECT behavior,COUNT(*)

FROM user

GROUP BY behavior

淘宝用户数据分析_第7张图片

 

behavior

count

占比

cart

44367

5.5%

fav

22110

2.7%

pay

16374

2.0%

pv

724806

89.7%

由于收藏和加入购物车都为浏览和购买阶段之间确定购买意向的用户行为,且不分先后顺序,因此将其算作一个阶段,当然有一部分用户是直接购买而未通过收藏和加入购物车,但也说明大多数用户浏览页面次数较多,而使用购物车和收藏功能较少。

独立访客漏斗模型计算:

代码:

SELECT behavior,COUNT(DISTINCT id) AS '用户数'

FROM user

GROUP BY behavior

ORDER BY COUNT(DISTINCT id) DESC

淘宝用户数据分析_第8张图片

 

上面是每一步用户行为的独立用户数,可以看到用户中有16374的付费用户,占全体的2%,用户付费转化率相当不高。

分析一个月中每天的用户行为:

代码:

SELECT date,SUM(CASE WHEN behavior='pv' THEN 1 ELSE 0 END)AS '浏览数',

SUM(CASE WHEN behavior='fav' THEN 1 ELSE 0 END)AS '收藏数',

SUM(CASE WHEN behavior='cart' THEN 1 ELSE 0 END)AS '购物车',

SUM(CASE WHEN behavior='pay' THEN 1 ELSE 0 END)AS '付费数'

FROM user

GROUP BY date

ORDER BY date

淘宝用户数据分析_第9张图片

 

 不同商品种类的用户行为:

统计所有商品的购买次数,同时找到购买次数、浏览次数、收藏次数和加入购物车次数最多的商品。

淘宝用户数据分析_第10张图片

 

基于RFM理论找出有价值的用户:

我们首先统计出用户购买商品的最大值和最小值

数据源中没有相关的金额数据,因此通过 R 和 F 的数据对客户价值进行打分。

R-最近购买时间

用户数据的时间范围为一个月,最近购买时间的区间为0-30,将其分为5档,37~39,35~37,33~35,31~33,29~31分别对应评分1到5。

代码:

CREATE VIEW pay_B AS

SELECT id, DATEDIFF('2017-11-25',MAX(date)) AS B FROM user WHERE behavior='pay' GROUP BY id;

SELECT id, (CASE WHEN B BETWEEN 25 AND 30 THEN 0

WHEN B BETWEEN 37 AND 39 THEN 1

WHEN B BETWEEN 35 AND 37 THEN 2

WHEN B BETWEEN 33 AND 35 THEN 3

WHEN B BETWEEN 31 AND 33 THEN 4 ELSE 5 END) AS R

FROM pay_B

淘宝用户数据分析_第11张图片

 

F-消费频率

付费用户中消费次数从低到高为1-161次,将其分为5档,1~4,4~7,7~10,10~13,13~100分别对应评分1到5。

代码:

CREATE VIEW pay_F AS

SELECT id, COUNT(*) AS A FROM user WHERE behavior='pay' GROUP BY id;

SELECT id, (CASE WHEN A BETWEEN 1 AND 32 THEN 0

WHEN A BETWEEN 1 AND 4 THEN 1

WHEN A BETWEEN 4 AND 7 THEN 2

WHEN A BETWEEN 7 AND 10 THEN 3

WHEN A BETWEEN 10 AND 13 THEN 4 ELSE 5 END) AS F

FROM pay_F

ORDER BY F DES

淘宝用户数据分析_第12张图片

 

3.5.用户转化漏斗分析

利用AARRR漏斗模型分析用户消费路径变化:

本文运用电商角度,选取阿里天池项目中的淘宝App用户行为数据利用Excel进行数据可视化分析。

此用户行为数据集通过对用户关键行为的埋点获取的日志数据,包含用户、商品、行为、时间等信息,而看似简单的几个维度,通过各种数据分析手段,便能从不同角度挖掘其蕴含的价值。

下面通过AARRR漏斗模型对用户使用的各个环节进行漏斗流失分析,此数据主要涉及用户刺激和购买转化的环节,通过用户从浏览到最终购买整个过程的流失情况,包括浏览、收藏、加入购物车和购买环节。

获取用户(ACQUISITION):由于数据中并没有给出每个用户第一次的登陆的时间,我们暂且把浏览行为视为用户的获取。

激活用户(ACTIVATION):用户行为从浏览到购买阶段之间,确定有购买意向的用户行为途径有4种:点击-购买;点击-收藏-购买;点击-加购-购买;点击-收藏-加购-购买。

对商品购买路径转化率进行分析如下图所示,点击购买率=商品仅点击后购买量/商品仅点击量,收藏购买率、加购购买率与收藏且加购购买率同上。

淘宝用户数据分析_第13张图片淘宝用户数据分析_第14张图片

淘宝用户数据分析_第15张图片淘宝用户数据分析_第16张图片

淘宝用户数据分析_第17张图片

 

        可以看出,有收藏且加购行为的购买率0.792%和仅加购用户的购买率0.714%相较另外两者更高,因此,可以推测,用户的加购行为会在一定程度上可以提高购买率。

        留存用户(RETENTION):通过去重后得到用户量和交易用户数的数据来进行可视化和漏斗分析如下所示。

淘宝用户数据分析_第18张图片

 

淘宝用户数据分析_第19张图片

        可得使用淘宝的用户中有41%的为交易用户,通过收藏与加购后的付费转化率为92.24%相当高。

        可见淘宝的留存相对而言较为稳定,让用户保提高持使用淘宝电商平台的频率相比而言更加重要。

        转化(REVENUE):分析全部的点击量、收藏量、加购量、购买量指标得用户当日行为数占比如下图所示。

淘宝用户数据分析_第20张图片

 

 

        从上图可见90%的淘宝用户的行为为,2%的淘宝用户的行为才为购买,同时所有的从点击浏览到有购买意向的用户行为转化率的数据总和仅为2.273%,当然有一部分用户是直接购买,但这也说明大多数用户以浏览页面为主而购买转化较少,此处为转化漏斗中需要改善和提高的环节。

        传播(REFER):淘宝本身用户基数相当庞大,知名度高,在一二线城市的用户基本已经达到饱和,传播工作需要针对的三四线城市的渠道下沉。

3.6.用户时间维度分析

通过研究用户在不同时间尺度下的行为规律,找到用户在不同时间周期下的活跃规律

3.6.1.用户行为周期分析

以日为单位对用户行为进行分析,由于浏览量与其他行为不在同一个量级,故将浏览量置于次坐标轴展示。

淘宝用户数据分析_第21张图片

 

 

        可以看出,加购量与点击量几乎呈正相关趋势,收藏数与点击数相关性也较好,而购买量则与其他量没有呈现出明显的相关性。同时点击量、收藏量、加购量和购买量在11月25日、11月26日和12月2日、12月3日上升明显,尤其在12月2日、12月3日,经过查找得知以上均为周末。相比之下,12月2日与12月3日点击量较高推测是由于周末和双十二近邻的缘故,当天淘宝开始为“双十二”活动进行预热,开启商品精选活动,因此吸引了更多的点击量。

        可知周末的各项指标都优于周内,周六周日用户尤为活跃,用户有更多的时间可以逛淘宝,用户有充足的精力,购买能力增加。因此一些营销活动应当在周六周日进行;收藏与加购数在双12前一星期内上升最快,说明用户在活动前一星期是最容易产生购买决策的时候,应该加大推送力度。

3.6.2.用户行为时段分析

        以小时为单位对用户行为进行分析,取各天各时段标准化的用户行为数据,用excel进行数据可视化分析。

淘宝用户数据分析_第22张图片

 

 

        从用户行为时段图可以看出,平时一天中有两个高峰期,分别为10时到13时和19时到23时左右,这符合人们的日常作息时间,也是用户点击量行为的高峰期,是淘宝用户访问app的活跃时间段,此时用户加购量也随之增加,而用户在下午1点的成交率都为6%左右相对较高。

因此,如果商家想以增长曝光度,获得更多流量为目的,可以在19点到23点之间做活动,如果是以提高营收为目的的活动,则可以在10时左右开始。

淘宝用户数据分析_第23张图片

 

 

 

由上图可见,虽然夜间虽然用户流量高,但成交量却一般,说明淘宝对于用户而言有一定的消遣属性。因此,一方面淘宝可以提高自身产品的趣味性让自身成为用户的消遣工具,另一方面,可在该时间段进行一些活动比如直播等提高商品优惠来释放用户的消费潜能。

淘宝用户数据分析_第24张图片

 

        由用户行为图分析,用户的购买与点击收藏加购相比,上升幅度并不明显,说明用户有想要购买的产品,但是碍于各种原因并没有下单,推测应该是想等更优惠或者资金充裕的时候购买,所以建议推送相关优惠卷以及推出相关用户花呗等免息活动来促使用户消费。

3.6.3.用户量(UV,交易用户数)时段分析

        以小时为单位对标准化的用户量进行分析如下图:

淘宝用户数据分析_第25张图片

 

        实际用户量最高为10时左右,商家可在这时间内以提高营收为目的做活动,在这个时间段投入营销更有可能取得更高收益。同时商家可在10时到13时和19时到23时左右进行活动,提高曝光度,获得更多流量。针对高峰期进行营销活动收益最高,此时使用人数最多,活动容易触达用户,营销活动的形式可以通过促销、拼团等形式进行。

3.7.用户价值分析

3.7.1.用户价值分析(RFM分析)

        由于不同用户对公司带来的收益是不一样的,而且根据二八定律,20%的有价值用户能带来80%的收益,因此需要对用户进行价值评价,找到最有价值的用户群,并针对这部分用户进行差异化的营销。

        这里用 RFM 模型对用户进行评价:

(1)R——Recency(最近一次购买时间)

        R指用户上一次消费的时间,距离上一次购物时间最近的顾客通常在近期响应营销活动的可能性也最大,对于APP而言,很久没有购物行为可能意味着用户放弃了APP的使用,重新唤起用户也需要更多的成本。

(2)F-Frequency(消费频率)

        F指用户在某段时间内的购物次数,消费频率越高意味着这部分用户对产品的满意度最高,用户粘性最好,忠诚度也最高。

(3)M-Money(消费金额)

        M指用户在某段时间内的购物金额,这也是为公司带来价值的最直接体现,而消费金额较高的用户在用户总体中人数较少,却能创造出更多价值,是需要重点争取的对象。

        这三个维度互相关联,反映了每个用户的现在价值和潜在价值,将每个维度分成5个区间进行评分,通过计算分数找到最有价值的用户,并对用户进行分类,可以有针对性的不同类型用户采用不同的营销策略。

        RFM模型找出最具价值的核心付费用户群

        我们首先统计出用户购买商品的最大值和最小值,数据源中没有相关的金额数据(本文假设M值低于平均值),因此通过 R 和 F 的数据对客户价值进行打分。

        R-最近购买时间

        用户数据的时间范围为一个月,以2018年1月1日为参照时间,用户购买时间距离参照时间将其分为5档,每2天为一档,分别对应评分1到5。如下表:

业务含义

1

2

3

4

5

最近交易距离当前天数(粘性)

37~39

35~37

33~35

31~33

29~31

F-消费频率

        付费用户中消费次数从低到高为1-72次,将其分为5档,1-4,4-7,7-10,10-13,13-100分别对应评分1到5。如下表:

业务含义

1

2

3

4

5

累计单数(忠诚度)

1~4

4~7

7~10

10~13

13~100

3.7.2.对付费用户进行分类

(1)求出R、F的平均值

   R-mean

F-mean

3.961659567

1.403593258

2)对客户进行分类

客户类型

最近交易距离当前天数(粘性)

累计单数(忠诚度)

潜力客户

新客户

一般维持客户

流失客户

用户划分的阙值暂选为R、F的平均值

↑表示高于平均值

↓表示低于平均值

经过分类汇总,得到各类型客户的人数,如下表:

淘宝用户数据分析_第26张图片

 

潜力客户

新用户

一般维持客户

流失客户

1287

2427

186

1499

淘宝用户数据分析_第27张图片

 

从中我们可以得到用户的RFM分数,用户ID为122338823的用户R和F评分都为4分,是体系中的最有价值用户,需要重点关注,并且活动投放时需谨慎对待,不要引起用户反感。对于R值为4而F值为0的用户,用户粘性不强而消费时间间隔较短,运营活动可以重点针对这部分用户,提高用户使用产品的频率,可以通过拼团打折、积分兑换等活动唤起用户注意力。

我们提取出评分最高的用户行为数据,发现该用户每天都产生了购买行为,且从未使用过收藏功能,购物车的使用频率较高,并且购买行为每隔一致两周会达到一个高峰期,可以根据该用户的活跃规律进行相关活动的推送,由于商品种类数据为脱敏数据,很遗憾此处无法分析该用户购买的商品类型。

3.8.用户行为数据中商品信息分析

3.8.1.热门商品top

淘宝用户数据分析_第28张图片

 

淘宝用户数据分析_第29张图片

 

淘宝用户数据分析_第30张图片

 

淘宝用户数据分析_第31张图片

 

       分别对点击量、收藏量、加入购物车量和购买量前十的商品大类进行分析。可以看出点击量、收藏量、加入购物车和购买量前几名较后几名差距并不大,说明没有爆款的出现。

3.8.2.热门商品类目top

淘宝用户数据分析_第32张图片

 


淘宝用户数据分析_第33张图片

 

淘宝用户数据分析_第34张图片

 

淘宝用户数据分析_第35张图片

 

根据四者韦恩图可以看出,点击、收藏与加购前十品类的重合度较高,说明对于品类商品而言,如果能吸引许多用户,那么,商品的购买转化率就不会低。

3.8.3.帕累托分析(贡献度分析)

分析购买量前80%销量商品品类的占比,后20%的销量商品品类的占比。我们只要花费少量精力和时间经营好累计占比达到80%的商品品类,就能显著提升业绩,没必要花费更多的精力和时间营销剩下的商品品类。

先求出各类别商品的购买量从大到小排序,并求出累计占总数的比例。购买量的累计比例与商品品类的累计比例的变化如下。

淘宝用户数据分析_第36张图片

 

       通过计算发现,前80%的购买量由前77.14%的商品品类产生。上图显示的结果并不符合二八定律,80%的下单量并不是由20%的商品带动的。这也说明了,互联网环境下,以淘宝为代表的电商平台,其商品售卖主要是依靠商品的长尾效应,并非爆款商品的带动。

第四章、结论建议

4.1.通过AARRR模型对用户使用的各个环节建议

1.获取用户(ACQUISITION)建议:多运营推广的获取与社群自传播获取用户。

2.激活用户(ACTIVATION)建议:从用户消费习惯看,加购后成交率较点击购买和加入收藏购买成交率更高。

因此,对于淘宝而言,可增加用户将商品加入购入车的入口,优化加入购物车和收藏按键的触达,让用户在滑屏时也能方便触达,在商品的收藏界面可添加加购入口,来增加加购功能使用的次数;

对于商家而言,可设置加购优惠,提高用户加购率,从而提高购买率,激活用户产生购买行为。

3.留存用户(RETENTION)建议:淘宝的留存相对而言较为稳定,因此让用户保提高持使用淘宝电商平台的频率相比而言更加重要。

4.转化(REVENUE)建议:此外为转化漏斗中需要改善和提高的环节。建议可以通过优化电商平台的搜索匹配度,优化商品搜索的准确度和聚合能力;

优化推荐策略,对搜索结果排序优先级进行优化,主动根据用户喜好来推荐相关的商品;

在商品详情页的展示上突出用户关注的重点信息,精简信息流的呈现方式,减少用户寻找信息的成本来提高购买转化率,以提高用户的购买转化率。     

5.传播(REFER)建议:淘宝在一、二线城市的用户基本已经达到饱和,传播工作需要针对的三四线城市的渠道下沉。

而在这些用户价格敏感度高的地区针对其特性开展类似拼多多的拼团转发和打折促销活动,可以扩大这部分用户的使用率和转化率。

4.2.不同时间尺度下用户的行为活跃规律建议

一周内:周末的各项指标都优于周内,周六周日用户尤为活跃,用户有更多的时间可以逛淘宝,用户有充足的精力,购买能力增加。因此一些营销活动应当在周六周日进行;在活动前一星期是最容易产生购买决策的时候,应该加大推送力度。

一日内:平时一天中有两个高峰期,分别为10时到13时和19时到23时左右,而在下午1点的成交率更高。

针对高峰期进行营销活动收益最高,因此如果商家想以增长曝光度,获得更多流量为目的,可以在19点到23点之间做活动,此时使用人数最多,活动容易触达用户,营销活动的形式可以通过促销、拼团等形式进行。

如果是以提高营收为目的的活动,则可以在10时左右开始,在这个时间段投入营销更有可能取得更高收益。

虽然夜间用户流量高,但成交量却一般,说明淘宝对于用户而言有一定的消遣属性。因此,一方面淘宝可以提高自身产品的趣味性让自身成为用户的消遣工具,另一方面,可在该时间段进行一些活动比如直播、推送相关优惠卷、以及推出相关用户花呗等免息活动、提高商品优惠来促使用户消费,释放用户的消费潜能。

4.3.通过RFM用户价值分析的建议

结论:

    通过RFM分析付费用户,把用户分为潜力用户、一般维持用户、新用户和流失用户。

建议:

使用RFM模型对客户群进行划分,对不同的客群采用差异化策略管理,达到精准营销:

对于潜力用户,关注并保持, 继续提升这部分客群满意度,增加留存;

对于一般维持用户,及时通过邮件、短信或者客户端提醒,召回客户;或者,用会员权益或者发放优惠券的形式促进消费次数;

对于新用户,一方面应该优化推荐算法,分析其购物习性和商品偏好,精准投放广告,让用户看到喜欢的商品;另一方面,应该提升广告创意和吸引力,以唤醒他们的购买意愿。

4.4.用户行为数据中商品信息的建议

结论:

根据点击量、收藏量、加入购物车量和购买量为依据,先找出前十的商品,可以发现前几名较后几名差距并不大,说明没有爆款的出现;再找出前十的商品类别,发现前十品类的重合度较高,说明对于品类商品而言,如果能吸引许多用户,商品的购买转化率就不会低。

但是也可以看出点击量、收藏量、加入购物车量第一的商品品类,购买量却跌到第六,购买量第一的商品品类,点击量、收藏量、加入购物车量却不是第一,说明不同商品品类转化率差异较大。同样,热点商品也存在这样的问题。

其次,通过帕累托分析,可以得出如下结论:

前80%的购买量由前77.14%的商品品类产生。不符合二八定律,说明80%的下单量并不是由20%的商品带动的。这也说明了,互联网环境下,以淘宝为代表的电商平台,其商品售卖主要是依靠商品的长尾效应,并非爆款商品的带动。

建议:

  1. 保持前十品类商品的销售量;
  2. 推出新商品,吸引消费者注意力,加大营销力度,提高商品购买转化率;
  3. 开发点击量、收藏量或加入购物车量较多的商品品类,提高购买转化率,如促销活动等;
  4. 长尾效应的确能带来一部分收益,但是,繁多的种类对于商家来说其实是一种经营负担。二八定律告诉我们,商家其实可以通过打造爆款商品来获利。可以提高产品质量,在宣传上增大力度(直播、微淘、引流到其他平台),展现上突出产品优势等。

你可能感兴趣的:(数据分析,数据挖掘,big,data)