淘宝APP用户行为数据分析
(一)数据理解
1.数据来源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1
本文从数据集中选取了2014年11月18日至2014年12月18日之间,共802758条行为数据,数据集中每一行代表一条用户行为,共有6个字段。
2.列字段如下:
User_id 用户ID
Item_id 商品ID
behavior_type
用户行为类型(包含点击,收藏,加购物车,购买4中行为,分别用1,2,3,4表示)
User_geohash 地理位置
Item_category 商品种类
Time 用户行为发生时间
(二)提出问题
1、整体用户的购物情况
pv(总访问量)、日均访问量、uv(用户总数)、有购买行为的用户数量、用户的购物情况、复购率分别是多少?
2、用户行为转化漏斗
点击—加购物车—收藏—购买各环节转化率如何?购物车遗弃率是多少?
3、购买率高和购买率为 0 的人群有什么特征
4、基于时间维度了解用户的行为习惯
5、基于RFM模型的用户分析
(三)数据清洗
(三)数据清洗
1.缺失值处理
User_geohash字段表示地理位置信息,由于数据存在大量空值,且对数据分析意义不大,因此不对该列进行处理(三)数据清洗
1.缺失值处理
User_geohash字段表示地理位置信息,由于数据存在大量空值,且对数据分析意义不大,因此不对该列进行处理
2.数据一致化处理
字段time包含(年月日)和小时两种属性,为了方便分析,将该字段分成日期date和小时time 2列
由于behavior_type列的四种行为分别用1,2,3,4表示点击,收藏,加购物车,购买四种行为,为了方便查看数据,将1,2,3,4替换为’pv’, ’fav’ ,’cart’ ,’buy’
查询表结构,发现date列不是日期类型,将其修改为date类型
(四)构建模型和分析数据
1.总体用户购物情况
(1)pv(总访问量)
(2)日均访问量
(3)uv(用户总数)
(4)有购买行为的用户数量
(5)用户的购物情况
(6)复购率:产生两次或者两次以上购买的用户所占比列
2.用户行为转化漏斗
在购物环节中收藏和加购物车没有先后之分,所以将这两个环节放在一起作为购物环节的一步
3.购买率高和低的人群各有什么特征
购买率高的用户特征:
从结果可以看出,购买率高的用户点击率并不高,他们一般点击不超过5次就直接购买,由此可以推断出这些用户为理智型消费者,有明确的购物目标,很少会被商家广告或者促销吸引
购买率低的用户特征:
从结果可以看出,购买率低主要有2个因素,其一点击次数少,可能原因是网购欲望不强烈,可以通过广告等加以引导;其二是点击收藏次数较多,但是购买率低,这类用户可能正在为促销活动做准备,价格敏感,购物难度较大
4.基于时间维度了解用户的行为习惯
1.一周中用户活跃时段分布
由于第一周和第五周数据不全。因此这两周的数据不进行分析
从结果可以看出,每周用户活跃稳定,每周五会有小幅降低,但是周末逐渐回升。其中周五用户活跃度突增,这是有双十二电商活动引起的
2.一天中用户的活跃时段分布
可以看出,每日0点到5点用户活跃度快速降低,降到一天中的活跃量最低值,6点到10点用户活跃度快速上升,10点到18点用户活跃度较平稳,17点到23点用户活跃度快速上升,达到一天中的最高值。
5.基于RFM模型找出最有价值客户
RFM模型是衡量客户价值和客户创造力的重要工具和手段
R-Recency(最近一次购买时间)
F-Frequency(消费频率)
M-Money(消费金额)
但由于没有相关金额数据,只能通过R,F对客户价值打分
(1)R-Rcency
统计客户最近发生购买行为的日期距离2014-12-19间隔几天,再对间隔进行排名,间隔越少,客户价值越大
(2)计算F-Frequency
先统计每位用户的购买频率,再对购买频率进行排名,频率越大,客户价值越大,排名就越靠前
(3)对用户进行评分
查询有购买行为的用户的数量
对3326名有购买行为的用户按照排名进行分组,共划分为四组,对排在前四分之一的用户打4分,排在前四分之一到四分之二(即二分之一)的用户打3分,排在前四分之二到前四分之三的用户打2分,剩余的用户打1分,按照这个规则分别对用户时间间隔排名打分和购买频率排名打分,最后把两个分数合并在一起作为该名用户的最终评分
通过打分可以了解每位顾客的特性,从而实现差异化营销。比如对于 user_value = 44 的用户,为重点用户需要关注;对于user_value = 41 这类忠诚度高而购买能力不足的,可以可以适当给点折扣或捆绑销售来增加用户的购买频率。对于 user_value = 14 这类忠诚度不高而购买能力强的,需要关注他们的购物习性做精准化营销。还可以通过每个月对用户的评分变化,推测客户消费的异动状况,对于即将流失的客户,通过电话问候、赠送礼品、加大折扣力度等有效的方式挽回客户。
(五)结论及建议
1、总体转化率只有 1%,用户点击后收藏和加购物车的转化率在 5% ,需要提高用户的购买意愿,可通过活动促销、精准营销等方式。
2、购买率高且点击量少的用户属于理智型购物者,有明确购物目标,受促销和广告影响少;而购买率低的用户可以认为是等待型或克制型用户群体,下单欲望较少且自制力较强,购物难度较大。
3、大部分用户的主要活跃时间在10点到23点,在19点到23点达到一天的顶峰。每周五的活跃度有所下降,但周末开始回升。可以根据用户的活跃时间段精准推送商家的折扣优惠或促销活动,提高购买率。
4、通过 R 和 F 的数据对用户行为进行打分,对每位用户进行精准化营销,还可以通过对R 和 F 的数据监测,推测客户消费的异动状况,挽回流失客户。