一、 分析背景与目的
1. 背景
爱彼迎(Airbnb)是全球领先的民宿预订平台,用户可通过网络或手机应用程序发布、搜索度假房屋租赁信息并完成在线预定程序。自成立以来,其业务已遍布191个国家、65,000个城市,重塑了传统酒店行业,为旅行者们提供了特别的入住选择与体验。
2. 分析目的
作为一家国际化且发展迅速的新兴企业,爱彼迎成功的背后是否仍存在可以提升与改进的空间?根据AARRR模型,我们将主要从用户画像,渠道推广,以及各环节转化率三个方面对问题进行分析与改进。
针对分析目的,我们提出以下三个目标:
1. 构建爱彼迎新注册用户群体画像。
2. 评估爱彼迎现有的各个推广渠道的效果。
3. 分析订单各个环节的转化率与流失率从而发现整体流程中的薄弱点并对此进行改进。
二、 分析思路
1. 用户画像分析
· 用户性别
· 用户年龄
· 用户语言(所在地)
· 用户目的地偏好
2. 推广渠道分析
· 每月新增用户及新增订单量
· 不同推广渠道的注册量及转化率
· 不同设备的注册量及转化率
· 不同推广内容的注册量及转化率
3. 订单转化漏斗分析
· 活跃用户占比
· 下单用户占比
· 支付用户占比
· 复购用户占比
三、数据概览
1. 数据来源
数据集名称: Airbnb New User Bookings
数据来源: https://www.kaggle.com/c/airbnb-recruiting-new-user-bookings/data
数据集中包含两张数据表, 其中user表包含新注册用户数据, sessions表中包含用户行为数据。
2. 数据理解
数据表一:user
id: 用户ID
date_account_created:帐户创建日期
date_first_booking:首次预订日期
gender:性别
age:年龄
signup_method:注册方式
language:语言偏好
affiliate_channel:营销方式(SEM等)
affiliate_provider:营销来源,例如google,craigslist
first_affiliate_tracked:在注册之前,用户与之交互的第一个营销内容
signup_app:注册来源
first_device_type:注册时设备的类型
first_browser:注册时使用的浏览器名称
country_destination:订房国家
数据表二:sessions
user_id:客户id,与users表中的“id”连接
action:用户行为
action_type:用户行为类型
action_detail:用户行为具体
device_type:用户使用的设备
四、数据清洗
1. 找出并删除重复值
user表中id应为主键,因此需要确保主键的唯一性,删除重复id。
此代码返回213451行数据,和原始数据行数相等,所以没有重复值。
2.缺失值处理
通过查询发现每列缺失值分别为
date_first_booking: 124543个
gender: 95688个
age: 87990个
first_affiliate_tracked: 6065个
first_browser: 27266个
action_type: 721679个
action_detail: 721679个
对于date_first_booking(首次预定日期)列的缺失值结合业务理解为用户注册账号后并未进行过预定,gender(性别)以及age(年龄)列的缺失值推测是由于用户在注册时选择不填写这两项信息,其他列的空值推测是由于前端未统计到数据。
处理方法: 在进行查询时通过where子句筛选。
3.异常值处理
有29条数据中预定日期早于账户创建日期,删除这些数据。
age列中最大值为2014,最小值为1,原因可能是用户未真实填写信息造成的,将年龄范围不在5~85岁间的数据更新为0。
五、用户画像分析
1. 用户性别分布
女性用户数量为63026,男性为54429。
从整体性别分布上来看,男女用户性别比例差别不大,女性用户占比比男性用户多8%左右。
2.用户年龄分布
从年龄分布来看,25-45的中青年为主要群体,这部分群体有更多精力与兴趣旅游出行,随着年龄的增加,用户人数逐渐变少,符合正常规律。
3. 用户语言分布(所在地分布)
绝大部分用户群体为说英语的国家,说明主要用户群体集中在欧美地区,其次为中国地区。
4. 用户目的地分布
从图中可以看出,美国作为最吸引人的旅游目的地吸引了80%左右的用户,其次是德国。
六、推广渠道分析
1. 每月新增用户以及新增订单量分析
从图中可以看出:
1. 2011年以前,由于处于成立初期,爱彼迎用户增长速度较为缓慢。从2012年开始用户增长速度显著提高。
2. 新增用户以及新增订单数在每年的7-9月迎来增长高峰,在9-12月有下降趋势。推测原因为7-9月夏季为旅游旺季,大部分用户选择这个时间出行,除此以外,大部分学校会在这个时候放假,而9-12月随着天气变冷和开学,出行计划减少。
3. 2013年底至2014年开始,爱彼迎新用户数大幅度增加,订单数也呈明显上升趋势。推测原因为2014年一月爱彼迎通过分析及预测用户的使用行为和留存情况上线了全新的用户推荐系统,吸引了更多新用户。
2. 不同推广渠道用户质量
从图中可以看出:
1. direct渠道来源的用户数量最多,推测用户从不同渠道了解到信息后根据需求直接搜索或到应用商店直接下载。
2. 除了direct渠道外,google渠道的用户数量最多,其中sem营销方式的用户数最多。
3. 总体来看seo营销方式转化率最好,facebook_seo和google_seo转化率都有不错的表现。
4. google content的转化率表现低于平均水平,应额外注意。
3.不同推广内容用户质量
从图中可以看出:
1. linked注册用户数最多,其次是omg。
2.除去注册量很少的marketing,linked的转化率是最高的,其次是omg
4. 不同注册设备用户质量以及时间趋势
从图中可以看出:
1. 2014年以前,使用pc端注册的用户远多于移动端。推测是由于2014年以前智能手机的普及程度还不高。
2. PC端注册的用户中Mac系统多于微软系统,且Mac系统用户转化率也高于微软系统,移动端中苹果注册用户多于安卓注册用户。
3. 苹果移动端中ipad注册用户转化率高于iPhone,安卓移动端中Android Tablet 转化率高于Android phone。Android phone 注册的用户是移动端中转化率最低的,需要额外注意。
4.2010-2014期间,随着智能手机的普及和发展,移动端注册用户占比逐年增加。
七、订单转化漏斗分析
此部分主要通过对sessions表中的用户行为进行漏斗转化分析,从而找出订单转化过程中的薄弱环节。
1. 有行为的用户总数
对sessions表中不同的user_id进行统计,得到有行为的用户总数。
查询结果为:86053
2. 活跃用户总数
对sessions表中行为数超过或等于10次的user_id进行统计。
查询结果:70593 占比:82%
3. 下单用户总数
对sessions表中action_type为reservations的用户数进行统计。
查询结果:5935 占比:8.4%
4.支付用户总数
对sessions表中action_type为payment_instruments的用户数进行统计。
查询结果:4888 占比:82.4%
5.复购用户总数
对sessions表中action_type为payment_instruments且次数超过一次的用户数进行统计。
查询结果: 2313 占比:47.3%
从图中可以看出:
活跃用户到下单用户这一环节转化率最低,仅为8.4%。需要分析是否由于推荐房源无法满足用户的需求,或是有同类竞争产品上线造成了客户流失,并对运营策略做出调整与改进。
八、结论与建议
1.结论
用户画像:
1. 从用户性别分布来看,男性与女性用户人数差别不大,女性略多于男性。
2. 从用户年龄分布来看,主要用户群体为中青年,年龄集中在 25-45岁之间。
3. 从用户语言分布来看,大部分用户集中在欧美国家,其次是中国。
4. 从用户目的地分布来看,80%的用户选择美国作为出行目的地,其次是德国。
推广渠道:
1. 用户数在2011年以前增长速度较为平缓,2011年后增长速度显著提高。
2. 新增用户数和订单数呈现季节规律,每年7-9月为增长高峰
3. 除用户直接从应用商店下载app外,google为用户的最大来源平台,其中除content方式用户转化表现较差外,seo和sem都有不错的用户转化率。
4. seo营销方式转化率在所有营销方式中最好,转化率可达到45-50%。
5. 从推广内容分析来看,linked用户数和转化率都是最高。
6. 不同设备注册的用户中,苹果系统注册的用户数量以及转化率都高于安卓系统。
7. 随着智能手机的普及,移动端用户占比越来越高。
转化漏斗:
活跃到下单环节转化率最低,仅有8.4%的活跃用户最终选择下单。
2.建议
用户画像:
1. 对于25-45岁群体进行精细化运营,通过不同维度分群,满足不同用户的需求,因而提高精准度与用户转化率。
2. 扩展不同国家的市场,通过改善运营内容满足不同国家用户的需求。
推广渠道:
1. 每年7-9月为出行预订高峰,在这段时间应加大推广力度与投入。
2. Google除content方式转化表现较差外,其他方式都较为理想,后期可以增加google平台的推广力度,同时也应调整content方式的质量。
3. seo方式转化率最好,可考虑适当增加该方式的推广投入或占比。
4. 推广内容来说,linked和omg在用户数目和转化率方面表现都较好,应考虑增加这两种营销内容占比。
5. 针对安卓系统用户数和用户转化率都较低的情况来说,建议调查此现象是否由于安卓客户端app质量不稳定或运行速度慢等其他原因导致用户体验感较差。
6. 由于越来越多用户选择移动端app,因此后期应更注重移动端app的质量,不断提高用户体验感受。
转化漏斗:
针对活跃用户到下单用户这一环节用户流失严重的情况,应对房源推荐系统进行完善,针对不用的用户群体推荐不通的房源以满足需求,同时可增加更多优质房源为用户提供更多选择。除此以外,对网站的交互体验,界面内容等做出一定程度的改善与优化,从而提高下单率。