airbnb 短租数据探索

一、背景和目的

随着信息的透明化,越来越多的共享发生在陌生人之间。短租,共享空间的一种模式,不论是否体验过入住陌生人的家中,你都可以从短租的数据里挖掘有趣的信息。从阿里天池上获取Airbnb短租数据集,该数据集包括房源的房东、评论、位置、价格等详细信息。
Airbnb作为一个短租平台,房东、房源质量、租客是影响运营最重要的三个方面。因此,本报告主要探究:
1.房源的供需情况:房源供给情况分析;房源需求热度分析;评价分析

  1. 房东的属性决定房源的数量和质量,分析房东属性,挖掘房东潜力,为平台争夺市场做准备。

二、 数据来源与数据说明

1. 数据来源

数据均来源于 Airbnb 网站的公开信息,不包含任何个人隐私数据。

2. 数据说明

2.1 原始数据

原始数据集共5个文档


image.png

listings 数据为短租房源基础信息,包括房源、房东、位置、类型、价格、评论数量和可租时间等等。listings_detail中包含更多房源相关细节。
calendar 数据为短租房源时间表信息,包括房源、时间、是否可租、租金和可租天数等等。
reviews 数据为短租房源的评论信息。汇总版中仅包括房源 listing_id和评论日期。
reviews_detail 还包括评论相关的内容和作者信息。
neighbourhoods 数据为北京的行政区划。

2.2 初步整理

初步整理形成以下5个表,每个表约 28444条记录,数据来源于北京地区,时间范围:2010/8/25-2019年4/17
房源表 (listing_id)
房东表 (listing_id,host_id)
评论表(listing_id)
评论时间表(listing_id)
评论文本(listing_id,review_id)


image.png

三、数据清洗

image.png

四、数据分析

1. 总体情况

1.1 区域密度分布

image.png
房源区域分布:- 房源集中在海淀、朝阳等中心地区,向外逐渐稀疏
- 基本沿着地铁线分布,房源密集度跟行政区景点密集度成正比

1.2 房源上线时间

image.png
房源上线时间——根据最早的评论时间来看,房源上线时长集中在2年左右,极少有上线超过4年的老房源

1.3 房源地址是否准确?

image.png
整体房源位置的准确度不高,可能与房东发布房源无需房源方面的认证有关,建议增加房源真实性的核实

1.4 取消规则

image.png
整体取消政策比较宽松,若取消时距离入住时间至少还有14天,可免费取消预订。

2. 供需分析(什么样的房源热度更高?)

因无法取到房源的预订次数,因此将房源的每月评论数量视为用户的需求

2.1 评论数趋势(消费周期)

image.png
从2017年1月至2019年4月,airbnb消费热度逐渐上升。

image.png
可以看出,订房热度呈现轻微的季节性,1-4月订房较多,5-7月相对淡季。

2.2 行政区域×热度

image.png
从房源的供给上看,朝阳区、东城区、海淀区三个区域的房源占了60%以上。从需求上看,朝阳区、东城区、海淀区、丰台区、西城区、顺义区、房山区、石景山区热度高于均值。区域上整体供需比较匹配,西城区远高于整体水平,但房源供给低于平均水平,宜通过引导的方式,鼓励加大西城区的房源发布。

2.3 房间×热度

image.png
image.png

从总体来看,房间类型为整间的房源占比超过60%,共享间(合住间)供给较少,租客对于房源的喜好顺序为:整间>单间>共享(合住)间。房源供需匹配。分区域看,各个行政区域的房间类型供给大多和整体一致。朝阳区3种房型的均远高于其他区域。

2.4 房型×热度

image.png
公寓,高档公寓, 独栋房三种房型供给占了超过70%。平房,Loft,独栋房,高档公寓,公寓,家庭旅馆等房型的热度远高于整体水平。平房、Loft、家庭旅馆房源供给少,热度高,建议鼓励增加这几类房源的发布。

image.png
中心区域(海淀、朝阳、东城区等)主要以公寓,高档公寓, 独栋房三种房型为主。周边区域(怀柔区、密云县、平谷区等)以农家乐和独栋房为主,带有一些别墅、城堡。

2.5 价格×热度

image.png
100-300元和300-500元的房源占比超一半,1000元以上房源占比仅为8.7%, 500元以下房子为Airbnb主力房源;昌平区、怀柔区、延庆县、平谷县等非中心区域高价房源占比大,区域均价超过1000

image.png

整体需求来看,300-500元价位的房源热度最高,其他100元以上的房源,随着价格的升高房源需求降低。1000元是房源热度的分水岭,性价比是租客选择房源的重要因素,高价房源不受青睐。
分片区看,东城区、西城区、朝阳区1000元以下的房源热度高。平谷,怀柔,延庆等地区高价房源热度较高。
结合房源类型可以推测,中心区域租客是出于商务、购物、求医等场景,非中心片区租客更多是为了是旅游、团建。平台可以在搜索房源页面增加租房目的选项(如:商旅出差、团建、旅游)更精准地为用户推荐房源

2.6 房源名

image.png
总的来看,房东设置房源名时倾向于标明:周边配套设施(尤其是地铁)、周边景区、房子类型、装修风格。

image.png

而月均评论较高房源,名称更多描述地点而非房源本身,其中,天安门,南锣鼓巷,三里屯和故宫热度远高于其他地方。租客倾向于能一眼看出地点的房源,建议根据房东提交的地理位置,添加智能标题建议。并且在租客房源检索筛选页面增加“1km内是否有地铁”选项。

3. 评论分析

3.1 各项评分情况

image.png
从整体分数来看,消费者对于卫生状况满意度最低。从评价指标的标准差来看,卫生状况分数差异最大。平台有必要督促房东做改善房源的卫生状况,长期干净卫生分数低的房源,设定限制发布房源。

3.2 评论情感分析

image.png
分离中英文评论,用SnowNLP 快速进行评论数据情感分析。情感极性的变化范围是[-1, 1],-1代表完全负面,1代表完全正面。中文评论整体情感正面,租客满意度高。中英文评论得分都较为分散,有较多异常点。

image.png
从整体上看,游客的体验感知评价维度主要包括:房源质量、周围环境、房东评价及个性化体验四个方面。
房源质量方面主要涉及硬件设施、装修风格和卫生。周围环境方面,游客尤其注重房源选址附近的交通可达性及周边生活的便捷性。关于房东评价方面,房东友好程度会影响游客心情及旅游归属感。个性化体验、温馨舒适与自由自在的住宿氛围是游客在体验短租住宿过程中获得的重要感知。

分别选取情感得分高于均分的正面评论和情感得分异常低的负面评论。评论较为正面的原因是多方面的(房源质量、周围环境、房东):房东热情友好、反应及时;房间干净;位置好、交通便利、靠近地铁;给租客以温馨舒适的体验。
评论情感负面主要原因集中在房源质量本身和房东:房间或卫生间不干净、味道不好;没有wifi、空调、热水、暖气、等基本设施; 房东冷淡、回复慢;整体体验差,性价比不高。

4. 房东分析

4.1 整体情况

image.png

有发布房源的房东中,70%以上注册时长不超过4年,和房源上线时间一致。注册时长1年的仅9.24%,2-3年占50%以上,可以推测房东的存留情况不错。

超赞房东是指 “至少完成 10 次行程接待,或完成 3 次预订且总晚数达到 100 晚;回复率保持在 90% 或以上;预订取消率不超过 1%(即每 100 笔预订最多取消 1 次);总体评分保持在 4.8 分或以上 ” 的优质房东。有发布房源的房东中,超赞房东和非超赞房东的比例约为2:8,符合实际,可见超赞房东的评价标准比较科学合理。

image.png

超过80%的房东能在一个小时内回复租客,整体回复率高达95%,即使不是超赞房东回复率也有92%。
房东整体比较积极活跃。

4.2 房东-房源

image.png

47%的房东拥有的房源在5套以内,超过50%的房东拥有5套以上的房源。有63%的房东发布了北京的房源但所在地不在北京。建议平台为拥有较多房源的房东开发更专业化的房源管理功能,为房源和所在地不一致的房东提供完善的自助入住、房屋托管服务。

4.3 房东特性

image.png

从图中可以看出,爱彼迎的房东兴趣爱好主要集中在:旅行、美食、运动、电影、音乐、读书。他们大都有自己的职业和爱好,喜欢和不同的文化背景的人交朋友,乐于分享自己的生活。身兼多职的房东,个人爱好和职业为房间附加一定文化属性。
在旅游新模式之下,房东对于房客不再是简单接待,除了优质的住宿环境,房东还能为房客带来什么,特色服务就显得尤为重要。每一间房都有一个故事,不管是房东个人经历故事还是房间打造过程的故事,都在一定程度上代表着房间的文化。平台宜鼓励有文化特色的房源发布,引导房东更多分享自己的故事,赋予民宿更多的文化属性,进而吸引房客预订。

4.4 入住规则

image.png

多数房东会对租客提出以下要求:
1.保持屋内/厨房干净整洁。比如:退房时要倒垃圾/进屋时换鞋等 2. 限制抽烟/带客人/带宠物/限制出入时间 3. 爱护物品。造成物品损坏要赔偿或者扣除押金等 4. 不能打扰邻居/喧哗。
建议平台在发布房源页面添加“是否能带客人”,"押金金额"等选项,方便房东发布房源。为部分房东/租客提供清理房间增值服务、继续完善邻里调解服务.

五 竞品分析——小猪民宿

1. 基础数据对比

人群属性和爱好都比较相似,小猪短租的产品设计和运营策略可以被借鉴。


image.png

image.png

2. 产品对比

基于前面的数据分析,我们了解到租客主要关注:硬件设施、装修风格、卫生;交通和周边环境(尤其是地铁);房东及个性化体验。

2.1 硬件设施

小猪民宿把基础设施放在靠前的位置,并且在一个屏幕内就呈现了房源的基本信息(房型、床位、位置、地铁、配套设施、评分)而爱彼迎的需要下拉2次才能看到基础设施。基本信息排版过于分散。


小猪

爱彼迎
爱彼迎
爱彼迎

2.2 装修风格和个性化体验

小猪民宿在房东发布房源时引导房东填写三个部分的内容:房东的兴趣爱好、特色服务、房屋装修风格、周边情况。层次分明,切合租客需求。


小猪

airbnb引导房东填写房屋细节和周边环境,没有引导填写房东个人兴趣爱好和装修风格。且必填内容和选填内容存在交叉重复。


爱彼迎

爱彼迎

2.3 交通和周边环境

小猪民宿直接展示周边景点和地铁的距离,点击后跳转地图路线,直观方便。airbnb的周边信息由房东填写,比较混乱。


小猪

爱彼迎

小猪民宿在房源搜索页面直接给出“近地铁”筛选标签,airbnb没有这个筛选项。


小猪
爱彼迎

2.4 卫生

小猪短租将卫生评分直接显示在主页上,airbnb卫生评分需要二次点击才能看到。小猪短租app上有民宿保洁服务入口,房东房客都能预约。airbnb只向部分房东提供房源托管服务。


小猪
爱彼迎

2.5 房源推荐

小猪短租搜索房源时可以选择出游场景(商务出差、周边度假、家庭出游、情侣约会)为用户更精准推荐房源


小猪

六 结论及建议

1. 房源供需匹配

  • 数量上,房源集中在海淀、朝阳等中心地区,向外逐渐减少。整体供需比较匹配,西城区供不应求,宜通过引导的方式,鼓励加大西城区的房源发布。

  • 时间上,订房热度呈现轻微的季节性,1-4月订房较多,5-7月相对淡季。

  • 价格上,整体来看1000元以上高价房源不受青睐。中心区域500元以下房型更受欢迎,主要以公寓、高档公寓、独栋房为主。周边区域有高价房源更有市场,以农家乐和独栋房为主。平台可以在搜索房源页面增加租房目的选项(如:商旅出差、团建、旅游)更精准地为用户推荐房源。

  • 房间类型上,租客对于喜好顺序为:整间>单间>共享间。供需比较匹配。

  • 游客的体验感知评价维度主要包括:房源质量、周围环境、房东评价及个性化体验四个方面。周边环境方面,房源名称带有周边位置描述的热度更高,尤其关注周边是否有地铁。建议根据房东提交的地理位置,添加智能标题建议。并且在租客房源检索筛选页面增加“1km内是否有地铁”选项。房源质量上,卫生情况评分相对较低,平台有必要督促房东做改善房源的卫生状况。

  • 取消规则整体宽松,但房源位置的准确度不高,建议增加房源真实性的核实

2. 房东

  • 70%以上房东注册时长不超过4年,注册时长2-3年居多,和房源发布时长一致。房东回复率高,回复时长大多在一个小时内,整体比较活跃。超赞房东数量符合二八定律,评价标准合理。一半以上房东拥有超过5套房源,63%的房东发布了北京的房源但所在地不在北京。建议平台为拥有较多房源的房东开发更专业化的房源管理功能,为房源和所在地不一致的房东提供完善的自助入住、房屋托管服务。

  • 许多房东会对租客在带客、押金、邻居、卫生方面提出要求。建议平台在发布房源页面添加“是否能带客人”,"押金金额"等选项,方便房东发布房源。为部分房东/租客提供清理房间增值服务、继续完善邻里调解服务。

  • 平台宜鼓励房发布特色房源,分享个人故事,赋予民宿更多的文化属性,进而吸引房客预订。

你可能感兴趣的:(airbnb 短租数据探索)