南昌较高端酒店价格影响因素浅析(一)

写在前面:有关北上广深的酒店价格数据分析已经看到过很多,缺鲜有看到过南昌市酒店价格影响因素分析的,遂尝试简单分析南昌市较高端价格影响因素。若读者发现其中有误,劳请指出,定虚心接受。

一、背景:案例以南昌市较高端酒店(四星级&五星级酒店)为研究对象,通过统计分析部分因素对酒店价格的影响。

二、数据来源:案例数据来自途牛网,为博主于三月末尾采集。采集内容为途牛网数据库中南昌市所有酒店信息共5091条记录,经数据筛选清洗,有效的“较高端酒店”数据共86条记录,数量较少。数据中共包含9个变量,其中,酒店价格为因变量(这里我们统取预定起价的日均价),将酒店自身因素、评价因素等作为自变量来进行探讨。

数据变量说明表
变量类型 变量名 详细说明 取值范围 备注
因变量 酒店价格

定量数据

单位:元

126~1880 主要研究对象
自变量 酒店因素 酒店名称 文本数据 - -
酒店地址 文本数据 - -
酒店地区 定性数据 - -
装修时间 定性数据 新/旧装修 过多空值,舍弃变量
评价因素 评价数 定量数据 0~340 -
卫生评分 定量数据

满分5分

≥4.5高评

分,其余

为低评分

-
位置评分 定量数据 -
服务评分 定量数据 -
设施评分 定量数据 -
总评分 定量数据 -

 

三、描述性分析

对变量进行描述性分析,来初步地判断酒店价格的影响因素

(一)因变量:酒店价格

案例中,酒店预定价格最高的是位于洪城路87号的南昌鑫顺祥国际大酒店,仅有豪华套房可以订购,价格为1880元,综合评分为4.2;预定价格最低的是位于迎宾大道1089号的桂花村大酒店,经济标准房最低价126元,综合评分达到了4.8分。由酒店价格分布直方图可以看到,酒店起定价格大多集中在200~600元,均值为415元。大致来说,相对于北上广深,南昌市的较高端酒店起定价较低,且仅有少量酒店起定价较高。

南昌较高端酒店价格影响因素浅析(一)_第1张图片 酒店价格分布直方图

(二)自变量:酒店因素

酒店因素包括酒店名称、酒店地址、酒店地区、装修时间。将酒店的地理位置转换成经纬度并转换成分布热力图后,发现酒店大多都分布在经典、景点、交通枢纽、政府机关等附近。

南昌较高端酒店价格影响因素浅析(一)_第2张图片 酒店分布热力图

(三)自变量:评价因素

评价因素包括评价数与评分。从下图中可以看到,酒店的评论数量多少对酒店价格影响不大;此外,酒店的综合品质越高,酒店的价格也会相对增长,这一点也较为符合人们的常识,不过差异是否显著还需在建模中进行研究。

南昌较高端酒店价格影响因素浅析(一)_第3张图片       低评价数                                                                                                       高评价数
南昌较高端酒店价格影响因素浅析(一)_第4张图片        低评分                                                                                                           高评分

(四)其他变量

倘若能够获取不同酒店周边不同POI的数量,亦可分析一定范围内不同种类的POI数量对酒店价格的影响。

本次获取数据新旧装修样本不足,倘若能获取足够的样本也可以用来分析其对价格的影响。

四、简单总结

综上,通过本案例的描述性分析,可以推测,酒店因素与评价因素均可对酒店的价格产生影响。

你可能感兴趣的:(数据分析)