阿里天池新人赛——短租信息(1)数据说明

表中数据类型

第一个表listings

属性名 记录的内容
id 用于标识房间的号码,一个房间有独一份的id
name 房东给房间起的名字
host_id 房东的的编号
host_name 房东的名字
neighbourhood_group 所属组织(不知道为什么大多数都为空值)
neighbourhood 地区
latitude 维度
longitude 经度
room_type 房间的类型
price 价格
minimum_nights 最少要住几夜
number_of_reviews 有多少评论
last_review 上一次入住
reviews_per_month 平均每月住几天
calculated_host_listings_count 有多少间房
availability_365 一年有多少天是可用的

阿里天池新人赛——短租信息(1)数据说明_第1张图片

第二个表calendar_detail

属性名 记录的内容
listing_id 用于标识房间的号码,一个房间有独一份的id
data 该信息统计的时间
available 现状是否可用【(T/F)来表示】
price 原价
adjusted_price 现价
minimum_nights 最小租住时间
maximum_nights 最大租住时间

阿里天池新人赛——短租信息(1)数据说明_第2张图片
特说明,表中头有大量的数据原价格现价格均为511不为异常值
 

第三个表neighbourhoods

这个表好像是用来记录位置的信息的,没什么内容直接上图
阿里天池新人赛——短租信息(1)数据说明_第3张图片
 

最后一个表reviews_detail

这个表是用于记录评论信息的表,

属性名 记录的内容
listing_id 用于标识房间的号码,一个房间有独一份的id
id 这个id现在还没有明白做什么的
date 入住时间
reviewer_id 用户id
reviewer_name 用户的名字
comments 评论的具体内容

 
 
 
 

声明

本博客所有内容均为本人学习而用,如有帮助到的人自当感激,请勿随意转用。

你可能感兴趣的:(pandas数据分析)