# (1)读取酒店数据_2021_04_09.xlsx
# (2)查看“评分”的格式,并分别进行升序和降序排序
# (3)对酒店按照价格进行排名,计算“油尖旺”地区的均价。
# (4)对酒店数据进行描述性统计,并求所有价格的均值方差,最大最小值,中值。
# (5)计算评分和价格之间的的相关系数,协方差
# (6)按照评分降序排序,评分相同时按价格升序排序。
# (7)计算一下,评分小于3分的酒店数量和占比。
# (8)计算一下,酒店评分大于等于4分的酒店的价格均值。
# (9)计算出每个地区的酒店占总酒店数量的比例。
# (10)找出酒店评分人数排名前20的酒店,并计算他们的价格均值。
# (11)查看酒店分布的类型数量和地区数量,并统计各个类型和地区包含的酒店数量。
# (12)用数据透视表,计算每个类型的酒店的评分人数总数量。
# (13)用数据透视表,计算每个类型的酒店价格的均值和标准差
# (14)用数据透视表,计算每个地区酒店价格和评分的最大值和最小值
# (15)用数据透视表,计算每个地区和类型的酒店的评分的均值和标准差
# (16)选取上述题目中的五个题目(或部分相关数据),进行绘图可视化操作。
1.pandas查看某列字段类型
df[''].dtype
2.pandas的数据按照升序排序
df.sort_values(by ='')
3.pandas的数据按照降序排序
df.sort_values(by ='',ascending = False)
4.pandas两列数据的相关系数,协方差
相关系数 df[['','']].corr()
协方差 df[['','']].cov()
5.按照某一列降序排序,数据相同时按另一列升序排序
df.sort_values(by = ['',''],ascending = (False,True))
6.Pandas透视表(pivot_table)
pd.pivot_table(df,index='',values = '',aggfunc = '')
数据在资源里,应该可以免费下载
答案可以现在评论区讨论,答案不唯一