Evonnehyf

Airbnb短租房源数据可视化

前言

数据集链接：https://tianchi.aliyun.com/competition/entrance/231715/information
以下主要分成三个部分：
- Part one:数据集简明介绍
- Part two:数据预处理
- Part three:数据可视化分析

Part one：数据集介绍

1.1 活动背景

共享，通过让渡闲置资源的使用权，在有限增加边际成本的前提下，提高了资源利用效率。随着信息的透明化，越来越多的共享发生在陌生人之间。短租，共享空间的一种模式，不论是否体验过入住陌生人的家中，你都可以从短租的数据里挖掘有趣的信息。
活动采用了短租房源相关的公开数据，包括了结构化的表格数据、非结构化的文本和地图数据。可在统计分析、时间序列、关系网络分析、中英文自然语言处理、数据可视化以及数据应用等多角度都可以进行探索。

1.2 数据说明

数据分为汇总版和明细版两类。
listings 数据为短租房源基础信息，包括房源、房东、位置、类型、价格、评论数量和可租时间等等。明细版listings_detail 中包含更多房源相关细节。
calendar 数据为短租房源时间表信息，包括房源、时间、是否可租、租金和可租天数等等。
reviews 数据为短租房源的评论信息。汇总版中仅包括房源 listing_id和评论日期，用来时间序列和数据可视化分析。明细版reviews_detail 还包括评论相关的内容和作者信息。
neighbourhoods 数据为北京的行政区划。
数据来源：本次活动数据来自 Airbnb 于 2019 年 4 月 17 日公开的北京地区数据。数据均来源于 Airbnb 网站的公开信息，不包含任何个人隐私数据。感谢相关机构做出的数据工作，更多信息可访问 http://insideairbnb.com/get-the-data.html。

1.3 分析所用数据集介绍

本次分析主要使用listings_detail 数据集，其中包含106个特征，28452条数据。
数据集主要包含了短租房源的基础信息，如房源、房东、地理位置、价格、评论数量等等。通过对特征进行初步筛选，丢掉部分无用信息，最终提取46个特征，主要分为一下几类：房东特征（服务、可信度、房东类型等）、房源特征（起始时间、地理位置、硬件设施、价格等等）、房客特征（住房反馈等）。

Part two：数据预处理

2.1 数据准备

# 导入必要库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from collections import Counter
from PIL import Image
from wordcloud import WordCloud, ImageColorGenerator
import seaborn as sns
import pandas_profiling
import missingno as msno
import datetime
import re
import os

detail = pd.read_csv('listings_detail.csv')
data_save = detail.iloc[:,[0,19,22,25,26,28,32,34,35,36,39,48,49,50,51,52,53,
                       54,55,56,57,58,60,63,64,65,66,67,68,75,80,82,83,84,
                       85,86,87,88,89,90,91,92,96,98,105]]

# 根据Calendar_details，计算未来一段时间内各房源的预订率
calendar = pd.read_csv('calendar_detail.csv')
calendar_f =  pd.DataFrame(calendar.loc[(calendar['available'] == 'f')].groupby(by=['listing_id'])['date'].count())
calendar_t = pd.DataFrame(calendar.loc[(calendar['available'] == 't')].groupby(by=['listing_id'])['date'].count())
calendar_count = pd.DataFrame(calendar.groupby(by = ['listing_id'])['date'].count())
rating = calendar_f / calendar_count
data1 = pd.merge(data_save, rating, how = 'left', left_on = 'id', right_index = True)
data1.rename(columns = {'date':'rating'}, inplace = True)
data1.to_csv('data1.csv',index = False)
print("variables：", data1.columns.values)

2.2 数据预处理

2.2.1 缺失情况展示

白色部分代表缺失值
数据缺失情况较为严重的是与住客反馈相关的“review”类特征，以及“security_deposit”和“cleaning_fee”两个特征。

2.2.2 数据处理

# 1. 变量：'security_deposit'&'cleaning_fee'填补缺失值，货币符号转换
data1 = pd.read_csv("data1.csv")
data1.loc[:5, ['security_deposit', 'cleaning_fee']]
## 缺失值补零
data1['security_deposit'] = data1['security_deposit'].fillna(0)
data1['cleaning_fee'] = data1['cleaning_fee'].fillna(0)
##货币符号转换
for index, row in data1.iterrows():
    a = getattr(row, 'security_deposit')
    b = getattr(row, 'cleaning_fee')
    if type(a) == str:
        a = float(re.sub('[$,]', '', a))
        data1.loc[index, 'security_deposit'] = a
    if type(b) == str:
        b = float(re.sub('[$,]', '', b))
        data1.loc[index, 'cleaning_fee'] = b


# 2. 变量'neighbourhood_cleansed'的字符转换
data2 = data1.copy()
data2.loc[:5, 'neighbourhood_cleansed']
rep = {'朝阳区 / Chaoyang':'Chaoyang', '东城区':'Dongcheng', '海淀区':'Haidian',   
       '丰台区 / Fengtai':'Fengtai', '西城区':'Xicheng', '通州区 / Tongzhou':'Tongzhou',
       '昌平区':'Changping', '密云县 / Miyun':'Miyun', '顺义区 / Shunyi':'Shunyi',
       '怀柔区 / Huairou':'Huairou', '大兴区 / Daxing':'Daxing', '延庆县 / Yanqing':'Yanqing',
       '房山区':'Fangshan', '石景山区':'Shijing', '门头沟区 / Mentougou':'Mentougou', '平谷区 / Pinggu':'Pinggu'}

rep = dict((re.escape(k), v) for k, v in rep.items())
pattern = re.compile("|".join(rep.keys()))
for index, row in data2.iterrows():
    a = getattr(row, 'neighbourhood_cleansed')
    my_str = pattern.sub(lambda m: rep[re.escape(m.group(0))], a)
    data2.loc[index, 'neighbourhood_cleansed'] = my_str
data2.loc[:5, 'neighbourhood_cleansed']


# 3. 变量'host_since'转化成到数据收集日（2019 年 4 月 17 日）的天数
data3 = data2.copy()
now = '2019-04-17'
data3.iloc[:, 2] = data3.iloc[:, 2].apply(lambda x: int((datetime.datetime.strptime(now, '%Y-%m-%d')                                                        - datetime.datetime.strptime(x, '%Y-%m-%d')).days))


# 4. 变量'host_response_time'&'host_response_rate'的缺失处理
# 'host_response_time'缺失则划分为新类“no body cares”
# 'host_response_rate'字符百分数转换成浮点数
# 'host_response_rate'缺失则取平均

data4 = data3.copy()
data4.loc[:5, ['host_response_time', 'host_response_rate']]
#'host_response_time'处理
data4.iloc[:, 3] = data4['host_response_time'].replace(np.nan, 'no body cares')
# 'host_response_rate'处理
data4.iloc[:, 4] = data4.iloc[:, 4].apply(lambda x: float(x.strip('%')) if type(x) == str else x)
data4.iloc[:, 4] = data4.iloc[:, 4].fillna(data4['host_response_rate'].mean())
data4.iloc[:, 4] = data4.iloc[:, 4].apply(lambda x: "%.3f"% (x / 100))


# 5. 变量'bathrooms'&'bedrooms'&'beds'的缺失均补0
data5 = data4.copy()
data5['bathrooms'] = data5['bathrooms'].fillna(0)
data5['bedrooms'] = data5['bedrooms'].fillna(0)
data5['beds'] = data5['bedrooms'].fillna(0)


# 6. 变量'amenities'统计元素个数并绘制词云图
data6 = data5.copy()
data6['amenities'] = data6['amenities'].apply(lambda x: x.count(',') + 1)
data6.to_csv('data6.csv', index = False)

## 绘制词云图
a = data5['amenities'].apply(lambda x: pd.DataFrame(x.split(',')))
count = {}
for i in a:
    d = pd.DataFrame(i)
    word = d[0].apply(lambda x: re.sub('[{"}"]', '', x))
    for j in word:
        if j in count.keys():
            count[j] = count[j] + 1
        else:
            count[j] = 1

count.pop('')  #删除空关键字
count['toilet'] = count.pop(' toilet')

def wc_from_word_count(word_count, fp):
    bg = np.array(Image.open("./pictures/tree.jpg"))
    wc = WordCloud(
        max_words = 100,  # 最多显示词数
        background_color = "white",  # 设置背景为白色，默认为黑色
        width = 3000,  # 设置图片的宽度
        height = 2000,  # 设置图片的高度
        margin = 10,  # 设置图片的边缘
        mask = bg,
        contour_width = 3,
        contour_color='green'
    )
    image_colors = ImageColorGenerator(bg)
    wc.generate_from_frequencies(word_count) # 从字典生成词云
    ax = fig.add_subplot(1,1,1)
    ax.imshow(wc, interpolation='bilinear')  # 显示词云
    ax.axis('off')  # 关闭坐标轴
    wc.to_file(fp)  # 保存图片
#调用词云函数
fig = plt.figure(figsize = (10, 10))
wc_from_word_count(count, './pictures/1.jpg')

# 7. 变量'price'&'extra people'货币符号转换
data7 = data6.copy()
data7['price'] = data7['price'].apply(lambda x: re.sub('[$,]', '', x))
data7['extra_people'] = data7['extra_people'].apply(lambda x: re.sub('[$,]', '', x))


# 8. 用calendar_detail计算入住率，并将入住率合并到数据集中
calendar = pd.read_csv('calendar_detail.csv')
occup = calendar.available.loc[(calendar['available'] == 'f')].count()   #available字段为非可用，表示这天得房子已经出租出去。
alldays = calendar.available.count() #总数
occuprate = round(occup / alldays * 100, 2)  #使用数比总数，求出总得使用率
print('总使用率为:{0}%，总数为:{1},使用总天数为:{2}'.format(occuprate, alldays, occup))
calendar_f =  pd.DataFrame(calendar.loc[(calendar['available'] == 'f')].groupby(by = ['listing_id'])['date'].count())
calendar_t = pd.DataFrame(calendar.loc[(calendar['available'] == 't')].groupby(by = ['listing_id'])['date'].count())
calendar_count = pd.DataFrame(calendar.groupby(by = ['listing_id'])['date'].count())
rating = round(calendar_f / calendar_count, 3)
rating['date'] = rating['date'].fillna(0)
data8 = pd.merge(data7, rating, how = 'left', left_on = 'id', right_index = True)
data8.rename(columns = {'date':'rating'}, inplace = True)


# 9. 对最后几个变量进行缺失值处理
# 删除变量'first_review'和'last_review'
# 评分按级别划分：若未缺失，则满分为1，非满分为-1，缺失为0

data9 = data8.copy()
data9.drop(['first_review','last_review'], 1 , inplace = True)
# review_scores_rating
data9['review_scores_rating'] = data9['review_scores_rating'].apply(lambda x:-1 if x <100 else x)
data9['review_scores_rating'] = data9['review_scores_rating'].apply(lambda x:1 if x == 100 else x)
data9['review_scores_rating'] = data9['review_scores_rating'].fillna(0)
score = ['review_scores_accuracy', 'review_scores_cleanliness', 'review_scores_checkin',
         'review_scores_communication', 'review_scores_location', 'review_scores_value']
for i in score:
    data9[i] = data9[i].apply(lambda x:-1 if x < 10 else x)
    data9[i] = data9[i].apply(lambda x:1 if x == 10 else x)
    data9[i] = data9[i].fillna(0)
data9['reviews_per_month'] = data9['reviews_per_month'].fillna(0)

Part three：数据可视化

3.1 重要特征分布

# host_since（房东注册时长）
sns.set(context = 'paper', style = "whitegrid")
data9 = pd.read_csv('data9.csv')
sns.distplot(data9.host_since)

目前北京的短租房源多数是近三年注册的，符合17年Airbnb大举进入中国的发展背景。近几年来，中国的短租市场蒸蒸日上，在消费升级的背景下，共享民宿，短租住宿成为新的消费增长点。

# property_type（房源类型）
fig = plt.figure(figsize = (12,6))
ax = fig.add_subplot(1,1,1)
ax = sns.countplot(y='property_type', palette = "Set3", data = data9)
ax.tick_params(labelsize = 9)

北京短租房源市场中，Apartment（公寓型房源）“一枝独秀”，而House（家庭式住宅）和Condominium（分契式公寓）类型的房源在整个市场中也占据较大比重。

# room_type（房间类型）
fig = plt.figure(figsize = (12,6))
ax1 = fig.add_subplot(1,2,1)
ax1 = sns.countplot(x = 'room_type', data = data9, facecolor=(0, 0, 0, 0),
                    linewidth = 5, edgecolor = sns.color_palette("dark", 3))
# minimum_nights（最少入住天数）
data9['minimum_nights'].unique()
bins = [0,1,7,2000]
df = pd.cut(data9['minimum_nights'], bins)
ax2 = fig.add_subplot(1,2,2)
ax2 = sns.countplot(x = df, facecolor=(0, 0, 0, 0), linewidth = 5,
                    edgecolor = sns.color_palette("dark", 3))

目前，北京短租房市场中，主要存在以下三种房间出租类型：整套出租，整间出租以及共享房间。其中，整套出租占比最高，整间出租次之，共享房间的形式也占据一定比重。
在Airbnb平台上，房主可对房客设置最低入住时长。从上图来看，绝大多数房源入住时间为1天起步，只有少数房东较为“苛刻”，或者是由于房源类型的特殊性，要求房客最低入住七天以上。

# 房东回复时长在superhost与commonhost内的频率
tab1 = pd.crosstab(data9['host_is_superhost'], data9['host_response_time'])
tab1_std = tab1.div(tab1.sum(1), axis = 0)

plt.figure(figsize = (15,7))
tab1_std.plot.bar()
plt.tight_layout()
plt.xticks(rotation = 0)
plt.legend(loc = 'upper left')
plt.show()

Airbnb平台于2009年启动了Superhost（明星房东）计划，旨在表彰早期为Airbnb社区的出租行为树立了高标准的优秀房东。而成为明星房东需要满足以下条件：对房客的回复率至少达到90%；没有取消预订的订单；至少80%评价为满分评价；至少完成10次订单。
除了上述硬性条件之外，上图显示了房东回复时间在明星房东和普通房东群体中的分布情况。值得一提的是，无论房东是什么类型，能够在1小时内回复消息的房东群体均占比最高。其次，明星房东中1小时内回复的比例高于普通房东。另外，普通房东中“无人问津”的比例明显高于明星房东，这表明被冠以“Superhost”的房东，凭借良好的工作态度，的确能够获取房客更多的关注度和青睐。

3.2 地区发展概况分析

3.2.1 房东注册时长与北京各区的关系

data9 = pd.read_csv('data9.csv')
my_order = data9.groupby(by = ["neighbourhood_cleansed"])["host_since"].median().sort_values().index #按照中位数排序
counts = data9['neighbourhood_cleansed'].value_counts()
sns.set(context = 'paper', style = "whitegrid")
fig = plt.figure(figsize = (14, 7))
ax1 = fig.add_subplot(1,2,1)
ax1 = sns.boxenplot(x = 'host_since', y = 'neighbourhood_cleansed', data = data9, palette = "vlag", orient = 'h',
                   linewidth = 0.3, width = 0.7, order = my_order)
ax1.grid(True)
ax2 = fig.add_subplot(1,2,2)
ax2 = sns.barplot(x = counts.values, y = counts.index,
                  palette = "vlag", orient = 'h', order = my_order)
ax2.set_xlabel('the number of listings')
ax2.grid(True)
sns.despine(trim = False, right = True)

海淀区、东城区和朝阳区内的短租房源起步时间较早，并且数量明显高于其他区域。而在较为偏僻的门头沟区、房山区和密云区内，多数房源均为近一两年注册，并且数量较少。造成明显差异的主要原因是，东城区是全市历史文化遗存和胡同四合院最为密集的地区，游客密集并且位于市中心地带，需求拉动了市场发展。而海淀区内旅游景点也较为密集，“集天下胜景于一地，汇古建绝艺于京华”。位于北京中心城区的朝阳区，则是商务中心、科技文化体育交流中心，各地往来人员数量多。
短租房源市场发展较晚且数量较少的昌平、通州、顺义、大兴属于北京的近郊，以经济开发区为主，市场需求不高。

# 讨论为什么朝阳区短租房源数量这么高
data_1 = data9.copy()
data_1.property_type = data_1.property_type.apply(lambda x:'Apartment' if x == 'Apartment' else 'other')
plt.style.use('ggplot')

area_type = pd.crosstab(data_1['neighbourhood_cleansed'], data_1['property_type'])
area_type_std = area_type.div(area_type.sum(1), axis = 0)

plt.figure(figsize = (15,7))
area_type_std.plot.bar()
plt.tight_layout()
plt.xticks(rotation = 45)
plt.legend(loc = 'best')
plt.show()

朝阳区的房源数量明显比同为中心城区的其它区域，如西城区、东城区等高出不少。结合房源类型的数量分布，我们已知Apartment（公寓型房源）在北京短租房源市场“一枝独秀”。上图刻画了Apartment类型的房源在各区的占比情况，由此可以发现，朝阳区的公寓型房源占比最高，说明该区域充分利用了居民区的闲置资源，这是它房源数量显著高于其他区域的主要原因。

3.2.2 探索房间类型与地理位置的关系

plt.style.use('ggplot')

area_room = pd.crosstab(data_1['neighbourhood_cleansed'], data_1['room_type'])
area_room_std = area_room.div(area_room.sum(1), axis = 0)
fig = plt.figure(figsize = (10, 7))
area_room_std.plot.bar()
plt.xticks(rotation = 45)
plt.ylim(ymin = 0, ymax = 0.9)
plt.legend(loc = 'best', fontsize = 8)
plt.show()

房间类型的分布在不同地区间也有明显差异，如上图所示，大兴、东城、房山、丰台、门头沟、石景山、顺义、通州的整套出租房源比较显著较高，而海淀、怀柔、密云、延庆等区整套出租与整间出租的比邻基本“旗鼓相当”。

3.2.3 Superhost型房东、价格以及评论数的区域分布情况

sns.set(context = 'paper', style = "whitegrid")

tab2 = pd.crosstab(data_1['neighbourhood_cleansed'], data_1['host_is_superhost'])
tab2_std = tab2.div(tab2.sum(1), axis = 0)
orders = tab2_std.iloc[:,-1].sort_values().index

fig = plt.figure(figsize = (18, 8))
ax1 = fig.add_subplot(1,3,1)
ax1 = sns.barplot(x = tab2_std.iloc[:,-1], y = tab2_std.index, palette = "vlag", order = orders)

order2 = data_1.groupby(by = ["neighbourhood_cleansed"])["price"].median().sort_values().index #按照中位数排序
ax2 = fig.add_subplot(1,3,2)
ax2 = sns.boxenplot(x = 'price', y = 'neighbourhood_cleansed', data = data_1, palette = "vlag", orient = 'h',
                   linewidth = 0.3, width = 0.7, order = order2)
ax2.axis([0, 8000, -0.5, 15.5])

ax3 = fig.add_subplot(1,3,3)
ax3 = sns.barplot(x = data_1.number_of_reviews_ltm, y = data_1.neighbourhood_cleansed, palette = "vlag")

东城区、西城区、石景山区、朝阳区和海淀区的明星房东占比较高，一定程度上体现出这几个区的整体房东素质高于其余各区。
从价格分布来看，由于别墅、精品酒店等高价房源数量占比较高，因此怀柔、延庆、平谷等区的价格水平更高。
从过去12个月的评论数来看，发展更为成熟的中心城区，如朝阳区、西城区、东城区、海淀区等评论数量更多一些。地理位置相对偏僻，房源数量较少的地区，如怀柔区、延庆区、门头沟区等，住客评论量较少。

3.3 房东与房源大体情况分析

3.3.1 房东等级与房东注册时长的关系

superhost = data_1.query("host_is_superhost == 't'")
commonhost = data_1.query("host_is_superhost == 'f'")

fig = plt.figure(figsize = (12,6))
ax1 = fig.add_subplot(1,2,1)
sns.boxplot(y = data_1.host_since, x = data_1.host_is_superhost, palette = "vlag", orient = 'v',
                      linewidth = 0.4, width = 0.3, notch = True)

ax2 = fig.add_subplot(1,2,2)
ax2 = sns.distplot(superhost.host_since, rug = True, hist = True, label = 'superhost')
ax2 = sns.distplot(commonhost.host_since, rug = True, hist = True, label = 'commonhost')
ax2.legend(loc = 'best')

发现无论是从箱线图中还是从密度图中看，superhost的注册时间都更长，相比commonhost有更多的经营经验

3.3.2 房型的发展概况

entire = data_1.query("room_type == 'Entire home/apt'")
private = data_1.query("room_type == 'Private room'")
shared = data_1.query("room_type == 'Shared room'")

fig = plt.figure(figsize = (12,8))

ax = fig.add_subplot(1,1,1)
ax = sns.distplot(entire.host_since, rug = True, hist = True, label = 'entire')
ax = sns.distplot(private.host_since, rug = True, hist = True, label = 'private')
ax = sns.distplot(shared.host_since, rug = True, hist = True, label = 'shared')
ax.legend(loc = 'best', fontsize = 12)

从整体上来看，entire房间类型注册时间较短，日期较新

3.3.3 “明星房东”与房型、注册市场的关系

sns.set(context = 'paper', style = "whitegrid")
fig = plt.figure(figsize = (8,6))
ax1 = fig.add_subplot(1,1,1)
ax1 = sns.violinplot(x = "room_type", y = "host_since", hue = 'host_is_superhost',
                     data = data_1, palette = "Set2", split = True, scale = "count", inner = "quartile")
ax1.legend(loc = 'best', fontsize = 12)

首先，在三种房型中，“明星房东”的注册时长均更久一些
其次，Private room的注册时长相较于其他两种房型，较长一些

3.4 探究热度高的房源特征

以过去12个月的评论数作为评价热度的指标

3.4.1 高热度房源地区分布情况

# 取热度前1%的房源
data9 = pd.read_csv('data9.csv')
a = data9.sort_index(by = 'number_of_reviews_ltm', ascending = False)
max10 = a.iloc[:data9.shape[0] // 100,:]

# 查看房源分布
count1 = pd.DataFrame(max10['neighbourhood_cleansed'].value_counts())
count1.index.name = 'area'
count2 = pd.DataFrame(data9.neighbourhood_cleansed.value_counts())
count2.index.name = 'area'

bili = pd.merge(count1, count2, on = 'area')
bili['rate'] = bili.neighbourhood_cleansed_x / bili.neighbourhood_cleansed_y

# 饼图：展示前1%热度房源在各区比例；柱状图：展示各地区中热度前1%房源比例
fig, ax = plt.subplots(1, 2, figsize = (24,10))

plt.style.use('ggplot')
ax[0] = bili.neighbourhood_cleansed_x.plot.pie(ax = ax[0], shadow = True, labeldistance = 1.2,
                                              autopct = "%2.1f%%")
ax[0].legend()

sns.set(context = 'paper', style = "whitegrid")
ax[1] = bili.rate.plot.bar(ax = ax[1],facecolor=(0, 0, 0, 0), linewidth = 5, edgecolor = sns.color_palette("dark", 3))

左图为高热度房源的区域分布情况，与各区房源总数基本一致，朝阳区、东城区中高热度房源数量较多，昌平、石景山等区则只有少量的高热度房源。
右图为，各区高热度房源所占比例，从图中可以看出，尽管朝阳区高热度房源数量最多，但占比并不具有明显优势，反而是东城区和西城区，尽管数量少，但占比均高于朝阳区。这表明，整体来看，东城区与西城区的房源热度水平更高一些。

3.4.2 高热度房源价格跨度

sns.set(context = 'paper', style = "whitegrid")
fig = plt.figure(figsize = (6,6))
ax1 = fig.add_subplot(1,1,1)
ax1 = sns.distplot(max10.price, rug = True, hist = True, color = 'g')
plt.axvline(x = 329 ,ls = "--", c = "black")
plt.axvline(x = 201 ,ls = "--", c = "black")
plt.axvline(x = 470 ,ls = "--", c = "black")
plt.text(50,0.0015,'201',color = 'r')
plt.text(250,0.0015,'329',color = 'r')
plt.text(500,0.0015,'470',color = 'r')

max10.price.describe()

整体来看，尽管高热度房源价格跨度比较大，最低价格为74，最高为2221，但在价格分布上低于平均水平。侧面说明了，高热度的房源价格更加“亲民”，并且对房东来说，适当降低价格不失为一个提高房源热度的有效措施。

3.4.3 高热度房源的房东性质与房间类型分布

不止一套的认为是专业的运营团队
79.6%都是专业的运营团队

print(max10.room_type.value_counts())
print(data9.room_type.value_counts())

fig, ax = plt.subplots(1,2,figsize=(12,5))
plt.style.use('ggplot')
explode =[0,0,0.2]
colors = ['pink','skyblue','orange']
ax[0] = max10.room_type.value_counts().plot.pie(ax = ax[0], shadow = True, labeldistance = 1.2,
                                                autopct = "%2.1f%%", explode = explode, colors = colors)
ax[0].legend(loc = 'best')
ax[0].set_title('max 1%')

ax[1] = data9.room_type.value_counts().plot.pie(ax = ax[1], shadow = True, labeldistance = 1.2,
                                                autopct = "%2.1f%%", explode = explode, colors = colors)
ax[1].legend(loc = 'best')
ax[1].set_title('All')

在高热度房源中，本文认为拥有超过1套房源的房东均为专业的运营团队。根据计算结果，在284个高热度房源中，约79.6%是由专业的运营团队来打理。这表明，可能由于推广和运营相关的环节较弱，个人运营的房源，相对来说入住率会比专业团队差一些。
在高热度房源中，单人房间、多人房间比例略高一些，说明这两类房型更受欢迎一些，这也在房源类型方面给房东提供了一定的参考。不过总体而言，类型的分布基本与所有房源的分布相近。

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python数据分析与可视化 jun778895 python 数据分析开发语言
Python数据分析与可视化是一个涉及数据处理、分析和以图形化方式展示数据的过程，它对于数据科学家、分析师以及任何需要从数据中提取洞察力的专业人员来说至关重要。以下将详细探讨Python在数据分析与可视化方面的应用，包括常用的库、数据处理流程、可视化技巧以及实际应用案例。一、Python数据分析与可视化的重要性数据可视化是将数据以图形或图像的形式表示出来，以便人们能够更直观地理解数据背后的信息和规
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
python读写CSV文件 bcbobo21cn .Net python 开发语言机器学习 CSV
做数据分析，有时候要分析的数据在CSV文件里；先看一下python读写CSV文件；importpandasaspddf=pd.read_csv('test1.csv')print(df)print('')print(df.head(2))companyname=["A1","B2","E3","F4"]legperson=["lier","yanqi","wangwu","zhangsan"]le
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
python数据分析知识点大全编程零零七 python数据分析 python 开发语言 python数据分析数据分析知识点大全 python数据分析知识点 python教程 python基础
Python数据分析知识点大全可以归纳为以下几个主要方面：一、基础概念与目的数据分析定义：数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，提取有用信息和形成结论，对数据加以详细研究和概括总结的过程。其目的在于从数据中挖掘规律、验证猜想、进行预测。Python在数据分析中的优势：Python因其易学性、快速开发、丰富的扩展库（如NumPy、Pandas等）和成熟的框架，成为数据分析领域的
mysql 隐秘后门_【技术分享】CVE-2016-5483：利用mysqldump备份可生成后门 Toby Dai mysql 隐秘后门
预估稿费：100RMB投稿方式：发送邮件至linwei#360.cn，或登陆网页版在线投稿前言mysqldump是用来创建MySQL数据库逻辑备份的一个常用工具。它在默认配置下可以生成一个.sql文件，其中包含创建/删除表和插入数据等。在导入转储文件的时候，攻击者可以通过制造恶意表名来实现任意SQL语句查询和shell命令执行的目的。另一个与之相关的漏洞利用场景可以参考。攻击场景攻击者已经能够访问
数据分析-24-时间序列预测之基于keras的VMD-LSTM和VMD-CNN-LSTM预测风速皮皮冰燃数据分析数据分析
文章目录1普通的LSTM模型1.1数据重采样1.2数据标准化1.3切分窗口1.4划分数据集1.5建立模型1.6预测效果2VMD-LSTM模型2.1VMD分解时间序列2.2对每一个IMF建立LSTM模型2.2.1IMF1—LSTM2.2.2IMF2-LSTM2.2.3统一代码2.3评估效果3CNN-LSTM模型3.1数据预处理3.2建立模型3.3效果预测4VMD-CNN-LSTM模型4.1VMD分解
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【数字化供应链】数字化供应链架构、全景管理、全流程贯通方案数字化建设方案数字化转型数据治理主数据数据仓库供应链数字仓储智慧物流智慧仓储物流园区架构微服务数据挖掘大数据人工智能
原文《数字化供应链架构、全景管理、全流程贯通方案》PPT格式。主要从供应链管理全景、智慧供应链建设总体目标、供应链总体业务流程、供应链总体功能架构、供应链总体技术架构、供应链全流程贯通、供应链全领域管理、供应链数据数据分析、供应链决策中台等进行建设。本文仅对主要内容进行介绍。来源网络公开渠道，旨在交流学习，如有侵权联系速删，更多参考公众号：优享智库基于先进IT技术、大数据能力、物联网应用、区块链平
OmicsTools除b站教学视频外已整理的零代码生信全流程分析文档邢博士谈科教医学科研生信分析 r语言数据可视化数据挖掘数据分析生信医学生信分析
OmicsTools软件介绍和下载安装配置软件简介我开发了一款本地电脑无限使用的零代码生信数据分析作软图神器电脑软件OmicsTools，欢迎大家使用OmicsTools进行生物医学科研数据分析和作图，该软件件能让大家在不需要任何编程和代码编写的基础上，分析次数没有限制，可以无限使用，让您在自己电脑上快速进行大量的生信分析和加速大家的科研。OmicsTools生信分析电脑软件可以做医学生物生信各个
【数据分析】利用Python+AI+工作流实现自动化数据分析-全流程讲解 z千鑫 AI领域 FLASK基础 Python基础人工智能数据分析 python AI编程 AI工作流 ai 自动化
文章目录一、为什么要用AI进行自动化分析？二、AI自动化分析场景三、编写Python脚本示例1、用flask实现让AI分析数据内容使用说明：示例2、用定时任务的方式，定时处理AI数据代码说明四、把AI分析的数据，放到AI工作流中做展示五、openAI的key结尾在信息爆炸的时代，如何快速获取有价值的洞察力成为了各行各业的迫切需求。传统的内容分析方法往往又耗时又费力，并且难以满足快速变化的市场需求。
Mall4j商城实战 - 部署 canal 数据库增量日志解析 yueerba126 Mall4j商城实战数据库 spring cloud 微服务架构
Canal简介Canal是基于MySQL数据库增量日志解析的工具，主要用于增量数据的订阅和消费。Canal主要用途基于MySQL数据库增量日志解析详细功能：实时解析MySQL的二进制日志（Binlog）。捕获数据库中的所有增量变更，如插入、更新和删除操作。使用场景：适用于实时监控数据库变化的应用，比如数据复制、数据备份或实时数据分析等。提供增量数据订阅和消费服务
大数据新视界 --大数据大厂之揭秘大数据时代 Excel 魔法：大厂数据分析师进阶秘籍青云交大数据新视界 Excel 数据分析函数公式数据透视表图表功能规划求解数据分析工具库大数据新视界数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
Rust: duckdb和polars读csv文件比较 songroom rust 开发语言后端
duckdb在数据分析上，有非常多不错的特质。1、快；2、客户体验好，特别是可以同时批量读csv（在一个目录下的csv等文件）。polars的性能比pandas有非常多的超越。但背后的一些基于arrow的技术栈有很多相同之类。今天想比较一下两者在csv数据读写的情况。一、文件准备csv样本内容，是N行9列的csv标准格式，有字符串，有浮点数，有整型。具体如下：本次准备了两个csv文件，一个大约是2
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
python基于django/flask的NBA球员大数据分析与可视化python+java+node.js QQ_511008285 python django flask java spring boot 数据分析
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以本文针对NBA球员的大数据进行
Java基于spring boot的国产电影数据分析与可视化python+java+node.js QQ_511008285 java spring boot 数据分析 python django vue.js flask
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以该系统使用进行大数据处理和
Python最全的股票数据API接口 w_traveler python 开发语言大数据
python最全的股票数据API接口使用python是一种有效的方式来获取高频股票数据，以便进行股票行情数据分析和量化交易。python是一种广泛应用于金融数据领域的编程语言，可用于与股票数据API接口进行交互。通过调用股票数据API接口，我们可以获取实时的股票数据，包括tick数据和k线历史数据。tick数据提供了每次交易的详细信息，而k线历史数据则提供了一段时间内港股、美股、A股、沪深行情数据
R 地图绘制-比例尺与指北针 jamesjin63
ggplot绘制mapR语言可以进行数据分析，也可以进行地图绘制，而且非常简洁，快速。虽然Arcgis基于桌面可视化操作，能够进行空间分析，但是唯一不足的就是操作步骤繁琐而且一不小心，就要从头再来，可重复性较低。这篇文章主要讲述如何利用R语言中的ggplot与sf绘制带有指北针、图列与标尺的地图屏幕快照2020-06-28下午9.27.59.png数据我们下载非洲地区54个国家的图层Afirca.
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

Airbnb短租房源数据可视化

前言

Part one：数据集介绍

1.1 活动背景

1.2 数据说明

1.3 分析所用数据集介绍

Part two：数据预处理

2.1 数据准备

2.2 数据预处理

2.2.1 缺失情况展示

2.2.2 数据处理

Part three：数据可视化

3.1 重要特征分布

3.2 地区发展概况分析

3.2.1 房东注册时长与北京各区的关系

3.2.2 探索房间类型与地理位置的关系

3.2.3 Superhost型房东、价格以及评论数的区域分布情况

3.3 房东与房源大体情况分析

3.3.1 房东等级与房东注册时长的关系

3.3.2 房型的发展概况

3.3.3 “明星房东”与房型、注册市场的关系

3.4 探究热度高的房源特征

3.4.1 高热度房源地区分布情况

3.4.2 高热度房源价格跨度

3.4.3 高热度房源的房东性质与房间类型分布

你可能感兴趣的:(数据分析,常用工具)