爱是一道光_e5f7

Python爬取北京2.3万条租房信息，发现快租不起房子了！

1.概述

北上广深作为打工人最多的超一线城市，大部分都是租房生活着。自如作为目前第三方租房平台，应该算是该行业的龙头。但是最近蛋壳的暴雷，我们不得不更加警觉。那么自如都有多少open状态的房源呢，这些房源都是什么样的呢？这里我们爬取了自如北上广深四个城市共4.6万房源信息，单拿北京的数据来做详细介绍吧！

PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入源码也可

2.数据采集-爬虫

自如的租房信息每个筛选结果最多展示50页，约1500个左右。考虑到很多地区的租房数量超过1500个，我们可以通过增加筛选的方式进行遍历获取全部租房信息。

以北京为例，由于自如大本营在北京，我们发现北京有租房信息2.3万条以上，因此这里采用的是地区-房价区间 2个筛选项进行选择，其中筛选项为自定义以500为颗粒度。

在爬虫过程中，我们会发现频繁的请求数据会被封IP，同时自如的租房价格信息是图片位置决定的，需要进行特殊的处理。

自如爬虫注意事项：

①需要采用IP代理，避免封IP后无法请求数据

②需要识别图片中数字及定位，从而获取具体的租金数据

由于爬虫部分的处理其实比较麻烦，考虑篇幅有限，这里仅做核心部分讲解，我们在后续再做专题介绍。

2.1.房屋信息解析

打开自如官网，F12到开发者模式，直接查看网页源码即可找到需要的房屋信息数据。本次我是采用的re正则表达式进行数据解析，当然大家也可以通过别的方式比如xpah或bs4等等进行解析。

# 获取具体房屋信息

houseId = re.findall('x/(.*?).html"target="_blank">', item)[0]

title = re.findall('target="_blank">(.*?)',item)[0] # 房屋信息朝向-小区-户型-卧次

large = re.findall('

(.*?)

', item)[0] # 房屋面积-楼层

location = re.findall('(.*?)

', item)[0] # 房屋面积-楼层

2.2.房屋价格解析

对于刚才这个截图里7445元租金信息其实不是直接用的数字展示，而是有一个backgroundHtml和background-position决定。

我们打开backgroundHtml链接发现是一个含10个个位数数字的透明png图如下：

而价格里出现的四个 -188px、-160px、-160px和-40px对应上面的数字位置，通过关系我们可以匹配到。

backgroundHtml = re.findall('url$(.*?)$', item)

priceList = re.findall('background-position:(.*?)px">', item)# 房价数字图片地址

image = requests.get('http:' + backgroundHtml[0]).content

# 保存价格用图片到本地

f = open('.\price.png', 'wb')

f.write(image)

f.close()

# 调用函数（见下面函数定义）获取价格数字字符串

text = get_pricetext()

# 获取价格

price = ''

for i in priceList:

num = int(float(i) / -20) #对于不同情况中有折扣的是20，无折扣的是21.4

price = price + text[num]

如何获取价格用图片中的数字及顺序呢，需要用到pytesseract进行图片数字识别，以及用Image给原始透明图片加白底。

# 由于数字图是png无法被识别，所以我们需要进行背景加白

def get_pricetext():

# 给透明图片加白色背景

im = Image.open('.\price.png')

x,y = im.size

try:

p = Image.new('RGBA', im.size, (255,255,255))

p.paste(im, (0, 0, x, y), im)

p.save('.\price.png')

except:

pass

# 获取图片中数字字符串

text = pytesseract.image_to_string(Image.open(".\price.png"),

config='--psm 10 --oem 3 -c tessedit_char_whitelist=1234567890',

lang='eng')

text = re.sub('\s','',text)

return text

3.数据处理-清洗

在爬取数据的过程中，发现既定的数据解析方式总是出现一些问题，随着对异常数据的查看，发现同一个数据指标下的数据格式并不唯一化，因此需要不断的修正解析方法。为了更方便爬取原数据，在爬虫过程中采取了较为通用的格式，等数据采集下来之后再进行统一化的清洗处理。

以下是采集后的数据预览：

查看以上数据，其实房屋名称、面积/楼层及位置信息可以继续进行细化成更小的元数据供后续分析使用，对此我们来一一处理。

3.1.房屋名称数据清洗

对于我们来说，“合租·李村东里3居室-北卧”其实包含了类型、小区、户型和卧室朝向等信息，需要进行分拆。

# 房屋信息解析

# s = '合租·李村东里3居室-北卧'

# s = '合租·强佑·府学上院4居室-北卧'

# s = '整租·铁二区1室1厅-北'

# s = '整租·厂甸11号院1室1厅-东'

s = '整租·牛街182室1厅-西'

re.split(r'(.*?)·(.*)(\d居*室.*)-(.*)',s)

通过以上正则表达式的方式，我们可以采用apply进行处理：

df['类型'] = df['房屋名称'].apply(lambda x : re.split(r'(.*?)·(.*)(\d居*室.*)-(.*)',x)[1])

df['小区'] = df['房屋名称'].apply(lambda x : re.split(r'(.*?)·(.*)(\d居*室.*)-(.*)',x)[2])

df['户型'] = df['房屋名称'].apply(lambda x : re.split(r'(.*?)·(.*)(\d居*室.*)-(.*)',x)[3])

df['卧室朝向'] = df['房屋名称'].apply(lambda x : re.split(r'(.*?)·(.*)(\d居*室.*)-(.*)',x)[4])

3.2.房间信息数据清洗

我们看到关于房间大小、楼层等信息是在一个字段中，也是需要进行分拆的。

# 房间信息解析

# 我们在数据处理中发现存在异常数据（楼层如 7层或 -1/5层）

s = '87.26㎡|11/29层'

re.split(r'(.*?)㎡\|(-?\d+)\/?(.*?)层',s)

同样采用正则的方式，用apply方法处理：

df['房间大小'] = df['面积/楼层'].apply(lambda x : re.split(r'(.*?)㎡\|(-?\d+)\/?(.*?)层',x)[1])

df['房间楼层'] = df['面积/楼层'].apply(lambda x : re.split(r'(.*?)㎡\|(-?\d+)\/?(.*?)层',x)[2])

df['房间楼房层数'] = df['面积/楼层'].apply(lambda x : re.split(r'(.*?)㎡\|(-?\d+)\/?(.*?)层',x)[3])

3.3.位置信息数据清洗

在位置信息中记录的是小区距离地铁站的距离，我们需要的元数据是地铁站和距离数字，同样也需要进行分拆。这里需要注意的是，在该列数据中，有部分数据是不含此类信息的，需要进行特殊处理（这其实就是爬虫过程中解析判断遗留的情况）。

在这里我是用的比较特定的处理逻辑，先取异常数据中的地址信息，然后判断字符长度进行清洗处理。

# 替换非地铁信息位置

df['位置'] = df['位置'].apply(lambda x: re.sub('<(.*?)>','',x))

# 获取最近地铁站

def getMetro(x):

if len(x) >= 9:

return re.split(r'小区距(.*?)步行约(\d+?)米',x)[1]

else:

return ''

# 获取距离地铁站的距离

def getDistance(x):

if len(x) >= 9:

return re.split(r'小区距(.*?)步行约(\d+?)米',x)[2]

else:

return ''

df['附近地铁站'] = df['位置'].apply(getMetro)

df['距离地铁站距离'] = df['位置'].apply(getDistance)

到这里，基本元数据都已经解析获得。

3.4.选取需要用于分析的字段

原数据经过清洗处理后，有较多字段是我们后续用不上的，这里可以选择需要的字段即可。此外，我们后续需要新增一个字段“price”是指平均每平米每月的租金，在这里简单处理一下即可获得。

data = df[['id', '房屋名称', '租金', '租金单位', '标签', '地区', '类型', '小区', '户型',

'卧室朝向', '房间大小', '房间楼层', '房间楼房层数', '附近地铁站', '距离地铁站距离']]

# 计算租金元/月/平米，取小数点后2位

data.loc[data['租金单位']=='月', 'price'] = round(data['租金']/data['房间大小'].astype(float),2)

data.loc[data['租金单位']=='天', 'price'] = round(30*data['租金']/data['房间大小'].astype(float),2)

4.房源相关数据统计与可视化

先简单看看数据源，一共23,574个房源。

本节我们使用pyecharts进行可视化绘制。

# 引入需要用到的库

from pyecharts.globals import CurrentConfig, NotebookType

CurrentConfig.NOTEBOOK_TYPE = NotebookType.JUPYTER_LAB

from pyecharts import options as opts

from pyecharts.commons.utils import JsCode

from pyecharts.charts import *

4.1.房源分布(map)

自如北京的房源基本都分布在中心城区及次中心区，像延庆、怀柔、密云和平谷等郊区便没有任何房源数据。

# 统计各地区房源数

beijing = data.groupby('地区',as_index=False)['id'].count().sort_values('id',ascending=False).reset_index(drop=True)

beijing.loc[~beijing['地区'].str.endswith('区'),'地区']=beijing['地区']+'区'

绘图代码：

# 绘制地图（区）

c = (

Map(init_opts=opts.InitOpts(theme='dark', width='800px'))

.add("房源数", [list(z) for z in zip(beijing['地区'].to_list(), beijing['id'].to_list())], "北京", label_opts=opts.LabelOpts(is_show=False))

.set_global_opts(

title_opts=opts.TitleOpts(title="自如北京房源数分布",

subtitle='数据采集日期：2020年12月'),

visualmap_opts=opts.VisualMapOpts(max_=5000)

)

# c.render('map_beijing.html')

c.render_notebook()

4.2.各地区房源数

自如北京租房房源数最多的朝阳区高达7,925，远超过其他地区。其次是海淀区、丰台区和昌平区，基本都在2000+。

绘图代码：

# 绘制柱状图

bar = (Bar(init_opts=opts.InitOpts(theme='dark', width='800px'))

.add_xaxis(beijing['地区'].to_list())

.add_yaxis("", beijing['id'].to_list())

.set_series_opts(label_opts=opts.LabelOpts(is_show=True,

position='right',

font_style='italic'),

itemstyle_opts=opts.ItemStyleOpts(

color=JsCode("""new echarts.graphic.LinearGradient(1, 0, 0, 0,

[{

offset: 0,

color: 'rgb(255,99,71)'

}, {

offset: 1,

color: 'rgb(32,178,170)'

}])"""))

)

.set_global_opts(

title_opts=opts.TitleOpts(title="自如北京房源数量",

subtitle='数据采集日期：2020年12月'),

xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45)),

legend_opts=opts.LegendOpts(is_show=True))

.reversal_axis()

)

bar.render_notebook()

4.3.各区房源数占比

朝阳区和海淀区基本是大部分公司聚集地，自如在其的房源数占比也接近自如北京全部的一半！！

绘图代码：

# 富文本

rich_text = {

"a": {"color": "#999", "lineHeight": 22, "align": "center"},

"b": {"fontSize": 12, "lineHeight": 33},

"per": {

"color": "#eee",

"backgroundColor": "#334455",

"padding": [2, 4],

"borderRadius": 2,

}

location = beijing['地区'].to_list()

num = beijing['id'].to_list()

pie = (Pie(init_opts=opts.InitOpts(theme='dark', width='800px',

height='560px',

))

.add('房源数', [list(z) for z in zip(location, num)],

radius=200, #设置饼图半径

label_opts=opts.LabelOpts(position='outsiede',

formatter="{b|{b}: }{c} {per|{d}%} ",

rich=rich_text))

.set_global_opts(legend_opts=opts.LegendOpts(is_show=False),

title_opts=opts.TitleOpts(title="自如北京各区房源数量占比",

subtitle='数据采集日期：2020年12月'),)

)

pie.render_notebook()

4.4.租房类型分布

自如的租房主要分为三类：合租、整租和豪宅（我这里去掉了自如寓）。不得不说，朝阳的房子真多，而且豪宅这种只在东城区和朝阳才有！！

# 租房类型分布统计

houseType = data.pivot_table(values='id',index='地区',columns='类型',aggfunc='count').fillna('')

绘图代码：

# 绘制租房类型分布

bar = (

Bar(init_opts=opts.InitOpts(theme='dark', width='800px'))

.add_xaxis(houseType.index.to_list())

.add_yaxis('合租', houseType['合租'].to_list())

.add_yaxis('整租', houseType['整租'].to_list())

.add_yaxis('豪宅', houseType['豪宅'].to_list())

.set_global_opts(legend_opts=opts.LegendOpts(is_show=True),

xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45)),

title_opts=opts.TitleOpts(title="自如北京各区租房类型分布",

subtitle='数据采集日期：2020年12月'),

)

bar.render_notebook()

豪宅是啥样的

比如下面这个：

海晟名苑(北区)

本月均价：103659元/平米

所在板块：东城东直门外

总户数：352户

绿化率：50%（绿化率高）

停车位：暂无数据

物业类型：公寓

竣工时间：2015年

4.5.地铁站附近房源数据

对于打工人来说，好的房源是靠近地铁站的，那么那些地铁站附近房源最多呢？

metro = data.groupby(['地区','附近地铁站'],as_index=False)['id'].count().sort_values(['地区','id'],ascending=False).reset_index(drop=True)

metro = metro[metro['附近地铁站']!='']

这里我们仅展示朝阳、海淀、丰台和昌平区：朝阳的十里堡、立水桥南，海淀的永泰庄、农大南路，丰台的角门东，昌平的回龙观东大街、天通苑南站、龙泽、霍营等等都是很热门的。

绘图代码：

# 绘制组合图

bar1 = (Bar()

.add_xaxis(metro[metro['地区']=='朝阳'].head()['附近地铁站'].to_list())

.add_yaxis('朝阳区', metro[metro['地区']=='朝阳'].head()['id'].to_list())

.set_global_opts(legend_opts=opts.LegendOpts(is_show=True, pos_right="70%",pos_top="10%"),

xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45)),

title_opts=opts.TitleOpts(title="自如北京各区地铁站附近房源数前5名",

subtitle='数据采集日期：2020年12月'))

)

bar2 = (Bar()

.add_xaxis(metro[metro['地区']=='海淀'].head()['附近地铁站'].to_list())

.add_yaxis('海淀区', metro[metro['地区']=='海淀'].head()['id'].to_list())

.set_global_opts(legend_opts=opts.LegendOpts(is_show=True, pos_right="70%",pos_top="52%"),

xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45)))

)

bar3 = (Bar()

.add_xaxis(metro[metro['地区']=='丰台'].head()['附近地铁站'].to_list())

.add_yaxis('丰台区', metro[metro['地区']=='丰台'].head()['id'].to_list())

.set_global_opts(legend_opts=opts.LegendOpts(is_show=True, pos_left="70%", pos_top="10%"),

xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45)))

)

bar4 = (Bar()

.add_xaxis(metro[metro['地区']=='昌平'].head()['附近地铁站'].to_list())

.add_yaxis('昌平区', metro[metro['地区']=='昌平'].head()['id'].to_list())

.set_global_opts(legend_opts=opts.LegendOpts(is_show=True, pos_left="70%",pos_top="52%"),

xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45)))

)

grid = (Grid(init_opts=opts.InitOpts(theme='dark', width='800px',))

.add(bar1,grid_opts=opts.GridOpts(pos_bottom="60%", pos_right="60%"))

.add(bar2,grid_opts=opts.GridOpts(pos_top="60%",pos_right="60%"))

.add(bar3,grid_opts=opts.GridOpts(pos_bottom="60%", pos_left="60%"))

.add(bar4,grid_opts=opts.GridOpts(pos_top="60%",pos_left="60%"))

)

grid.render_notebook()

4.6.租金前10名地铁站圈

平均租金前10的地铁站圈，平均每平米每月租金都高达320元，相当于10平米的单间均价每月3200以上！！

metroPrice = data.groupby('附近地铁站',as_index=False)['price'].mean().sort_values('price',ascending=False).reset_index(drop=True)

绘图代码：

# 绘制柱状图

bar = (

Bar(init_opts=opts.InitOpts(theme='dark', width='800px'))

.add_xaxis(metroPrice.head(10)['附近地铁站'].to_list())

.add_yaxis('', metroPrice.head(10)['price'].round(2).to_list())

.set_series_opts(label_opts=opts.LabelOpts(formatter='{c}'))

.set_global_opts(legend_opts=opts.LegendOpts(is_show=True),

xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45)),

title_opts=opts.TitleOpts(title="自如北京地铁附近租金前10名(元/月/平米)",

subtitle='数据采集日期：2020年12月'),

)

bar.render_notebook()

4.7.各区合租类平均租金箱线图

东城、西城和海淀区在合租类租房平均在300左右，大部分其实都是超过300（即10平米月租金3000+）。

绘图代码：

# 箱线图

# 合租类

x_data = list(data['地区'].unique())

y_data = [data[(data['地区']==x)&(data['类型']=='合租')]['price'].to_list() for x in x_data]

Box = (Boxplot(init_opts=opts.InitOpts(theme='dark', width='800px'))

.set_global_opts(legend_opts=opts.LegendOpts(is_show=True),

xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45)),

title_opts=opts.TitleOpts(title="自如北京各区【每平米每月房租】箱线图-合租类",

subtitle='数据采集日期：2020年12月'),

)

Box.add_xaxis(x_data)

Box.add_yaxis("", Box.prepare_data(y_data))

Box.render_notebook()

4.8.各区整租类平均租金箱线图

整租类平均租金低于合租类，约为合租类的一半，毕竟一般都带有客厅或者厨房之类，整体空间较大。

比如，我们常见的合租单间可能是12平米，价格在3600左右，但是对于整租50平左右的可能要价在7000左右。

5.房间相关数据统计与可视化

就房间本身而言，价格、大小、楼层、卧室朝向以及距离地铁站距离等等都是我们在选择的时候会考虑的点。

简单做相关关联散点图，发现其实房间大小越大均价越低，其他方面似乎并没有太明显的关系。

本节会涉及到seaborn绘图库的使用。

# 引入相关绘图库

import matplotlib.pyplot as plt

plt.rcParams['font.family'] = ['Microsoft YaHei'] #设置全局默认字体为幼圆

plt.rcParams['axes.unicode_minus'] = False # 解决中文字体下负号显示问题

import seaborn as sns

sns.set_style("darkgrid",{"font.family":['Microsoft YaHei', 'SimHei']}) #seaborn绘图的字体设置

绘图代码：

plt.rcParams["axes.labelsize"] = 16 # 设置全局轴标签字典大小

# 由于部分房源未标注距离地铁站距离，这里我们只选有此数据的

score = data[data['距离地铁站距离']!=''][['price','房间大小','房间楼层','距离地铁站距离','类型']]

score['距离地铁站距离'] = score['距离地铁站距离'].astype('int')

# 散点图矩阵

sns.pairplot(score, hue='类型',height=3)

5.1.合租类房间大小直方图

大部分的合租类房间大小在10平米上下，这便是绝大多数租房客们的现状，一张床、一个书桌再带上一个稍微大点的衣柜就基本满了。

绘图代码：

plt.figure(figsize=(15,8))

sns.set_context("talk")

sns.histplot(data[data['类型']=='合租'].房间大小).set(ylabel='数量')

5.2.整租类房间大小直方图

大部分的整租类房间大小在40-60平米之间，这类房间一般都是一室一厅，大一点的会带厨房，对于个人来说是非常理想的居住环境，但是租金一般都在7000左右，属实有点高了。

5.3.合租类房间租金直方图

图中有部分是在最左侧，这部分是日租的房子。我们看北京整体，合租类单间大部分落在2000-4000之间。

再看看海淀区，大部分落在3000上下

5.4.整租类房间租金直方图

图中有部分是在最左侧，这部分是日租的房子。我们看北京整体，合租类单间大部分落在5000-7500之间。

再看看海淀区，基本上都落在5000+以上，以7000左右居多。

5.5.房源距离地铁站距离直方图

其实大部分的房源距离最近地铁站步行距离较近，1000米以内。绝大多数的房源距离最近地铁站直线距离在1.5公里，感觉步行到地铁站也就15分钟以内。

5.6.平米租金与距离地铁站距离回归图

简单做回归关系图，大致呈现距离地铁站越近其平均平米房租越低。不过，大家可以试着做归一化处理后再来看，可能会更明显，这里不做展开，大家留作作业吧！

5.7.各区卧室朝向与平米租金热力图

我们观察卧室朝向和平均平米租金热力图，怎么感觉北卧和东北卧的价格更高呀，反正我住的是北卧！！

# 数据统计

data_table = data[data['类型']=='合租'].pivot_table(values='price',index='卧室朝向',columns='地区',aggfunc='mean')

绘图代码：

# 卧室朝向价格热力图

plt.figure(figsize=(15,8))

# sns.set_context("talk")

sns.set_context("notebook")

sns.heatmap( data_table, cmap='Reds', annot=True, fmt='0.2f', linewidths=0.2)

5.8.户型分布

合租房以3居室为主，其次是4居室和2居室；整租房以一室一厅和二室一厅为主，其他户型较少。原文地址：Python爬取自如北京2.3万条租房信息，发现快租不起房子了_dxawdc的博客-CSDN博客

你可能感兴趣的:(Python爬取北京2.3万条租房信息，发现快租不起房子了！)

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
《策划经理回忆录之二》路基雅虎
话说三年变六年，飘了，飘了……眨眼，2013年5月，老吴回到了他的家乡——油城从新开启他的工作幻想症生涯。很庆幸，这是一家很有追求，同时敢于尝试的，且实力不容低调的新星房企——金源置业(前身泰源置业)更值得庆幸的是第一个盘就是油城十路的标杆之一:金源盛世。2013年5月，到2015年11月，两年的陪伴，迎来了一场大爆发。2000个筹，5万/筹，直接回笼1个亿！！！这……让我开始认真审视这座看似五线
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
三大师传 beca酱
巴尔扎克的作品被誉为“法国社会的一面镜子”。文学大师维克多·雨果对巴尔扎克的评价是：“在最伟大的人物中间，巴尔扎克是名列前茅者；在最优秀的人物中间，巴尔扎克是佼佼者之一。”一个原本寂寂无名的小人物，从地中海的某个海岛上，只身一人来到巴黎，没有朋友，也没有名望。作为一个一文不名的外乡人，凭着赤手空拳赢得了巴黎，征服了整个法兰西，并且赢得了世界。这个人就是十九世纪法国伟大的军事家、政治家，法兰西第一帝
第一场雪岁月静好_nx
早晨起来，外面白茫茫的一片，总算是下雪了，这还是今年第一场雪呢！走在路上，踩着雪“咯吱咯吱”的，空气很湿润。树上、草坪上、屋顶上都落了白白的一层，天上还零星漂着几点雪。慢慢走在路上，呼吸着清新的空气，感受着冬天的美好，心情也好多了。
我的烦恼余建梅
我的烦恼。女儿问我：“你给学生布置什么作文题目？”“《我的烦恼》。”“他们都这么大了，你觉得他们还有烦恼吗？”“有啊！每个人都会有自己烦恼。”“我不相信，大人是没有烦恼的，如果说一定有的话，你的烦恼和我写作业有关，而且是小烦恼。不像我，天天被你说，有这样的妈妈，烦恼是没完没了。”女儿愤愤不平。每个人都会有自己的烦恼，处在上有老下有小的年纪，烦恼多的数不完。想干好工作带好孩子，想孝顺父母又想经营好自
《大清方方案》| 第二话谁佐清欢
和珅究竟说了些什么？竟能令堂堂九五之尊龙颜失色！此处暂且按下不表；单说这位乾隆皇帝，果真不愧是康熙从小带过的，一旦决定了要做的事，便杀伐决断毫不含糊。他当即亲自拟旨，着令和珅为钦差大臣，全权负责处理方方事件，并钦赐尚方宝剑，遇急则三品以下官员可先斩后奏。和珅身负皇上重托，岂敢有半点怠慢，当夜即率领相关人等，马不停蹄杀奔江汉。这一路上，和珅的几位幕僚一直在商讨方方事件的处置方案。有位年轻幕僚建议快刀
本周第二次约练 2cfbdfe28a51
中原焦点团队中24初26刘霞2021.12.3约练161次，分享第368天当事人虽然是带着问题来的，但是咨询过程中发现，她是经过自己不断地调整和努力才走到现在的，看到当事人的不容易，找到例外，发现资源，力量感也就随之而来。增强画面感，或者说重温，会给当事人带来更深刻的感受。
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
情殇——（5）压抑的小木匠放纵了自己。石疯聊情感故事
木讷的小木匠，其实只是不苟言笑。其实内心深处也是挣扎着，由于性格内敛，不喜形于色，给人的感觉非常的木讷。其实小木匠情商智商都不低。他为人扎实，非常的务实。他的爱是既深沉又宽容。可是是一个男人，都会对妻子出轨的事儿，不会忘怀！只是压抑在心底，为了某种考量或许是真爱。小木匠对于丽影和别人私奔又重回家庭，表面上并没有，天翻地覆，暴风骤雨，其内心深处也是经历了，痛苦的挣扎。。。再一次酒后，他和一个离家多年
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他