Raymone_

利用 Python 分析城市各区域楼盘

文章目录

1. 项目目标
2. 信息爬取
- 2.1 房产网站 URL 分析
- 2.2 楼盘列表页爬取
- 2.3 楼盘详情页爬取
- 2.4 保存文件
- 2.5 提高代码运行速度
3. 数据分析
- 3.1 数据清洗
- 3.2 数据分析与可视化
4. 总结
*5. 拓展
- 5.1 选择不同城市爬取分析
- 5.2 利用数据库进行存储

1. 项目目标

信息爬取：通过爬取某房产网站，得到重庆各楼盘的一些基本信息，包括楼盘名称，楼盘区域，参考价格，产权年限，开发商，物业公司，物业费，容积率，绿化率等信息
数据分析：利用 Pandas, Numpy 等数据分析库对数据进行清洗与整理，并分析数据得出结论

2. 信息爬取

2.1 房产网站 URL 分析

1. 基础 URL：

通过观察房产链接，可以看到其基础 URL 格式如下：
```
  https://[city].fang.lianjia.com/loupan/
```
其中 city 为城市拼音首字母，例如重庆为 ‘cq’

2. 楼盘列表页：

楼盘列表页包含了楼盘名称和对应的楼盘代码，楼盘代码是楼盘详情页链接的组成部分，所以我们要先提取列表页的信息
观察可以发现，列表页的 URL 格式如下：
```
  base_url + house_class + page
```
其中：
- house_class = {‘全部’: ‘’, ‘住宅’: ‘nht1’, ‘别墅’: ‘nht2’, ‘写字楼’: ‘nht3’, ‘商业’: ‘nht4’, ‘底商’: ‘nht5’,}，本次我们只分析住宅，所以选择 ‘nht1’
- page，页数，与 house_class 直接相连，没有任何分隔符，格式为 ‘pg’+number，一页 10 个楼盘，我们分析前 50 页

于是我们的列表页链接为：

  pages = range(1, 51)
  my_list_url = base_url + my_house_class + page, page in pages
  如：https://cq.fang.lianjia.com/loupan/nht1pg1

3. 楼盘详情页

观察可以发现，楼盘详情页的 URL 格式如下：
```
  base_url + 'p_'+ 楼盘代码 + '/xiangqing/'
```
可见关键部分为楼盘代码，这部分通过爬取列表页得到。通过观察列表页的源码，如下截图，我们可以在爬取楼盘列表页的时候使用 BeautifulSoup，利用 CSS 选择器，在楼盘列表页提取对应节点和楼盘代码。
```
  selected = soup.select('ul.resblock-list-wrapper div.resblock-name a')
```

2.2 楼盘列表页爬取

1. 网页源码分析：

楼盘列表页中，我们只需要提取楼盘名称及其对应的 URL 代码即可，在 Chrome 中查看楼盘名称的源码，可以发现该文字链接在一个 a 节点中，完整的节点结构如下，在爬取的时候可以适当简化：
```
  body > div.resblock-list-container.clearfix > ul.resblock-list-wrapper > li:nth-child(1) > div > div.resblock-name > a
```

2. 提取信息：

知道了楼盘名称及其代码的节点结构后，我们使用 BeautifulSoup 的 CSS 选择器来选中节点，并提取相关信息，存储到字典中，封装为函数后的代码如下：

def get_name_dic(url):
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.text, 'lxml')
    selected = soup.select('ul.resblock-list-wrapper div.resblock-name a')
    name_dic = {
     }
    for item in selected:
        name_dic[item.string] = item['href'][8:]
        print('code of {} getted.'.format(item.string))
    return name_dic

2.3 楼盘详情页爬取

1. 网页源码分析

节点查找： 打开任意几个楼盘的详情页，观察网页结构及源码，发现我们需要的信息都在 class 为 x-box 的 ul 节点下面的 li 节点中，其中 ul 节点有两个，分别为基本信息和规划信息，前者包含参考价格，区域位置以及开发商，后者包含绿化率、容积率、产权年限等信息。
节点分析：
- 在 li 节点中，信息名称在 class 为 label 的节点中，信息值在 class 为 label-val 的节点中。
- 仔细观察发现，参考价格并没有在 li .label-val 节点中，而在其子节点中，不过没有关系，当我们使用 text 属性提取文本的时候，节点中的所有文本都会被提取出来。
- 对于区域名称也是一样的，即使城市名称和区域名称是分开的，我们可以都提取出来，在后面数据处理的时候统一处理，这样所有类型的信息提取方法都是一样的了。

2. 提取信息

我们同样使用 BeautifulSoup 的 CSS 选择器来选中节点，并提取相关信息，存储到字典中，封装为函数后的代码如下：

# 获取楼盘中需要的信息
def get_info(url):
    soup = get_soup(url)
    lis = soup.select('ul.x-box li')
    infos = {
     }
    my_keys = ['参考价格：', '区域位置：', '绿化率：', '容积率：', '产权年限：', '开发商：', '物业公司：', '物业费：']
    for li in lis:
        if li.select('.label')[0].text in my_keys:
            label = li.select('.label')[0].text.replace('：', '')
            value = li.select('.label-val')[0].text.strip()
        else:
            continue
        infos[label] = value
        print('info getted')
    return infos

2.4 保存文件

由于我们保存的数据结构均为字典，这里我们先保存为 JSON 格式的文件（后面再拓展以下保存至数据库等）
注意中文字符在转换为 JSON 对象的时候要添加 ensure_ascii=False，否则会出现乱码
另外我们在每次写入后都添加了一个换行符，避免一行字符太多，方便后面逐行读取数据
封装后的代码如下：

def save_to_json(data, name='data'):
    results = json.dumps(data, ensure_ascii=False)
    with open(name + '.json', 'a+', encoding='utf-8') as f:
        f.write(results)
        f.write('\n')
    return None

2.5 提高代码运行速度

1. 第一版，效率低下

其实上面已经完成了爬取的基本模块，主函数如下，但是运行速度很慢，爬取 50 页，500 个楼盘花了约 6 分多钟，需要提高代码运行效率。

'''效率低下版'''
CITY = 'cq'
MY_HOUSE_CLASS = 'nht1'
PAGES = range(1, 51)
def main():
	# 文件初始化
    with open(CITY + '.json', 'w', encoding='utf-8') as f:
        pass
	base_url = 'https://{}.fang.lianjia.com/loupan/'.format(CITY)
	houses = []
    name_dic = {
     }
    start = ctime()
    # 获取楼盘名称及代码
    for page in PAGES:
        print(page)
        list_url = '{base}{house}pg{page}'.format(base=base_url, house=MY_HOUSE_CLASS, page=page)
        name_dic.update(get_name_dic(list_url))
	# 爬取各楼盘信息
    for name, code in name_dic.items():
        detail_url = base_url + code + 'xiangqing/'
        my_info = get_info(detail_url)
        my_info['楼盘名称'] = name
        houses.append(my_info)
    # 保存文件
    save_to_json(houses)
    end = ctime()
    print('All done\nStarted at {}, done at {}'.format(start, end))

2. 多线程版本

前段时间刚学习了使用 threading 模块实现多线程，在这个项目中，由于每页的爬取与存储是相对独立，互不干扰的，因此我们可以将每页的爬取与存储封装为一个函数，再使用 threading 模块实现多线程，使每页的工作同时进行。修改代码后，整个工作只使用了 40 多秒，速度提升了约 90% 。多线程版本的代码如下：

# 定义每页的爬取与保存函数
def get_and_save(page, base_url, filename):
    page_info = []
    print(page)
    list_url = '{base}{house}pg{page}'.format(base=base_url, house=MY_HOUSE_CLASS, page=page)
    name_dic = get_name_dic(list_url)
    for name, code in name_dic.items():
        detail_url = base_url + code + 'xiangqing/'
        my_info = get_info(detail_url)
        my_info['楼盘名称'] = name
        page_info.append(my_info)
    save_to_json(page_info, name=filename)
    print('Page {} saved'.format(page))


# 主函数
def main():
    # 文件初始化
    with open(CITY + '.json', 'w', encoding='utf-8') as f:
        pass
    base_url = 'https://{}.fang.lianjia.com/loupan/'.format(CITY)
    print('Started at:{}'.format(ctime()))
    for page in PAGES:
        threading.Thread(target=get_and_save, args=(page, base_url, CITY)).start()

@register
def _atexit():
    print('All done at {}'.format(ctime()))

3. 数据分析

信息提取完成后开始进行数据清洗与分析工作

3.1 数据清洗

1. 读取数据

首先读取数据，并将其转换为 DataFrame：

# 读取文件
with open('D://Code/House Analysis/{}.json'.format(city), 'r', encoding='utf-8') as f:
	for line in f.readlines():
		data.extend(json.loads(line))

# 转换为 DataFrame
df = pd.DataFrame(data, index=(range(1, len(data) + 1)))

2. 索引处理

将行索引重命名为 No
将列索引重排序，并利用字典映射重命名

# 索引处理
df.index.name = 'No'
new_col = ['楼盘名称', '区域位置', '参考价格', '产权年限', '开发商', '物业公司', '物业费', '容积率', '绿化率']
col_name = {
     '参考价格': '价格 (元/平)', '产权年限': '产权 (年)', '物业费': '物业费 (元/平/月)', '绿化率': '绿化率（%）'}
df = df.reindex(columns=new_col).rename(columns=col_name)

3. 区域位置处理

提取区域位置的时候，我们包含了城市名，这里我们将城市名去掉，只保留区县：

# 区域位置数据处理，去掉城市，只保留区县
df['区域位置'] = df['区域位置'].map(lambda x: str(x).split('-')[1])

4. 均价处理

均价有三种情况，最多的是单价，另外还有一些总价形式的，还有一些是价格未定的。
我们利用正则表达式提取数字，价格未定以及总价形式的不具有可比性，并且数量不多，暂以 NA 填充

price_re = re.compile(r'均价 (\d+)元/平')
# 先函数映射正则匹配，再剔除未匹配到的，再利用函数映射提取数据，这里使用了 pandas 的方法链，一步到位
df['价格 (元/平)'] = df['价格 (元/平)'].map(lambda x: price_re.match(x)).dropna().map(lambda x: int(x.group(1)))

5. 产权处理

产权和均价一样，有些是唯一的，有些根据户型不同有不同的产权，但多种产权的楼盘数量不多，这里我们都提取第一个数字，以节约资源

# 产权修改，产权有些有多种，但数量不多，为了节省资源，以第一个数字为准
df['产权 (年)'] = df['产权 (年)'].map(lambda x: int(x[:2]))

6. 物业费处理

物业费有些是范围，有些是数字，还有些是暂无信息。对于范围的，我们利用 numpy 求平均值，需注意缺失值处理
这里我们都使用 split 方法来提取数字，对于不是范围的，split 得到的只有一个数字，在进行求均值的时候并不影响，所以统一方法，不用判断是数字还是范围

# 先提取数字部分，以 '~' 分隔，并剔除缺失值
no_na = df['物业费 (元/平/月)'].map(lambda x: x[:-6].split('~') if x[:-6] != '' else None).dropna()
# 转换为 array 数组并求平均值
df['物业费 (元/平/月)'] = no_na.map(lambda x: np.array(list(map(float, x))).mean())

7. 容积率、绿化率处理

读取 JSON 文件后，数据类型都是字符串，因此需要将容积率、绿化率转换为数字，其中因为绿化率的单位是 % ，因此需提取数字字符串后再转换为数字类型

# 将容积率、绿化率转换为数字
df['容积率'] = df['容积率'].map(lambda x: float(x))
df['绿化率（%）'] = df['绿化率（%）'].map(lambda x: float(x[:-1]) if x != '暂无信息' else None)

8. 保存数据

处理后的数据为 DataFrame，可以保存为 CSV 或者 Excel

df.to_csv('Processed_{}.csv'.format(city.upper()), encoding='utf-8-sig')

3.2 数据分析与可视化

1. 各区县楼盘数量与均价对比

首先，坐标轴要显示中文，需设置图片全局参数；

# 显示中文
from pylab import *
mpl.rcParams['font.sans-serif']=['SimHei']

然后计算区域楼盘数、各区均价、全市均价并绘制到同一个图里。这里设置了 marker，设置了轴名称等，并且有双坐标轴

# 计算区域楼盘数
area = df['区域位置'].value_counts()
# 计算各区均价
price = df.groupby(df['区域位置'])[['价格 (元/平)']].mean().reindex(area.index)
# 计算全市均价
average_price = df['价格 (元/平)'].mean()
# 设置图片参数
plt.rc('figure', figsize=(8, 6))
plt.rc('font', size=10)
# 新建绘图区
fig, axes1 = plt.subplots(1, 1)
# 设置图片标题
axes1.set_title('{}各区楼盘数量及均价图', fontsize=16)
# 绘制各区域楼盘数柱状图
axes1.bar(x=area.index, height=area.values, label='各区楼盘数', color='k', alpha=0.3)
# x 轴标签旋转 45 度，设置 x, y 轴名称
axes1.set_xticklabels(area.index, rotation=45)
axes1.set_xlabel('区域')
axes1.set_ylabel('楼盘数量')
# 绘制各区均价，与 axes1 共用 x 轴
axes2 = axes1.twinx()
axes2.plot(price.values, label='各区均价', color='darkorange', marker='o', markersize='5', markerfacecolor='white')
axes2.set_ylabel('均价（元/平）')
# 设置均价值标签
x = np.arange(len(price))
y = np.array(price.values)
for a,b in zip(x,y1):
    plt.text(a, b+0.1, '%.0f' % b, fontsize=8, horizontalalignment='center', verticalalignment='bottom')
# 绘制全市均价线，与 axes2 共用 y 轴
axes3 = axes2.twiny()
axes3.plot(np.ones(len(area)) * average_price, 'r--', label='全市均价：%d' % average_price)
axes3.set_xticks([])  # 关闭均价线的 x 轴
# 设置图例
handles1, labels1 = axes1.get_legend_handles_labels()
handles2, labels2 = axes2.get_legend_handles_labels()
handles3, labels3 = axes3.get_legend_handles_labels()
plt.legend(handles1 + handles2 + handles3, labels1 + labels2 + labels3, loc='best')
# 保存图片
plt.savefig('{}各区域楼盘数量及均价.png'.format(cities[city]), dpi=400, bbox_inches='tight')
# 关闭绘图区
plt.close()

得到的图片如下：

结论：
- 数量：楼盘数量最多的区域是渝北、巴南以及九龙坡，最少的为梁平
- 均价：市区内的均价均已达到 1W 以上，其中渝中区一枝独秀（富人区），其次为江北、南岸。全市的均价约为 1.3 W，九龙坡、大渡口最接近全市均价

2. 各区县楼盘平均产权、物业费、绿化率、容积率对比

接下来计算其他四项指标，这里我们将四个指标绘制在一个图中，分为 4 个子图，格式统一，因此我们使用循环来完成，避免重复代码

# 计算各指标，并封装到列表中，以便遍历调用
grouped = df.groupby(df['区域位置'])
property_years = grouped[['产权 (年)']].mean().reindex(area.index)
property_costs = grouped[['物业费 (元/平/月)']].mean().reindex(area.index)
volume_rate = grouped[['容积率']].mean().reindex(area.index)
greening_rate = grouped[['绿化率（%）']].mean().reindex(area.index)
values = [property_years, property_costs, volume_rate, greening_rate]
# 设置图片参数
plt.rc('figure', figsize=(10, 10))
plt.rc('font', size=8)
# 新建绘图区
fig, axes = subplots(2, 2)
# 指标序号
k = 0
keys = ['产权', '物业费', '容积率', '绿化率']
# 开始绘图
for i in range(2):
    for j in range(2):
        # 绘制各指标
        axes[i, j].bar(x=values[k].index, height=values[k].values.T[0], color='k', alpha=0.3)
        # x 轴标签旋转 45 度
        axes[i, j].set_xticklabels(values[k].index, rotation=45)
        axes[i, j].set_xlabel('区域')
        axes[i, j].set_ylabel(values[k].columns[0])
        axes[i, j].set_title('重庆各区域楼盘平均{}对比'.format(keys[k]))
        # 设置值标签
        x = np.arange(len(values[k]))
        y = np.array(values[k].values)
        for a,b in zip(x,y):
            axes[i, j].text(a, b+0.05, '%.0f' % b, ha='center', va= 'bottom',fontsize=8)
        k += 1
# 调整子图周围间距
plt.subplots_adjust(hspace = 0.3)
# 保存图片
plt.savefig('{}各区域楼盘产权、物业费、容积率及绿化率.png'.format(cities[city]), dpi=400, bbox_inches='tight')
# 关闭绘图区
plt.close()

得到的图片如下：

结论：
- 产权：全市产权几乎都为 50 年，少部分楼盘还有 60、70年产权的
- 物业费：渝中区最贵，平均 4 块/平/月，不愧是富人区，其他的平均在 2~3 块钱
- 容积率：渝中区仍然一枝独秀，容积率高达 6，说明全是高楼大厦，其他区都在 2~3，楼层并不高
- 绿化率：綦江最高 39%，璧山紧随其后 38%，梁平仅 20% 仍需努力，其他区都在 30%~35%

4. 总结

以上完成了数据爬取、数据清洗、数据分析以及数据可视化，这只是一个简单的项目，用到的都是一些基础知识，中间有遇到过很多问题，例如 CSS 节点选择、JSON 编码格式、代码运行效率慢、绘图样式不熟等等问题。不过通过查询资料以及工具文档，最终完成了第一个自己的项目，很好地巩固了之前学习的知识。
对于这个项目，还有很多其他的想法，例如可以选择城市，爬取不同城市的数据，甚至城市与城市对比；另外还有给各指标设置一个权重，计算各楼盘评分，得到各区县评分最高的楼盘，这个后面会继续研究

本项目源代码放到了 Github 上，如有需要可查阅，地址如下
https://github.com/Raymone23/House-Analysis

----------------------------------------------8/28 更新------------------------------------------------------

*5. 拓展

5.1 选择不同城市爬取分析

昨天的博客中有提到增加一个功能，使用户可以输入城市，然后爬取对应城市的数据，昨天完成了这个功能。

1. 城市代码：

文章前面提到我们爬取的基础 URL 的一个组成部分就是城市，因此最关键的地方在于城市字典，这部分我们可以通过爬取城市选择页面获得。
我们打开重庆的基础 URL，观察网页源代码，找到城市选择的部分，可以看到所有城市的名称及链接都在名称为 a 的节点中，我们单独用一个 CSS 选择器选择所有 class 为 clear 的 li 节点下面的所有 a 节点，再提取其文本及属性，封装到字典中即可

提取城市字典的代码如下，这部分我们没有封装到项目中，因为城市字典是固定变量，不需要每次都爬取：

import requests
from bs4 import BeautifulSoup
url = 'https://cq.fang.lianjia.com/loupan'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'lxml')
selected = soup.select('li.clear a')
cities = {
     }
for item in selected:
    cities[item.text] = item['href'].split('.')[0][2:]

2. 其他部分代码修改

得到城市字典后，其他部分相对简单，只需将城市字典作为全局变量加入，然后增加输入模块，最后将数据处理中的城市相关字符串进行格式化即可。

城市字典（城市较多，中间省略）：

CITIES = {
     
    '保定': 'bd',
    '保亭': 'bt',
    '北京': 'bj',
    '承德': 'chengde',
    ...
    '镇江': 'zj',
    '漳州': 'zhangzhou',
    '郑州': 'zz',
    '珠海': 'zh',
    '中山': 'zs',
}

输入模块：

因为我们城市字典并不包括所有城市，所以需要一个异常处理语句（也可以用条件语句）来处理用户输入的城市错误问题

# 选择城市
while True:
    try:
        inputs = input('选择你的城市：')
        city = CITIES[inputs]
    except KeyError:
        print('没有该城市数据，请重新输入!')
    else:
        break

字符串格式化就省略了，这个很简单
修改后得到的成都以及深圳的数据分析结果如下：

5.2 利用数据库进行存储

1. MySQL

MySQL 为关系型数据库，基础是二维表格，要将城市数据存储到 MySQL 中，需要先建立数据库，然后创建城市表，再添加表头，最后将爬取的数据插入表中
创建数据库：我们在第一次存储数据的时候需要创建一个数据库，之后只需连接即可，因此我们使用异常处理模块，尝试连接数据库，如果出现连接错误，则新建数据库：

# 连接数据库
try:
	db = pymysql.connect(host='localhost', user='root', password='xxxxxx', port=3306, db='house')
	cursor = db.cursor()
except pymysql.err.InternalError:
	db = pymysql.connect(host='localhost', user='root', password='xxxxxx', port=3306)
	cursor = db.cursor()
	cursor.execute('CREATE DATABASE house DEFAULT CHARACTER SET utf8')

创建表：创建数据库后，我们创建城市表，将每个城市的数据分别存储到一个表中

# 数据表表头，为 main 模块的全局变量
LIST = ["参考价格", "区域位置", "开发商", "绿化率", "容积率", 
		"产权年限", "物业公司", "物业费", "楼盘名称"]
HEAD = ' VARCHAR(255), '.join(LIST) + ' VARCHAR(255), PRIMARY KEY(楼盘名称)'

# 创建城市表
sql = 'CREATE TABLE IF NOT EXISTS {} ({})'.format(name, head)
cursor.execute(sql)
db.close()

存储到表中：爬取数据后，我们将数据存储到表中，这里我们使用 SQL 的更新数据语句，楼盘存在则更新，楼盘不存在则插入

def save_to_db(data, name='data'):
    # 表头键名
    keys = ', '.join(data.keys())
    # 构造插入的占位符，使用 , 分隔，数量等于字典的长度
    values = ','.join(['%s'] * len(data))
    # 连接数据库
    db = pymysql.connect(host='localhost', user='root', password='yeswedid631,,', port=3306, db='house')
    cursor = db.cursor()
    # 加上 ON DUPLICATE KEY，表明如果主键已经存在，则执行更新操作
    sql = 'INSERT INTO {table}({keys}) VALUES({values}) ON DUPLICATE KEY UPDATE'.format(table=name, keys=keys, values=values)
    # update = 'id = %s, name = %s, age = %s'
    update = ','.join([" {key} = %s".format(key=key) for key in data])
    # 完整的 SQL 语句
    sql += update
    try:
        cursor.execute(sql, tuple(data.values()) * 2)
        print('Data saved')
        db.commit()
    except:
        print('Failed to save data')
        db.rollback()
    db.close()
    return None

数据处理模块：数据处理模块中的数据读取部分也要改为读取数据库

db = pymysql.connect(host='localhost', user='root', password='yeswedid631,,', port=3306, db='house')
cursor = db.cursor()
cursor.execute('SELECT * FROM {}'.format(city))
rows = cursor.fetchall()
df = pd.DataFrame(list(rows), columns=[x[0] for x in cursor.description])

2. MongoDB

MongoDB 是非关系型数据库，是基于键值对的，比起 MySQL，更适合存储爬虫数据，使用上也相对简单很多
数据存储：MongoDB 创建数据库直接使用 MongoClient 对象即可，创建和连接表也很简洁，这里插入多条数据，使用 insert_many() 方法：

def save_to_db(data, name='data'):
    # 连接数据库
    client = pymongo.MongoClient(host='localhost', port=27017)
    db = client.house
    collection = db[name]
    collection.insert_many(data)
    print('Data saved')
    return None

数据读取：数据读取也很简单，使用 find() 方法即可。这里要注意的是在存储数据的时候自动添加了 _id 属性，在读取数据的时候要把 _id 去掉：

# 链接数据库
client = pymongo.MongoClient(host='localhost', port=27017)
db = client.house
collection = db[city]
data = []
for item in collection.find():
    del item['_id']
    data.append(item)
df = pd.DataFrame(data)

你可能感兴趣的:(项目,Python,爬虫,数据分析,重庆楼盘)

webpack 码上跑步 webpack 前端 node.js
webpack介绍webpack是一个构建工具,实现了模块化管理项目.他的工作方式是用各种loader将各种资源转化为js文件或者对js文件进行压缩编译亦或对静态资源进行处理.官网:webpack由来模块化存在一些问题1.ESM的兼容性问题2.模块文件过多,网络请求频繁3.前端的所有资源包括html和css都需要模块化构建工具应运而生,需要一个集编译,模块打包,支持不同的资源的模块打包工具.Web
vue脚手架码上跑步 vue.js 前端 javascript
Vue脚手架脚手架是官方提供的标准化开发工具。下载配置//全局安装vue的脚手架npminstall@vue/cli-g//在项目目录下开启一个脚手架vuecreate‘项目名’//进入项目目录，直接运行npmrunserve1.vue.js与vue.runtime.xxx.js的区别：（1).vue.js是完整版的Vue，包含：核心功能+模板解析器。（2）.vue.runtime.xxx.js是
Bug:QT不能生成可执行文件 lkasi bug
问题描述：为了生成可执行文件，将项目以release方式进行构建，并且在.pro文件中加入TEMPLATE=app#这生成一个exeQMAKE_LFLAGS+=-no-pie并且执行runqmake，生成的仍是sharedlibrary!!!解决方法：将下面代码放在.pro靠下的位置，并且再次执行runqmake,再构建就成功了TEMPLATE=app#这生成一个exeQMAKE_LFLAGS+=
vue打包编译【自动删除node_modules下的.cache缓存文件夹】 Eternitysy javascript 前端 vue.js
vue项目不断打包编译后，在node_modules目录下的.cache文件夹里的文件就越来越多，手动删除数量巨大，时间太长，下面是自动删除.cache这个文件夹的方法1.先安装依赖包rimraf：npminstallrimraf-g--save-dev2.在package.json文件的scripts部分添加一个脚本命令："scripts":{"clean":"rimrafnode_module
【推荐项目】044-中医门诊管理系统蜗牛 | ICU 推荐项目 java 前端框架毕设 spring mybatis
044-中医门诊管理系统介绍javaspringbootvuejs中医门诊管理系统为了帮助您更清晰地整理中医门诊管理系统的功能，我将按照您提供的角色和功能进行归类和整理。以下是整理后的功能列表：角色划分核心管理员医生药师用户（普通患者）管理端功能（核心管理员）统计用户统计（按注册时间、活跃度等）药物销售统计处方统计咨询统计用户管理用户列表（查看、编辑、删除）用户角色分配用户权限管理医生管理医生列表
【Python 第五篇章】数据类型蜗牛 | ICU Python 专栏 python windows 开发语言
一、列表详解list.append(x)在列表末尾添加一个元素。list.extend(iterable)用可迭代对象的元素扩展列表。list.insert(i,x)在指定位置插入元素，第一个参数是插入元素的索引，第二个是值。list.remove(x)从列表中删除第一个值为x的元素。list.pop([i])移除列表中给定位置的条目，并返回该条目。如果未指定索引号，则a.pop()将移除并返回列
python catia catalog文件_Python封装的获取文件目录的函数卢新生 python catia catalog文件
获取指定文件夹中文件的函数，网上学习时东拼西凑的结果。注意，其中文件名如1.txt，文件路径如D:\文件夹\1.txt；direct为第一层子级importos#filePath输入文件夹全路径#mode#1递归获取所有文件名;#2递归获取所有文件路径;#3获取direct文件名;#4获取direct文件路径;#5获取direct文件名和direct子文件夹名;#6获取direct文件路径和dir
git subtree 管理项目子模块芥末的无奈 git git subtree
使用场景当项目越来越庞大之后，不可避免的要拆分成多个子模块，我们希望各个子模块有独立的版本管理，并且由专门的人去维护，这时候我们可以使用git的subtree功能常用命令gitsubtreeadd--prefix=--squash添加子仓库gitsubtreepull--prefix=--squash拉取更新子仓库gitsubtreepush--prefix=推送修改到子仓库如何使用1.创建带su
Python：每日一题之错误票据努力的敲码工蓝桥杯每日一题 python 蓝桥杯
题目描述某涉密单位下发了某种票据，并要在年终全部收回。每张票据有唯一的ID号。全年所有票据的ID号是连续的，但ID的开始数码是随机选定的。因为工作人员疏忽，在录入ID号的时候发生了一处错误，造成了某个ID断号，另外一个ID重号。你的任务是通过编程，找出断号的ID和重号的ID。假设断号不可能发生在最大和最小号。输入描述输入描述要求程序首先输入一个整数N(N<100)表示后面数据行数。接着读入N行数据
git submodule管理的仓库怎么删除子仓库绛洞花主敏明 git
删除Git子模块需要执行一系列步骤，以确保从项目中彻底移除子模块及其相关配置。以下是详细的步骤：1.取消初始化子模块运行以下命令以取消子模块的初始化，这会从.git/config文件中移除子模块的配置：gitsubmoduledeinit-f-f参数用于强制执行，避免因子模块目录中有未提交的更改而导致命令失败。2.删除子模块目录从工作目录中删除子模块的文件夹：rm-rf3.从.gitmodules
运行autoreconf -fvi报错configure.ac:29: error: possibly undefined macro: AM_PROG_LIBTOOL 爱因斯坦小姐 linux
报错内容说明configure.ac文件中使用了AM_PROG_LIBTOOL，但autoreconf无法找到它。这是因为libtool没有正确的安装或者配置。首先安装libtool：sudoapt-getupdatesudoapt-getinstalllibtool在项目的根目录下初始化libtool：libtoolize接下来重新运行autoreconf-fvi，或许就没问题啦！
推荐开源项目：EXP Godot 对话系统 v1.2.0 田桥桑Industrious
推荐开源项目：EXPGodot对话系统v1.2.0Godot-Dialog-SystemADialogSystemAddonfortheGodotEngine.项目地址:https://gitcode.com/gh_mirrors/go/Godot-Dialog-System上帝之城的创作者们，欢迎探索EXPGodotDialogSystem——一个专为Godot3.2稳定版打造的对话管理系统，由
推荐一款革命性的游戏对话管理工具：Godot 4 Dialogue Manager 袁菲李
推荐一款革命性的游戏对话管理工具：Godot4DialogueManager项目地址:https://gitcode.com/gh_mirrors/go/godot_dialogue_manager项目介绍在游戏开发领域中，对白设计是构建沉浸式剧情和角色深度的关键。Godot4DialogueManager，一个专为Godot引擎打造的开源插件，提供了直观且强大的分支对话编辑器和运行时解决方案。这
Godot 对话管理器教程陆汝萱
Godot对话管理器教程godot_dialogue_managerApowerfulnonlineardialoguesystemforGodot项目地址:https://gitcode.com/gh_mirrors/go/godot_dialogue_manager1.项目介绍Godot对话管理器是一个专为Godot游戏引擎设计的插件，它提供了编辑器和运行时支持，帮助你构建分支型对话系统。这个
Godot对话系统教程孔岱怀
Godot对话系统教程Godot-Dialog-SystemADialogSystemAddonfortheGodotEngine.项目地址:https://gitcode.com/gh_mirrors/go/Godot-Dialog-System项目介绍Godot对话系统是一个为Godot引擎设计的开源对话管理插件，旨在简化游戏中非线性对话的创建和管理。该项目由EXPWorlds团队开发，提供了
git subtree 高频使用方法 NickDeCodes git git github
subtree高频使用方法官网添加新的子项目查看子项目的差异使用子项目克隆存储库引入超级项目更新改变分支引入子项目更新对子项目进行更改将更改推送到子项目存储库高效配置添加新的子项目subtreegitsubtreeadd--prefix=example-submodulehttps://github.com/githubtraining/example-submodulemaster--squas
Python控制批量插入Catia文件并修改文件定义及PN 一盘红烧肉 python
改了两天，总算初步摸清楚了Catia中的文件结构，实现了使用Python控制批量修改文件名及定义使用Pycatia在Product中插入Part并改名及定义
【推荐项目】 043-停车管理系统蜗牛 | ICU 推荐项目 spring boot vue.js java 前端框架
043-停车管理系统介绍使用springbootvuejsmysql技术搭建框架。智能停车管理系统描述后端框架：采用SpringBoot与MySQL的强强联合，为系统提供稳健、高效的服务支撑。前端框架：前端选用Vue.js，打造流畅、美观的用户交互界面。管理员功能：用户信息管理：轻松管理用户信息，包括新增、编辑、删除及查询用户。界面清晰，操作便捷，确保用户数据的安全与准确。车位信息管理：实时查看车
autoreconf --install的作用 812503533 git
autoreconf--install是在使用GNUAutotools构建系统的项目中常用的一条命令，下面为你详细解释其含义以及使用--install选项的原因。autoreconf命令概述autoreconf是一个用于自动重新生成Autotools项目所需配置脚本的工具。Autotools是一组用于创建可移植构建系统的工具集合，主要包括autoconf、automake和libtool。在开发或
Spring MVC 拦截器跪在镜子前喊帅 java java
前言SpringMVC提供了一个拦截器的机制，它专门用于拦截controller层的路由请求。它的本质是：AOP面向切面的编程，也就是说符合横切关注点的功能都可以考虑使用拦截器实现。比如一些应用场景：权限检查例如：用户登录检查，访问项目的内部接口时，可以通过拦截器检测用户是否登录，如果登录，直接放回用户登录页面。日志记录更新推荐用原生的AOP机制会更好一点，粒度会更细，控制起来也更方便，如果你是针
新导则下的防洪评价报告编制方法及洪水建模实践技术吹翻书页的风水文水利地质地下水环境科学 arcgis 防洪评价报告编制 HEC-RAS软件二维水动力模型计算
目录1、《防洪评价报告编制导则解读河道管理范围内建设项目编制导则》（SL/T808-2021）解读2、防洪评价相关制度与解析3、防洪评价地形获取及常用计算4、HEC-RAS软件原理及特点5、HEC-RAS地形导入6、一维数学模型计算7、基于数学模型软件的一维构筑物的水动力模型计算及本章内容在报告中编写方法8、数值模型软件概述及数据基础处理9、基于数学模型软件的二维水动力模型计算析及结果输出及评价章
PySide2是 Qt 库的 Python 绑定之一 WwwwwH_PLUS #Qt qt python 开发语言
PySide2是Qt库的Python绑定之一，它为Python程序员提供了创建跨平台桌面应用程序的工具和功能。PySide2是Qt5.x系列的Python绑定，而Qt本身是一个跨平台的图形用户界面（GUI）框架，广泛用于开发各种类型的桌面应用程序，包括多种平台（Windows、Linux、macOS）的应用。主要特点跨平台支持：PySide2可以在Windows、Linux和macOS上运行，允许
Python学习第十一天 Leo来编程 Python学习 python
疑惑：有很多人不知道是不是也分不清什么是单核？什么是多核？什么是时间片？进程？线程？那么在讲进程和线程前我先举个例子更好理解这些概念。单核例子：比如你是一个厨师（计算机）在一个厨房（CPU）里需要同时做3个菜（进程）、每个菜需要准备不同的调料以及协作（线程），那么这个厨师需要不断地切换时间（时间片）来达到同时在一个时间将三个菜做完。多核的话其实对应的例子就是多个厨师，这样的例子太多了因为万物皆对象
python学习第三天 Leo来编程 Python学习 python 开发语言
条件判断条件判断使用if、elif和else关键字。它们用于根据条件执行不同的代码块。#条件判断age=18ifage0:#也可以写if(s>0)但是没必要因为python给个提示建议去掉保证代码的按照缩进来进行更加规范print("这个数字是大于0的数字!")#这行代码属于if语句的代码块elifs==0:print("这个数字是等于0的数字!")#这行代码属于elif语句的代码块else:pr
docker运行容器命令 redis 指定端口 big maom~~ docker redis eureka 容器运维
我整理的一些关于【Docker】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://edu.51cto.com/surl=QsXoR2使用Docker运行Redis容器并指定端口的详细指南本文旨在帮助初学者理解如何使用Docker来运行Redis容器，并指定端口。Docker是一个开源平台，允许开发者将应用和其依赖打包成一个标准的单元——容器。通过使用Docker，开发者可以确保
ollama教程——使用Ollama与LangChain实现Function Calling(函数调用)的详细教程（二）【附完整源码】 walkskyer ollama入门教程 langchain ollama LLM
ollama入门系列教程简介与目录相关文章:Ollama教程——入门：开启本地大型语言模型开发之旅Ollama教程——模型：如何将模型高效导入到Ollama框架Ollama教程——兼容OpenAIAPI：高效利用兼容OpenAI的API进行AI项目开发Ollama教程——使用LangChain：Ollama与LangChain的强强联合Ollama教程——生成内容API：利用Ollama的原生AP
目标检测项目 sho_re 神经网络人工智能 pytorch 目标检测
·识别图片中有哪些物体并且找到物体的存在位置多任务：位置+类别目标种类与数量繁多的问题目标尺度不均的问题遮挡、噪声等外部环境干扰VOC数据集：PASCALVOC挑战赛(ThePASCALVisualObjectClasses)是一个世界级的计算机视觉挑战赛。4大类，20小类VOC2007：9963图片/24640目标VOC2012：23080图片/54900目标·COCO数据集：起源于微软2014
三种优化算法旅者时光算法算法 python 开发语言
本文将总结遗传算法、粒子群算法、模拟退火三种优化算法的核心思路，并使用python完整实现。实际上，越来越多的优秀算法已经被封装为一个易用的接口。很多时候，一行代码就能实现我们的需求。但了解这些算法的基本逻辑，能够使用最基本的代码实现它。无论对于提升我们的编程能力还是解决问题的能力，都会大有裨益。甚至，改变我们思考问题的方式。1、遗传算法遗传算法，顾名思义，就是借鉴了生物通过遗传变异来逐渐适应环境
HarmonyNext实战：基于ArkTS的分布式数据同步应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的分布式数据同步应用开发引言在HarmonyNext生态系统中，分布式数据同步是一个核心特性，它允许设备之间无缝共享和同步数据。本文将深入探讨如何利用ArkTS语言开发一个高性能的分布式数据同步应用，涵盖从基础数据存储到跨设备同步的完整流程。我们将通过一个实战案例，详细讲解如何实现一个支持多设备数据同步的任务管理应用，并确保其性能优化。1.环境准备与项目初
使用 Python 合并微信与支付宝账单，生成财务报告 python后端
最近用思源笔记记东西上瘾，突然想每个月存一份收支记录进去。但手动整理账单太麻烦了，支付宝导出一份CSV，微信又导出一份，格式还不一样，每次复制粘贴头都大。干脆写了个Python脚本一键处理，核心就干两件事：把俩平台的CSV账单合并到一起自动生成带分类表格的Markdown（直接拖进思源就能渲染）代码主要折腾了这些：支付宝账单前24行都是废话，直接skiprows=24跳过去，GBK编码差点让我栽跟
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name