rgb2gray

Geocomputation （2）Attribute data operations

属性数据操作

来源：https://github.com/geocompx/geocompy

1.准备

#| echo: false
import pandas as pd
import matplotlib.pyplot as plt
pd.options.display.max_rows = 6
pd.options.display.max_columns = 6
pd.options.display.max_colwidth = 35
plt.rcParams['figure.figsize'] = (5, 5)

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import geopandas as gpd
import rasterio

示例数据

#| echo: false
import os
from urllib.request import urlretrieve

data_path = 'data'
if not os.path.exists(data_path):
  os.mkdir(data_path)
  
file_path = 'data/landsat.tif'
url = 'https://github.com/geocompx/geocompy/releases/download/0.1/landsat.tif'
if not os.path.exists(file_path):
  print('Attempting to get the data')
  urlretrieve(url, file_path)

Attempting to get the data

world = gpd.read_file('data/world.gpkg')
src_elev = rasterio.open('data/elev.tif')
src_multi_rast = rasterio.open('data/landsat.tif')

2. Introduction

属性数据是与地理（几何）数据相关联的非空间信息。
公共汽车站提供了一个简单的示例：除了名称之外，它的位置通常由纬度和经度坐标（几何数据）表示。
例如，伦敦的 Elephant & Castle / New Kent Road 停靠点的坐标为经度“-0.098”和纬度“51.495”，在@中描述的简单特征表示中可以表示为“POINT (-0.098 51.495)” sec-空间类。
诸如“POINT”特征（使用简单特征术语）的名称属性等属性是本章的主题。

另一个例子是栅格数据中特定网格单元的高程值（属性）。与矢量数据模型不同，栅格数据模型间接存储网格单元的坐标，这意味着属性和空间信息之间的区别不太明确。
为了说明这一点，请考虑光栅矩阵第 3 行和第 4 列中的像素。
它的空间位置由其在矩阵中的索引定义：从原点在 x 方向（通常在地图上向东和向右）移动四个像元，在 y 方向（通常向南和向下）移动三个像元。
光栅的分辨率定义了标题中指定的每个 x 和 y 步长的距离。
标头是栅格数据集的重要组成部分，它指定像素如何与地理坐标相关（另请参阅@spatial-operations 章）。

本章介绍如何根据属性（例如矢量数据集中的公交车站名称和栅格数据集中的像素高程）来操作地理对象。
对于矢量数据，这意味着子集化和聚合等技术（参见@sec-vector-attribute-subsetting 和@sec-vector-attribute-aggregation）。
@sec-vector-attribute-joining 和@sec-creating-attributes-and-removing-spatial-information 分别演示了如何使用共享 ID 将数据连接到简单要素对象以及如何创建新变量。
这些操作中的每一个都有一个空间等价物：例如，用于使用布尔值Series 对(Geo)DataFrame 进行子集化的[ 运算符适用于基于对象的属性和空间关系的子集化对象，这些方法使用诸如 .相交；您还可以使用空间连接连接两个地理数据集中的属性。这是个好消息：本章培养的技能可以交叉迁移。
@sec-spatial-operations 将此处介绍的方法扩展到空间世界。

在下一节深入探讨各种类型的矢量属性操作之后，@sec-manipulating-raster-objects 介绍了栅格属性数据操作，它演示了如何创建包含连续和分类属性的栅格图层并从其中提取像元值或更多层（栅格子集）。
@sec-summarizing-raster-objects 提供了“全局”栅格操作的概述，可用于汇总整个栅格数据集。

3. 矢量属性操作

如@sec-vector-layers 中所述，矢量图层（GeoDataFrame，来自包geopandas）基本上是扩展表（来自包pandas 的DataFrame），不同之处在于矢量图层具有几何列。
由于 GeoDataFrame 扩展了 DataFrame，矢量图层也支持包 pandas 中所有与表相关的普通操作，如下所示。

3.1 向量属性子集 {#sec-vector-attribute-subsetting}

pandas 支持多个子集接口，但最推荐是：

.loc，它使用 pandas 索引，以及
.iloc，它使用（隐式）numpy 风格的数字索引。

在这两种情况下，该方法后跟方括号和两个索引，以逗号分隔。每个索引可以包括：

一个特定的值，如 1
一片，如 0:3
一个 list，如 [0,2,4]
:——表示“所有”索引

此规则的一个例外是使用列表选择列，如“df[[‘a’,‘b’]]”，而不是“df.loc[:, [‘a’,‘b’]]”，从 df 中选择列 'a' 和 'b'。

以下是对世界各国的“GeoDataFrame”进行子集化的几个示例。

按位置子集行，例如前三行：

world.iloc[0:3, :]

	iso_a2	name_long	continent	...	lifeExp	gdpPercap	geometry
0	FJ	Fiji	Oceania	...	69.960	8222.253784	MULTIPOLYGON (((-180.00000 -16....
1	TZ	Tanzania	Africa	...	64.163	2402.099404	MULTIPOLYGON (((33.90371 -0.950...
2	EH	Western Sahara	Africa	...	NaN	NaN	MULTIPOLYGON (((-8.66559 27.656...

3 rows × 11 columns

这相当于：

world.iloc[:3]

	iso_a2	name_long	continent	...	lifeExp	gdpPercap	geometry
0	FJ	Fiji	Oceania	...	69.960	8222.253784	MULTIPOLYGON (((-180.00000 -16....
1	TZ	Tanzania	Africa	...	64.163	2402.099404	MULTIPOLYGON (((33.90371 -0.950...
2	EH	Western Sahara	Africa	...	NaN	NaN	MULTIPOLYGON (((-8.66559 27.656...

3 rows × 11 columns

world.head(3)

	iso_a2	name_long	continent	...	lifeExp	gdpPercap	geometry
0	FJ	Fiji	Oceania	...	69.960	8222.253784	MULTIPOLYGON (((-180.00000 -16....
1	TZ	Tanzania	Africa	...	64.163	2402.099404	MULTIPOLYGON (((33.90371 -0.950...
2	EH	Western Sahara	Africa	...	NaN	NaN	MULTIPOLYGON (((-8.66559 27.656...

3 rows × 11 columns

world.iloc[:, 0:3]

	iso_a2	name_long	continent
0	FJ	Fiji	Oceania
1	TZ	Tanzania	Africa
2	EH	Western Sahara	Africa
...	...	...	...
174	XK	Kosovo	Europe
175	TT	Trinidad and Tobago	North America
176	SS	South Sudan	Africa

177 rows × 3 columns

按位置子集行和列：

world.iloc[0:3, 0:3]

	iso_a2	name_long	continent
0	FJ	Fiji	Oceania
1	TZ	Tanzania	Africa
2	EH	Western Sahara	Africa

按名称子集列：

world[['name_long', 'geometry']]

	name_long	geometry
0	Fiji	MULTIPOLYGON (((-180.00000 -16....
1	Tanzania	MULTIPOLYGON (((33.90371 -0.950...
2	Western Sahara	MULTIPOLYGON (((-8.66559 27.656...
...	...	...
174	Kosovo	MULTIPOLYGON (((20.59025 41.855...
175	Trinidad and Tobago	MULTIPOLYGON (((-61.68000 10.76...
176	South Sudan	MULTIPOLYGON (((30.83385 3.5091...

177 rows × 2 columns

给定列之间的“切片”列：

world.loc[:, 'name_long':'pop']

	name_long	continent	region_un	...	type	area_km2	pop
0	Fiji	Oceania	Oceania	...	Sovereign country	19289.970733	885806.0
1	Tanzania	Africa	Africa	...	Sovereign country	932745.792357	52234869.0
2	Western Sahara	Africa	Africa	...	Indeterminate	96270.601041	NaN
...	...	...	...	...	...	...	...
174	Kosovo	Europe	Europe	...	Sovereign country	11230.261672	1821800.0
175	Trinidad and Tobago	North America	Americas	...	Sovereign country	7737.809855	1354493.0
176	South Sudan	Africa	Africa	...	Sovereign country	624909.099086	11530971.0

177 rows × 7 columns

通过布尔值列表（0 和 1 或 True 和 False）进行子集化：

x = [1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 0] 
world.iloc[:, x]

	name_long	name_long	iso_a2	...	name_long	iso_a2	iso_a2
0	Fiji	Fiji	FJ	...	Fiji	FJ	FJ
1	Tanzania	Tanzania	TZ	...	Tanzania	TZ	TZ
2	Western Sahara	Western Sahara	EH	...	Western Sahara	EH	EH
...	...	...	...	...	...	...	...
174	Kosovo	Kosovo	XK	...	Kosovo	XK	XK
175	Trinidad and Tobago	Trinidad and Tobago	TT	...	Trinidad and Tobago	TT	TT
176	South Sudan	South Sudan	SS	...	South Sudan	SS	SS

177 rows × 11 columns

我们可以使用 .drop 方法通过 id 删除特定行，例如，删除第 2、3 和 5 行：

world.drop([2, 3, 5])

	iso_a2	name_long	continent	...	lifeExp	gdpPercap	geometry
0	FJ	Fiji	Oceania	...	69.960000	8222.253784	MULTIPOLYGON (((-180.00000 -16....
1	TZ	Tanzania	Africa	...	64.163000	2402.099404	MULTIPOLYGON (((33.90371 -0.950...
4	US	United States	North America	...	78.841463	51921.984639	MULTIPOLYGON (((-171.73166 63.7...
...	...	...	...	...	...	...	...
174	XK	Kosovo	Europe	...	71.097561	8698.291559	MULTIPOLYGON (((20.59025 41.855...
175	TT	Trinidad and Tobago	North America	...	70.426000	31181.821196	MULTIPOLYGON (((-61.68000 10.76...
176	SS	South Sudan	Africa	...	55.817000	1935.879400	MULTIPOLYGON (((30.83385 3.5091...

174 rows × 11 columns

或者使用 .drop 方法和 axis=1 （即列）删除特定列：

world.drop(['name_long', 'continent'], axis=1)

	iso_a2	region_un	subregion	...	lifeExp	gdpPercap	geometry
0	FJ	Oceania	Melanesia	...	69.960000	8222.253784	MULTIPOLYGON (((-180.00000 -16....
1	TZ	Africa	Eastern Africa	...	64.163000	2402.099404	MULTIPOLYGON (((33.90371 -0.950...
2	EH	Africa	Northern Africa	...	NaN	NaN	MULTIPOLYGON (((-8.66559 27.656...
...	...	...	...	...	...	...	...
174	XK	Europe	Southern Europe	...	71.097561	8698.291559	MULTIPOLYGON (((20.59025 41.855...
175	TT	Americas	Caribbean	...	70.426000	31181.821196	MULTIPOLYGON (((-61.68000 10.76...
176	SS	Africa	Eastern Africa	...	55.817000	1935.879400	MULTIPOLYGON (((30.83385 3.5091...

177 rows × 9 columns

我们可以使用 .rename 方法重命名列：

world[['name_long', 'pop']].rename(columns={'pop': 'population'})

	name_long	population
0	Fiji	885806.0
1	Tanzania	52234869.0
2	Western Sahara	NaN
...	...	...
174	Kosovo	1821800.0
175	Trinidad and Tobago	1354493.0
176	South Sudan	11530971.0

177 rows × 2 columns

标准的 numpy 比较运算符可用于布尔子集化，如表 @tbl-comparison-operators 所示。

`符号`	`名字`
`==`	等于
`!=`	不等于
`>`, `<`	大于/小于
`>=`, `<=`	大于/小于或等于
`&`, `	`,` ~`

: 返回布尔值的比较运算符 (True/False)。 {#tbl-比较运算符}

以下示例通过创建一个名为“small_countries”的新“GeoDataFrame”对象演示了用于子集化的逻辑向量，该对象仅包含表面积小于 10,000 km² 的国家：

idx_small = world['area_km2'] < 10000  ## a logical 'Series'
small_countries = world[idx_small]
small_countries

	iso_a2	name_long	continent	...	lifeExp	gdpPercap	geometry
45	PR	Puerto Rico	North America	...	79.390122	35066.046376	MULTIPOLYGON (((-66.28243 18.51...
79	PS	Palestine	Asia	...	73.126000	4319.528283	MULTIPOLYGON (((35.39756 31.489...
89	VU	Vanuatu	Oceania	...	71.709000	2892.341604	MULTIPOLYGON (((166.79316 -15.6...
...	...	...	...	...	...	...	...
160	None	Northern Cyprus	Asia	...	NaN	NaN	MULTIPOLYGON (((32.73178 35.140...
161	CY	Cyprus	Asia	...	80.173000	29786.365653	MULTIPOLYGON (((32.73178 35.140...
175	TT	Trinidad and Tobago	North America	...	70.426000	31181.821196	MULTIPOLYGON (((-61.68000 10.76...

7 rows × 11 columns

中介“idx_small”（代表小国家的索引的缩写）是一个布尔值“Series”，可用于按表面积划分世界上七个最小国家的子集。
省略中间对象的更简洁的命令会生成相同的结果：

small_countries = world[world['area_km2'] < 10000]
small_countries

	iso_a2	name_long	continent	...	lifeExp	gdpPercap	geometry
45	PR	Puerto Rico	North America	...	79.390122	35066.046376	MULTIPOLYGON (((-66.28243 18.51...
79	PS	Palestine	Asia	...	73.126000	4319.528283	MULTIPOLYGON (((35.39756 31.489...
89	VU	Vanuatu	Oceania	...	71.709000	2892.341604	MULTIPOLYGON (((166.79316 -15.6...
...	...	...	...	...	...	...	...
160	None	Northern Cyprus	Asia	...	NaN	NaN	MULTIPOLYGON (((32.73178 35.140...
161	CY	Cyprus	Asia	...	80.173000	29786.365653	MULTIPOLYGON (((32.73178 35.140...
175	TT	Trinidad and Tobago	North America	...	70.426000	31181.821196	MULTIPOLYGON (((-61.68000 10.76...

7 rows × 11 columns

上面显示的各种方法可以链接起来，用于与多个子集步骤的任意组合，例如：

world[world['continent'] == 'Asia']  \
    .loc[:, ['name_long', 'continent']]  \
    .iloc[0:5, :]

	name_long	continent
5	Kazakhstan	Asia
6	Uzbekistan	Asia
8	Indonesia	Asia
24	Timor-Leste	Asia
76	Israel	Asia

我们还可以组合索引：

idx_small = world['area_km2'] < 10000
idx_asia = world['continent'] == 'Asia'
world.loc[idx_small & idx_asia, ['name_long', 'continent', 'area_km2']]

	name_long	continent	area_km2
79	Palestine	Asia	5037.103826
160	Northern Cyprus	Asia	3786.364506
161	Cyprus	Asia	6207.006191

3.2 矢量属性聚合

聚合涉及基于一个或多个分组变量（通常是列中的值；地理聚合将在下一章介绍）汇总数据。这种基于属性的聚合的一个典型示例是根据国家级数据（每个国家一行）计算每个大陆的人数。
“world”数据集包含必要的成分：列“pop”和“continent”，分别是人口和分组变量。目的是找到每个大陆的国家人口的“sum()”，从而得到更小的数据框。（由于聚合是数据缩减的一种形式，因此在处理大型数据集时它可能是一个有用的早期步骤）。这种聚合可以使用 .groupby 和 .sum 的组合来实现：

world_agg1 = world[['continent', 'pop']].groupby('continent').sum()
world_agg1

	pop
continent
Africa	1.154947e+09
Antarctica	0.000000e+00
Asia	4.311408e+09
...	...
Oceania	3.775783e+07
Seven seas (open ocean)	0.000000e+00
South America	4.120608e+08

8 rows × 1 columns

如果您不喜欢默认使用的科学记数法来显示人口总和，您可以像这样更改浮点值的 Pandas 显示格式：

pd.set_option('display.float_format', '{:.0f}'.format)
world_agg1

	pop
continent
Africa	1154946633
Antarctica	0
Asia	4311408059
...	...
Oceania	37757833
Seven seas (open ocean)	0
South America	412060811

8 rows × 1 columns

结果是一个（非空间）表，有八行，每个大陆一行，两列报告每个大陆的名称和人口。

如果我们想在聚合结果中包含几何图形，我们可以使用 .dissolve 方法。
这样，除了人口总和之外，我们还可以获得每个大陆的相关几何图形，即所有国家的联合。
请注意，我们使用“by”参数来选择用于分组的列，并使用“aggfunc”参数来选择非几何列的聚合函数：

world_agg2 = world[['continent', 'pop', 'geometry']] \
    .dissolve(by='continent', aggfunc='sum') \
    .reset_index()
world_agg2

	continent	geometry	pop
0	Africa	MULTIPOLYGON (((32.83012 -26.74...	1154946633
1	Antarctica	MULTIPOLYGON (((-66.29003 -80.2...	0
2	Asia	MULTIPOLYGON (((120.29501 -10.2...	4311408059
...	...	...	...
5	Oceania	MULTIPOLYGON (((169.66781 -43.5...	37757833
6	Seven seas (open ocean)	POLYGON ((68.93500 -48.62500, 6...	0
7	South America	MULTIPOLYGON (((-66.95992 -54.8...	412060811

8 rows × 3 columns

@fig-spatial-aggregation 显示结果：

#| label: fig-spatial-aggregation
#| fig-cap: Continents with summed population

world_agg2.plot(column='pop', legend=True);

生成的“world_agg2”对象是一个“GeoDataFrame”，其中包含代表世界各大洲（和公海）的 8 个特征。

.dissolve 中 aggfunc 参数的其他选项包括：

*'第一'
*'最后'
*'分钟'
*'最大'
*'总和'
*'平均'
*'中位数'

此外，我们可以传递自定义函数。

作为一个更复杂的例子，下面是我们如何计算每个大陆的总人口、面积和国家数量：

world_agg3 = world.dissolve(
    by='continent', aggfunc={
         "name_long": "count",
         "pop": "sum",
         'area_km2': "sum"
     }).rename(columns={'name_long': 'n'})
world_agg3

	geometry	n	pop	area_km2
continent
Africa	MULTIPOLYGON (((32.83012 -26.74...	51	1154946633	29946198
Antarctica	MULTIPOLYGON (((-66.29003 -80.2...	1	0	12335956
Asia	MULTIPOLYGON (((120.29501 -10.2...	47	4311408059	31252459
...	...	...	...	...
Oceania	MULTIPOLYGON (((169.66781 -43.5...	7	37757833	8504489
Seven seas (open ocean)	POLYGON ((68.93500 -48.62500, 6...	1	0	11603
South America	MULTIPOLYGON (((-66.95992 -54.8...	13	412060811	17762592

8 rows × 4 columns

图 @fig-spatial-aggregation-different-functions 可视化了具有三个聚合属性的大陆的结果层 (world_agg3)。

#| label: fig-spatial-aggregation-different-functions
#| fig-cap: 'Continent properties, calculated using spatial aggregation using different functions'

fig, axes = plt.subplots(2, 2, figsize=(9, 5))
world_agg3.plot(column='pop', edgecolor='black', legend=True, ax=axes[0][0])
world_agg3.plot(column='area_km2', edgecolor='black', legend=True, ax=axes[0][1])
world_agg3.plot(column='n', edgecolor='black', legend=True, ax=axes[1][0])
axes[0][0].set_title('Summed population')
axes[0][1].set_title('Summed area')
axes[1][0].set_title('Count of countries')
fig.delaxes(axes[1][1]);

下面继续最后的结果来演示其他表相关的操作。鉴于“world_agg3”大陆摘要（@fig-spatial-aggregation-different-functions），我们：

删除几何列，
*计算每个大陆的人口密度，
按大洲包含的国家数量排列大洲，以及
只保留 3 个人口最多的大陆。

world_agg4 = world_agg3.drop(columns=['geometry'])
world_agg4['density'] = world_agg4['pop'] / world_agg4['area_km2']
world_agg4 = world_agg4.sort_values(by='n', ascending=False)
world_agg4 = world_agg4.head(3)
world_agg4

	n	pop	area_km2	density
continent
Africa	51	1154946633	29946198	39
Asia	47	4311408059	31252459	138
Europe	39	669036256	23065219	29

3.3 矢量属性加入

合并来自不同来源的数据是数据准备中的一项常见任务。联接通过基于共享的“键”变量组合表来实现这一点。
pandas 有一个名为 pd.merge 的函数，用于基于公共列加入 (Geo)DataFrames。
pd.merge 函数遵循数据库语言 SQL 中使用的约定（Grolemund 和 Wickham 2016）。
pd.merge 函数对 DataFrame 和 GeoDataFrame 对象的作用相同。
pd.merge 的结果可以是 DataFrame 或 GeoDataFrame 对象，具体取决于输入。

一种常见的空间数据属性连接类型是将“DataFrames”连接到“GeoDataFrames”。
为实现这一点，我们使用带有 GeoDataFrame 作为第一个参数的 pd.merge，并从指定为第二个参数的 DataFrame 向其添加列。
在以下示例中，我们将咖啡生产数据与“世界”数据集结合起来。
咖啡数据位于从主要咖啡生产国的 CSV 文件中导入的名为“coffee_data”的“DataFrame”中：

coffee_data = pd.read_csv('data/coffee_data.csv')
coffee_data

	name_long	coffee_production_2016	coffee_production_2017
0	Angola	NaN	NaN
1	Bolivia	3	4
2	Brazil	3277	2786
...	...	...	...
44	Zambia	3	NaN
45	Zimbabwe	1	1
46	Others	23	26

47 rows × 3 columns

它的三列是：

name_long 国家名称
coffee_production_2016 和 coffee_production_2017 包含以每年 60 公斤袋为单位的咖啡产量估计值。

保留第一个数据集的左连接基于常见的“name_long”列将“world”与“coffee_data”合并：

world_coffee = pd.merge(world, coffee_data, on='name_long', how='left')
world_coffee

	iso_a2	name_long	continent	...	geometry	coffee_production_2016	coffee_production_2017
0	FJ	Fiji	Oceania	...	MULTIPOLYGON (((-180.00000 -16....	NaN	NaN
1	TZ	Tanzania	Africa	...	MULTIPOLYGON (((33.90371 -0.950...	81	66
2	EH	Western Sahara	Africa	...	MULTIPOLYGON (((-8.66559 27.656...	NaN	NaN
...	...	...	...	...	...	...	...
174	XK	Kosovo	Europe	...	MULTIPOLYGON (((20.59025 41.855...	NaN	NaN
175	TT	Trinidad and Tobago	North America	...	MULTIPOLYGON (((-61.68000 10.76...	NaN	NaN
176	SS	South Sudan	Africa	...	MULTIPOLYGON (((30.83385 3.5091...	NaN	NaN

177 rows × 13 columns

结果是一个与原始 world 对象相同的 GeoDataFrame 对象，但有两个关于咖啡生产的新变量（coffee_production_2016 和 coffee_production_2017）。
这可以绘制成地图，如@fig-join-coffee-production 所示：

#| label: fig-join-coffee-production
#| fig-cap: 'World coffee production, thousand 60-kg bags by country, in 2017 (source: International Coffee Organization).'

base = world_coffee.plot(color='white', edgecolor='lightgrey')
coffee_map = world_coffee.plot(ax=base, column='coffee_production_2017')
coffee_map.set_title('Coffee production');

要工作，基于属性的连接需要在两个数据集中都有一个“关键变量”（“pd.merge”的“on”参数）。
在上面的示例中，world_coffee 和 world DataFrames 都包含一个名为 name_long 的列。
（默认情况下，pd.merge 使用所有具有匹配名称的列。但是，建议明确指定要用于匹配的列的名称，就像我们在上一个示例中所做的那样。）

如果列名不同，您可以使用 left_on 和 right_on 来指定各自的列。

请注意，结果“world_coffee”与原始数据集“world”具有相同的行数。
虽然 coffee_data 中只有 47 行，但 world_coffee 中所有 177 个国家/地区的记录都完好无损。原始数据集中没有匹配项的行被分配了新咖啡生产变量的“np.nan”值。
这是左连接的一个特征（用 how='left' 指定），也是我们通常想要做的。

如果我们只想保留关键变量匹配的国家怎么办？
在这种情况下，可以使用内部连接：

pd.merge(world, coffee_data, on='name_long', how='inner')

	iso_a2	name_long	continent	...	geometry	coffee_production_2016	coffee_production_2017
0	TZ	Tanzania	Africa	...	MULTIPOLYGON (((33.90371 -0.950...	81	66
1	PG	Papua New Guinea	Oceania	...	MULTIPOLYGON (((141.00021 -2.60...	114	74
2	ID	Indonesia	Asia	...	MULTIPOLYGON (((104.36999 -1.08...	742	360
...	...	...	...	...	...	...	...
42	ET	Ethiopia	Africa	...	MULTIPOLYGON (((47.78942 8.0030...	215	283
43	UG	Uganda	Africa	...	MULTIPOLYGON (((33.90371 -0.950...	408	443
44	RW	Rwanda	Africa	...	MULTIPOLYGON (((30.41910 -1.134...	36	42

45 rows × 13 columns

连接两个 (Geo)DataFrame 的另一种方法是恰当地称为“join”函数：

world.join(coffee_data.set_index('name_long'), on='name_long', how='inner')

	iso_a2	name_long	continent	...	geometry	coffee_production_2016	coffee_production_2017
1	TZ	Tanzania	Africa	...	MULTIPOLYGON (((33.90371 -0.950...	81	66
7	PG	Papua New Guinea	Oceania	...	MULTIPOLYGON (((141.00021 -2.60...	114	74
8	ID	Indonesia	Asia	...	MULTIPOLYGON (((104.36999 -1.08...	742	360
...	...	...	...	...	...	...	...
165	ET	Ethiopia	Africa	...	MULTIPOLYGON (((47.78942 8.0030...	215	283
168	UG	Uganda	Africa	...	MULTIPOLYGON (((33.90371 -0.950...	408	443
169	RW	Rwanda	Africa	...	MULTIPOLYGON (((30.41910 -1.134...	36	42

45 rows × 13 columns

请注意，在这种情况下，我们需要将 coffee_data 的索引设置为 name_long 值以避免错误消息。

3.4 创建属性和删除空间信息

通常，我们希望在现有列的基础上创建一个新列。例如，我们要计算每个国家的人口密度。为此，我们需要将人口列（此处为“pop”）除以面积列（此处为“area_km2”）。请注意，我们正在处理名为“world2”的“world”副本，因此我们不会修改原始图层：

world2 = world.copy()
world2['pop_dens'] = world2['pop'] / world2['area_km2']
world2

	iso_a2	name_long	continent	...	gdpPercap	geometry	pop_dens
0	FJ	Fiji	Oceania	...	8222	MULTIPOLYGON (((-180.00000 -16....	46
1	TZ	Tanzania	Africa	...	2402	MULTIPOLYGON (((33.90371 -0.950...	56
2	EH	Western Sahara	Africa	...	NaN	MULTIPOLYGON (((-8.66559 27.656...	NaN
...	...	...	...	...	...	...	...
174	XK	Kosovo	Europe	...	8698	MULTIPOLYGON (((20.59025 41.855...	162
175	TT	Trinidad and Tobago	North America	...	31182	MULTIPOLYGON (((-61.68000 10.76...	175
176	SS	South Sudan	Africa	...	1936	MULTIPOLYGON (((30.83385 3.5091...	18

177 rows × 12 columns

要将现有列粘贴（即连接）在一起，我们可以使用普通的 Python 字符串运算符“+”，就好像我们在处理单个字符串而不是“系列”一样。例如，我们希望将“continent”和“region_un”列合并到名为“con_reg”的新列中，使用“:”作为分隔符。随后，我们使用 .drop 删除原始列：

world2['con_reg'] = world['continent'] + ':' + world2['region_un']
world2 = world2.drop(['continent', 'region_un'], axis=1)
world2

	iso_a2	name_long	subregion	...	geometry	pop_dens	con_reg
0	FJ	Fiji	Melanesia	...	MULTIPOLYGON (((-180.00000 -16....	46	Oceania:Oceania
1	TZ	Tanzania	Eastern Africa	...	MULTIPOLYGON (((33.90371 -0.950...	56	Africa:Africa
2	EH	Western Sahara	Northern Africa	...	MULTIPOLYGON (((-8.66559 27.656...	NaN	Africa:Africa
...	...	...	...	...	...	...	...
174	XK	Kosovo	Southern Europe	...	MULTIPOLYGON (((20.59025 41.855...	162	Europe:Europe
175	TT	Trinidad and Tobago	Caribbean	...	MULTIPOLYGON (((-61.68000 10.76...	175	North America:Americas
176	SS	South Sudan	Eastern Africa	...	MULTIPOLYGON (((30.83385 3.5091...	18	Africa:Africa

177 rows × 11 columns

生成的 sf 对象有一个名为“con_reg”的新列，代表每个国家/地区的大陆和地区，例如，“South America:Americas”代表阿根廷和其他南美国家。相反的操作，根据分隔符字符串将一列拆分为多列，使用 .str.split 方法完成。结果，我们回到了两个单独的“continent”和“region_un”列的先前状态（只是它们的位置现在是最后一个，因为它们是新创建的）：

world2[['continent', 'region_un']] = world2['con_reg'] \
    .str.split(':', expand=True)
world2

	iso_a2	name_long	subregion	...	con_reg	continent	region_un
0	FJ	Fiji	Melanesia	...	Oceania:Oceania	Oceania	Oceania
1	TZ	Tanzania	Eastern Africa	...	Africa:Africa	Africa	Africa
2	EH	Western Sahara	Northern Africa	...	Africa:Africa	Africa	Africa
...	...	...	...	...	...	...	...
174	XK	Kosovo	Southern Europe	...	Europe:Europe	Europe	Europe
175	TT	Trinidad and Tobago	Caribbean	...	North America:Americas	North America	Americas
176	SS	South Sudan	Eastern Africa	...	Africa:Africa	Africa	Africa

177 rows × 13 columns

重命名一个或多个列可以使用 .rename 方法结合 columns 参数来完成，它应该是 old_name:new_name 形式的字典。例如，以下命令将冗长的“name_long”列重命名为简单的“name”：

world2.rename(columns={'name_long': 'name'})

	iso_a2	name	subregion	...	con_reg	continent	region_un
0	FJ	Fiji	Melanesia	...	Oceania:Oceania	Oceania	Oceania
1	TZ	Tanzania	Eastern Africa	...	Africa:Africa	Africa	Africa
2	EH	Western Sahara	Northern Africa	...	Africa:Africa	Africa	Africa
...	...	...	...	...	...	...	...
174	XK	Kosovo	Southern Europe	...	Europe:Europe	Europe	Europe
175	TT	Trinidad and Tobago	Caribbean	...	North America:Americas	North America	Americas
176	SS	South Sudan	Eastern Africa	...	Africa:Africa	Africa	Africa

177 rows × 13 columns

要一次更改所有列名，我们将“新”列名的“列表”分配给“.columns”属性。 list 的长度必须与列数相同（即 world.shape[1]）。如下图所示，它输出相同的“world2”对象，但名称非常短：

new_names = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'geom', 'i', 'j', 'k', 'l']
world2.columns = new_names
world2

	a	b	c	...	j	k	l
0	FJ	Fiji	Melanesia	...	Oceania:Oceania	Oceania	Oceania
1	TZ	Tanzania	Eastern Africa	...	Africa:Africa	Africa	Africa
2	EH	Western Sahara	Northern Africa	...	Africa:Africa	Africa	Africa
...	...	...	...	...	...	...	...
174	XK	Kosovo	Southern Europe	...	Europe:Europe	Europe	Europe
175	TT	Trinidad and Tobago	Caribbean	...	North America:Americas	North America	Americas
176	SS	South Sudan	Eastern Africa	...	Africa:Africa	Africa	Africa

177 rows × 13 columns

要对列重新排序，我们可以将修改后的列列表传递给子集运算符“[”。例如，以下表达式按相反的字母顺序对 world2 列进行重新排序：

names = sorted(world2.columns, reverse=True)
world2 = world2[names]
world2

	l	k	j	...	c	b	a
0	Oceania	Oceania	Oceania:Oceania	...	Melanesia	Fiji	FJ
1	Africa	Africa	Africa:Africa	...	Eastern Africa	Tanzania	TZ
2	Africa	Africa	Africa:Africa	...	Northern Africa	Western Sahara	EH
...	...	...	...	...	...	...	...
174	Europe	Europe	Europe:Europe	...	Southern Europe	Kosovo	XK
175	Americas	North America	North America:Americas	...	Caribbean	Trinidad and Tobago	TT
176	Africa	Africa	Africa:Africa	...	Eastern Africa	South Sudan	SS

177 rows × 13 columns

这些属性数据操作中的每一个，即使它们在“pandas”包中定义并且适用于任何“DataFrame”，也会保留几何列和“GeoDataFrame”类。然而，有时移除几何体是有意义的，例如为了加速聚合或仅导出属性数据以进行统计分析。要从“GeoDataFrame”到“DataFrame”，我们需要：

1.删除几何列

从 GeoDataFrame 转换为 DataFrame

例如：

world2 = world2.drop('geom', axis=1)
world2 = pd.DataFrame(world2)
world2

	l	k	j	...	c	b	a
0	Oceania	Oceania	Oceania:Oceania	...	Melanesia	Fiji	FJ
1	Africa	Africa	Africa:Africa	...	Eastern Africa	Tanzania	TZ
2	Africa	Africa	Africa:Africa	...	Northern Africa	Western Sahara	EH
...	...	...	...	...	...	...	...
174	Europe	Europe	Europe:Europe	...	Southern Europe	Kosovo	XK
175	Americas	North America	North America:Americas	...	Caribbean	Trinidad and Tobago	TT
176	Africa	Africa	Africa:Africa	...	Eastern Africa	South Sudan	SS

177 rows × 12 columns

4. 操作栅格对象

4.1 栅格子集

使用 rasterio 时，可以通过 numpy 数组访问栅格值，该数组可以使用 .read 方法导入：

elev = src_elev.read(1)
elev

array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12],
       [13, 14, 15, 16, 17, 18],
       [19, 20, 21, 22, 23, 24],
       [25, 26, 27, 28, 29, 30],
       [31, 32, 33, 34, 35, 36]], dtype=uint8)

然后，我们可以使用 numpy 方法访问单元格值的任何子集，例如：

elev[0, 0]  ## Value at row 1, column 1

可以通过结合子集操作覆盖现有值来修改单元格值，例如将 elev 的左上角单元格设置为 0：

elev[0, 0] = 0
elev

array([[ 0,  2,  3,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12],
       [13, 14, 15, 16, 17, 18],
       [19, 20, 21, 22, 23, 24],
       [25, 26, 27, 28, 29, 30],
       [31, 32, 33, 34, 35, 36]], dtype=uint8)

多个单元格也可以这样修改：

elev[0, 0:3] = 0
elev

array([[ 0,  0,  0,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12],
       [13, 14, 15, 16, 17, 18],
       [19, 20, 21, 22, 23, 24],
       [25, 26, 27, 28, 29, 30],
       [31, 32, 33, 34, 35, 36]], dtype=uint8)

4.2 汇总栅格对象

可以通过在具有栅格值的数组上应用“numpy”汇总函数来计算栅格值的全局汇总，例如 np.mean：

np.mean(elev)

18.333333333333332

请注意，如果栅格包含需要忽略的“无数据”值，则应使用“无数据”安全函数（例如 np.nanmean）。在我们证明这一点之前，我们必须将数组从“int”转换为“float”，因为“int”数组不能包含“np.nan”（由于计算机内存限制）：

elev1 = elev.copy()
elev1 = elev1.astype('float64')
elev1

array([[ 0.,  0.,  0.,  4.,  5.,  6.],
       [ 7.,  8.,  9., 10., 11., 12.],
       [13., 14., 15., 16., 17., 18.],
       [19., 20., 21., 22., 23., 24.],
       [25., 26., 27., 28., 29., 30.],
       [31., 32., 33., 34., 35., 36.]])

现在我们可以在数组中插入一个 np.nan 值。（尝试在原始的 elev 数组中这样做会引发错误，请自己尝试看看）

elev1[0, 2] = np.nan
elev1

array([[ 0.,  0., nan,  4.,  5.,  6.],
       [ 7.,  8.,  9., 10., 11., 12.],
       [13., 14., 15., 16., 17., 18.],
       [19., 20., 21., 22., 23., 24.],
       [25., 26., 27., 28., 29., 30.],
       [31., 32., 33., 34., 35., 36.]])

使用 np.nan 值，汇总值变得未知：

np.mean(elev1)

nan

因此，我们需要忽略“无数据”值：

np.nanmean(elev1)

18.857142857142858

栅格值统计数据可以通过多种方式可视化。
一种方法是将栅格值“扁平化”为一维数组，然后使用图形函数，例如 plt.hist 或 plt.boxplot（来自 matplotlib.pyplot）。
例如：

x = elev.flatten()
plt.hist(x);

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NUW9s6Av-1687280429016)(03-attribute-operations_files/03-attribute-operations_91_0.png)]

…

174
Europe
Europe
Europe:Europe
…
Southern Europe
Kosovo
XK

175
Americas
North America
North America:Americas
…
Caribbean
Trinidad and Tobago
TT

176
Africa
Africa
Africa:Africa
…
Eastern Africa
South Sudan
SS

177 rows × 12 columns

5.操作栅格对象 {#sec-manipulating-raster-objects}

5.1 栅格子集 {#sec-raster-subsetting}

使用 rasterio 时，可以通过 numpy 数组访问栅格值，该数组可以使用 .read 方法导入：

elev = src_elev.read(1)
elev

array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12],
       [13, 14, 15, 16, 17, 18],
       [19, 20, 21, 22, 23, 24],
       [25, 26, 27, 28, 29, 30],
       [31, 32, 33, 34, 35, 36]], dtype=uint8)

然后，我们可以使用 numpy 方法访问单元格值的任何子集，例如：

elev[0, 0]  ## Value at row 1, column 1

可以通过结合子集操作覆盖现有值来修改单元格值，例如将 elev 的左上角单元格设置为 0：

elev[0, 0] = 0
elev

array([[ 0,  2,  3,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12],
       [13, 14, 15, 16, 17, 18],
       [19, 20, 21, 22, 23, 24],
       [25, 26, 27, 28, 29, 30],
       [31, 32, 33, 34, 35, 36]], dtype=uint8)

多个单元格也可以这样修改：

elev[0, 0:3] = 0
elev

array([[ 0,  0,  0,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12],
       [13, 14, 15, 16, 17, 18],
       [19, 20, 21, 22, 23, 24],
       [25, 26, 27, 28, 29, 30],
       [31, 32, 33, 34, 35, 36]], dtype=uint8)

5.2 汇总栅格对象

可以通过在具有栅格值的数组上应用“numpy”汇总函数来计算栅格值的全局汇总，例如 np.mean：

np.mean(elev)

18.333333333333332

elev1 = elev.copy()
elev1 = elev1.astype('float64')
elev1

array([[ 0.,  0.,  0.,  4.,  5.,  6.],
       [ 7.,  8.,  9., 10., 11., 12.],
       [13., 14., 15., 16., 17., 18.],
       [19., 20., 21., 22., 23., 24.],
       [25., 26., 27., 28., 29., 30.],
       [31., 32., 33., 34., 35., 36.]])

现在我们可以在数组中插入一个 np.nan 值。（尝试在原始的 elev 数组中这样做会引发错误，请自己尝试看看）

elev1[0, 2] = np.nan
elev1

array([[ 0.,  0., nan,  4.,  5.,  6.],
       [ 7.,  8.,  9., 10., 11., 12.],
       [13., 14., 15., 16., 17., 18.],
       [19., 20., 21., 22., 23., 24.],
       [25., 26., 27., 28., 29., 30.],
       [31., 32., 33., 34., 35., 36.]])

使用 np.nan 值，汇总值变得未知：

np.mean(elev1)

nan

因此，我们需要忽略“无数据”值：

np.nanmean(elev1)

18.857142857142858

x = elev.flatten()
plt.hist(x);

你可能感兴趣的:(GIS空间分析,python,开发语言)

UI自动化-Selenium WebDriver Oooon_the_way ui 自动化 selenium
前言SeleniumWebDriver是Selenium项目中最核心、最强大的组件，它是一个用于自动化控制网页浏览器的开源API（应用程序编程接口）。简单来说，SeleniumWebDriver就是一个允许你用编程语言（如Java、Python、C#、JavaScript、Ruby等）编写脚本来模拟真实用户操作网页浏览器（如Chrome,Firefox,Edge,Safari等）的工具。核心功能：
[使用Python轻松提取YouTube视频转录：从零开始的指南] mmlihaio python 开发语言 linux
#使用Python轻松提取YouTube视频转录：从零开始的指南##引言在当今信息爆炸的时代，YouTube已成为获取信息的重要平台。随着视频内容的激增，自动化获取视频转录内容的需求日益增加。本文将带您探索如何使用Python从YouTube视频中提取转录信息，并分享一些实用的技巧和编码示例。##主要内容###1.YouTube转录加载器简介借助`langchain_community`库的`Yo
深入解析youtube-dl模块：视频与播放列表信息提取指南
深入解析youtube-dl模块：视频与播放列表信息提取指南youtube-dl项目地址:https://gitcode.com/gh_mirrors/you/youtube-dl前言youtube-dl作为一款强大的多媒体内容下载工具，其核心功能通过Python模块的形式提供了丰富的编程接口。本文将深入探讨如何使用youtube-dl模块来提取视频和播放列表信息，帮助开发者更好地集成这一功能到自
Python 爬虫实战：从图片网站抓取图片并进行特征提取（2025 最新版） Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 github chrome 数据库
一、引言在当今的数字时代，图像数据在各个领域中扮演着至关重要的角色。无论是计算机视觉、机器学习，还是数据分析，图像数据的获取和处理都是基础。然而，获取大量高质量的图像数据并非易事。幸运的是，互联网上充斥着丰富的图像资源，只需借助合适的工具和技术，我们就能高效地从中获取所需的图像数据。本文将详细介绍如何使用Python构建一个完整的爬虫系统，从图片网站抓取图像，并对其进行特征提取。我们将涵盖从网页分
解决web服务中在线查看minio上文件提示CORS的问题 Hong.1948 前端网络 javascript
web页面访问excel、word之类的文件时，由于浏览器的安全机制，如果目标地址和源地址不同源，就会报CORS，即跨域访问的问题。解决跨域的问题，主要有2个思路：方案1：修改目标服务的CORS策略，允许跨域访问方案2：强行同源，然后使用nginx转发请求。此前使用s3服务的时候，使用方案1解决了跨域访问的问题。s3服务，不管是客户端还是pythonsdk，都可以直接修改指定桶的CORS策略，配置
【Python】Synonyms 宅男很神经 python 开发语言
当然，我完全理解您的需求，并且将竭尽全力为您提供一个前所未有的、极其深入和全面的关于“Python库Synonyms，用于中文词性分析和相似度计算”的专属学习指南。我将从最底层、最核心的原理开始，逐步向上构建知识体系，确保每一个细节都被剖析得淋漓尽致，不放过任何一个学习角度。所有内容都将是原创生成，绝无抄袭，并辅以大量我独立设计的实战代码示例，每行代码都将附带详尽的中文解释。由于您要求极高的字数（
Python包管理工具UV：告别龟速pip，体验秒级安装，你的生产力引擎即将升级 wylee python uv pip
摘要：还在为Python包的龟速安装和复杂的依赖管理而抓狂吗？还在苦苦等待CI/CD流水线中漫长的pipinstall完成吗？今天，我要向你隆重介绍一个划时代的Python包管理工具——UV！它由Python生态巨头Astral团队倾力打造，采用Rust编写，旨在彻底颠覆你对Python包安装、虚拟环境管理和依赖解析的认知。UV不仅是pip和virtualenv的闪电替代品，更是pip-tools
python拷贝文件到指定路径不存在_Python实现文件夹递归拷贝 weixin_39717825
维护一个网站，数据库可以自动备份，但用户上传的文件很多，手动备份很麻烦，所以想用Python实现自动备份目标：1.多层文件夹嵌套，在要备份的文件夹中嵌套多个文件夹2.增量备份，因为文件较多，且之前已有部分备份，所以只需对新增的文件进行备份，提升效率Python安装：1.下载安装包，http://www.python.org/getit/，可以选择Python2或3，2的兼容性更好2.添加Pytho
Python 单例模式与魔法方法深度剖析：从原理到实践女码农的重启开发语言单例模式
在Python面向对象编程领域，单例模式和魔法方法是极具特色且功能强大的技术。单例模式确保一个类在程序运行过程中仅有一个实例，常用于资源管理、全局状态维护等场景；魔法方法则是Python类中以双下划线__开头和结尾的特殊方法，赋予类丰富的行为定制能力。本文将深入探讨二者的原理、实现方式、应用场景，以及它们之间的紧密联系。一、单例模式：实例唯一性的保障1.1单例模式的核心概念单例模式（Singlet
Gradio全解3——Gradio三种客户端：python、javascript与curl（三）——curl 龙焰智能 Gradio全解教程 gradio client curl awk/read post/get 嵌入式url
Gradio全解3——Gradio三种客户端：python、javascript与curl（三）——curl前言3.3Curl查询GradioApps3.3.1安装3.3.2获取Gradio程序的URL3.3.3HF_TOKEN和身份认证1.POST/GET示例2.整合命令：awk和read3.HF_TOKEN4.身份认证3.3.4POST：请求预测1.基本语法2.常用示例3.3.5GET：获取结
【镜像加速】Docker/DockerHub 国内镜像源/加速列表（2024-12-31有效）天才大狗b eureka 云原生
sudomkdir-p/etc/dockersudotee/etc/docker/daemon.json<
揭秘自然语言处理在AI人工智能领域的奥秘 AI智能探索者 AI Agent 智能体开发实战人工智能自然语言处理 easyui ai
揭秘自然语言处理在AI人工智能领域的奥秘关键词：自然语言处理、AI人工智能、语言理解、语言生成、语义分析摘要：本文深入探讨了自然语言处理（NLP）在AI人工智能领域的奥秘。首先介绍了自然语言处理的背景，包括目的、预期读者、文档结构和相关术语。接着阐述了自然语言处理的核心概念与联系，通过文本示意图和Mermaid流程图进行展示。详细讲解了核心算法原理和具体操作步骤，并用Python源代码进行阐述。分
【软件工程】Waitress + Nginx 部署 Python Web 服务 meisongqing nginx python WEB
下面是完整的Windows系统部署方案，使用Waitress作为WSGI服务器运行Python后端，Nginx作为反向代理同时提供前端服务：项目结构text复制下载myapp/├──backend/#Python后端│├──app.py#Flask应用入口│├──requirements.txt#Python依赖│└──api/#API模块├──frontend/#前端文件│├──index.ht
基于python的药品后台销售管理系统 sudo-ikun python django javascript mysql
摘要人类生活的水平不断提高是因为依靠着不断发展变革的信息化科技，从头到尾没有一件事情是可以脱离现代化的发展。科技改变了生活，同时也造就了多种多样的生活方式，有了“美团”我们可以足不出户吃便天下美食；有了“京东”我们可以享受到各种各样电子科技产品第一时间带来的快感；有了“淘宝”每逢四季我们可以第一时间感受到潮流的服装，这些都是科技的力量，也是科技给我们的生活带来的一种方式。中药销售一直是我们社会大家
【华为OD机试真题 2025B卷】767、寻找最大价值的矿堆 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KJ.JK OJ+最新华为OD机试 (C++Java Py C JS)华为od c++java 华为OD机试真题 2025B卷 javascript c语言寻找最大价值的矿堆
文章目录一、题目题目描述输入输出样例1二、代码与思路参考C++语言思路C++代码Java语言思路Java代码Python语言思路Python代码C语言思路C代码JS语言思路JS代码作者：KJ.JK订阅本专栏后即可解锁在线OJ刷题权限专栏介绍：最新的华为OD机试题目总结，使用C++、Java、Python、C语言、JS五种语言进行解答，每个题目的思路分析都非常详细，支持在线OJ评测刷题！！！！订阅后
基于深度学习的线上问诊系统设计与实现（Python+Django+MySQL）神经网络15044 深度学习算法神经网络 python 深度学习 django 机器学习人工智能算法目标检测
基于深度学习的线上问诊系统设计与实现（Python+Django+MySQL）一、系统概述本系统结合YOLOv8目标检测和ResNet50图像分类算法，构建了一个智能线上问诊平台。系统支持用户上传医学影像（皮肤照片/X光片），自动分析并生成诊断报告，同时提供医生审核功能。二、技术栈后端框架：Django4.2数据库：MySQL8.0深度学习：YOLOv8：皮肤病变区域检测ResNet50：肺炎X光
Python,Go开发穷游宝典APP Geeker-2025 python golang
以下是为使用**Python和Go开发"穷游宝典APP"**设计的创新技术方案，结合两种语言优势实现低成本、高智能的旅行体验：---###**技术栈分工**|**技术**|**核心优势**|**在穷游APP中的应用**||----------|--------------------------|------------------------------------------||**Pytho
Python,Go开发数据流量分配查询APP Geeker-2025 python golang
#数据流量分配查询应用我将设计一个基于Python和Go开发的数据流量分配查询应用，帮助用户监控和分析网络流量分配情况。##设计思路这个应用将实现以下核心功能：-实时监控网络流量分配情况-多维度流量数据分析（设备、应用、时间段）-流量分配策略设置与管理-异常流量告警系统-直观的数据可视化展示##技术架构```前端(Python+Streamlit)后端(Go)┌──────────────────
《48小时极速开发：Python+MySQL 学生信息管理系统架构实战揭秘》 Cyber4K Python 项目实践及实战 python mysql 架构
Python项目实践：学生信息管理系统1.项目概述1.1项目背景开发周期：2天（需求分析0.5天+开发1天+测试0.5天）技术栈：Python3.9+MySQL+面向对象编程核心价值：实现学生信息的全生命周期管理采用分层架构设计（表示层/业务层/数据层）数据库驱动的高效数据持久化方案1.2系统架构系统架构调用CRUD操作连接池业务逻辑层命令行界面数据访问层MySQL数据库2.核心模块实现2.1数据
python里面的全局变量和局部变量的区别（很好的一篇文章，找不到出处，原作者看到请联系，我会署上名字） scuter_yu 全局变量与局部变量的区别 python
python中，对于变量作用域的规定有些不一样。在诸如C/C++、java等编程语言中，默认在函数的内部是可以直接访问在函数外定义的全局变量的，但是这一点在python中就会有问题，下面是一个例子。[plain]viewplaincopy在CODE上查看代码片派生到我的代码片test.py:#!/usr/bin/pythonCOUNT=1deffunc():COUNT=COUNT+1func()P
LeetCode第300题_最长递增子序列 @蓝莓果粒茶算法 leetcode 算法职场和发展学习 c#游戏 python
LeetCode第300题：最长递增子序列文章摘要本文详细解析LeetCode第300题"最长递增子序列"，这是一道考察动态规划和二分查找的中等难度题目。文章提供了动态规划和贪心+二分查找两种实现方案，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合学习动态规划和二分查找的读者。核心知识点：动态规划、二分查找、贪心算法难度等级：中等推荐人群：具备基础算法知识，想要提升
LeetCode第301题_删除无效括号 @蓝莓果粒茶算法 leetcode 算法职场和发展 c#学习 python c++
LeetCode第301题：删除无效括号文章摘要本文详细解析LeetCode第301题"删除无效括号"，这是一道考察DFS和括号匹配的困难难度题目。文章提供了DFS和BFS两种实现方案，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合学习深度优先搜索和字符串处理的读者。核心知识点：DFS、BFS、括号匹配、字符串处理难度等级：困难推荐人群：具备基础算法知识，想要提升搜
Python复制方法“=/copy/deepcopy”的区别 superlitong 笔记经验 python list 列表机器学习人工智能
1、当复制的值是不可变对象（数值，字符串，元组）时，=/copy/deepcopy三者没有区别。测试代码：importcopya='abcdefgh'b=ac=copy.copy(a)d=copy.deepcopy(a)print(a,b,c,d)print(id(a),id(b),id(c),id(d))a+='x'#相当于重新赋值，把a这个标签重新贴到了一个新的箱子print(a,b,c,d)
Python binary search二分查找算法详解及源码猿来如此yyy Python算法详解及源码算法 python 排序算法开发语言数据库人工智能数据结构
二分查找算法是一种在有序数组中查找特定元素的常用算法。它的基本思想是将要查找的元素与数组的中间元素进行比较，如果相等，则返回该元素的索引；如果要查找的元素比中间元素小，则在数组的左半部分继续查找；如果要查找的元素比中间元素大，则在数组的右半部分继续查找。通过不断缩小查找范围，最终可以找到要查找的元素或确定该元素不存在于数组中。二分查找算法的优点是时间复杂度为O(logn)，效率较高。这是因为每一次
python中copy和deepcopy详细区别 jialun0116 python 列表 python
python中copy和deepcopy在python中，标识一个对象唯一身份的是：对象的id(内存地址)，对象类型，对象值。deepcopy是真正意义上的复制，深拷贝，被复制对象完全复制一遍作为独立的新个体，新开辟一块空间。等于赋值，浅拷贝，不会产生独立对象，只是对原有数据块打上新标签，其中一个标签改变，数据块就会变化。copy仅拷贝对象本身，浅拷贝不会对其中的子对象进行拷贝，对子对象进行修改也
python 几种排序方法与二分查找愤怒的玉米棒 python学习小结 python
#选择排序defselectionSort(arr):#-1虽然有n个数字但是没有第n轮最多n-1轮foriinrange(0,len(arr)-1):forjinrange(i+1,len(arr)):ifarr[i]>arr[j]:arr[i],arr[j]=arr[j],arr[i]print(arr)#冒泡排序defbubbleSort(arr):#-1虽然有n个数字但是没有第n轮最多n-
Python二分查找库bisect 来个大包的二重积分编程基础 python 算法排序算法
找暑期实习的时候做到某厂的笔试题里面用到这个，就总结一下。。。1.bisect_left(a,x,lo=0,hi=len(a))功能：在已排序序列a中查找元素x应该插入的位置，并返回最左侧的插入位置（index啊）。区别：如果有多个相同元素，bisect_left返回最左侧的插入位置。默认情况下，查找范围是整个序列a，但可以通过lo和hi参数来限制查找范围。2.bisect_right(a,x,l
【python】赋值操作（=）、切片、copy()、deepcopy()经常分不清。叶阿猪 python python 数据结构开发语言
切片（Slicing）、copy()（浅拷贝）和deepcopy()在Python中都涉及复制操作，但复制的深度和方式有所不同。而赋值操作不涉及复制，只是改变变量与对象之间的绑定关系。本文将详细讲解这几种方式的区别。一、赋值操作（=）定义：将值或引用绑定到变量名上。特性：赋值操作不会创建值的副本，它只是将变量名与现有的值或引用关联起来。如果赋值的值是可变对象（如列表、字典等），则变量名将引用该对象
【Python】第一弹：对 Python 的认知敖云岚 python 开发语言
目录一、Python的背景1.1.Python的由来1.2Python的作用1.3Python的优缺点1.4Python的开发工具一、Python的背景1.1.Python的由来Python由荷兰数学和计算机科学研究学会的吉多・范罗苏姆（GuidovanRossum）在20世纪80年代末至90年代初开发，并于1991年正式发布。当时，计算机领域正朝着更高效、更便捷的编程方向发展，吉多希望创造一门语
2025B卷最新华为OD机试,独家整理总结上岸技巧,考试题库清单(Python/JS/C/C++/JAVA/GO)持续收录中无限码力华为od 华为OD机试华为OD2025B卷华为机试2025B卷华为OD机考2025B卷华为OD2025B卷题库
2025华为OD机试2025B卷华为OD上机考试由5月9号统一切换至华为OD2025B卷，现在刷2025B卷，刷得越多，通过率越高。题库链接最新华为OD机试(C++/C/Python/JavaScript/GO)目录提供在线OJ环境刷题:(私信联系开通)在线OJ私信联系开通OJ环境+使用介绍：私信联系开通2025最新华为OD真题目录华为OD面试手撕代码高频题华为OD机试2025B卷题单下面精心为大
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla