大白兔黑又黑

Polars使用指南（一）

pandas是Python数据处理中非常经典的一个科学计算库，表形式的数据结构、丰富的API和灵活的编程语法使得pandas成为最常用的的数据分析工具。但是pandas也有一个最致命的缺陷，就是效率问题，尤其是不支持并行计算。pandas2在性能方面有了极大的提升，但是不支持并行计算依然是pandas的遗憾之一。针对这个问题，市场上也涌现出了多种解决方案，如 pandarallel、dask、ray、Pandas API on Spark 等等，亦或者是开发者基于进程池的形式自己实现并行计算，但是这些方案多会有不支持跨平台、部署麻烦、不方便调试以及和pandas API兼容性差等问题，而Polars则提供了一个综合之下最适宜的方案。

Polars除了提供API形式的访问方式之外，还可以通过SQL语法查询，本文主要介绍pl.Series相关的API，其他内容将在后续文章中介绍。

首先看一下Polars官方的介绍：
Polars is a DataFrame interface on top of an OLAP Query Engine implemented in Rust using Apache Arrow Columnar Format as the memory model.

Lazy | eager execution
Multi-threaded
SIMD
Query optimization
Powerful expression API
Hybrid Streaming (larger than RAM datasets)
Rust | Python | NodeJS | R | …

我们关注几个关键词：DataFrame、OLAP查询引擎、Rust实现、Apache Arrow、内存模型、多线程，可以发现Polars同样也在尽可能保持对pandas API的语法兼容，并且底层通过rust实现，支持多线程并行计算（可以充分利用多核）。接下来我们介绍具体的函数/API，详细资料可参考Polars API官网资料。

polars需要注意点如下：

polars修正了pandas中含有空值的整型列会被转为浮点型的问题，如果除null外都是整型，则Series也是整型；
polars中null和NaN是不同的，np.nan是NaN；

1. 输入/输出

from datetime import datetime
import polars as pl


df = pl.DataFrame(
    {
        "integer": [1, 2, 3],
        "date": [
            datetime(2022, 1, 1),
            datetime(2022, 1, 2),
            datetime(2022, 1, 3),
        ],
        "float": [4.0, 5.0, 6.0],
    }
)
s = pl.Series("a", [1, 2, 3])

print(type(df))
# 
print(type(df.select('float')))
# 
print(type(df['float']))
# 

# 读csv
df = pl.read_csv("docs/data/output.csv")
df.write_csv(path, separator=",")
# 按照batch方式加载csv文件，通过reader.next_batches(5)依次读取文件
reader = pl.read_csv_batched("docs/data/output.csv")
# 读json
pl.read_json("docs/data/output.json")
df.write_json(row_oriented=True)
# 读parquet
pl.read_parquet("docs/data/output.parquet")
df.write_parquet(path)
# 读数据库
pl.read_database(
    query="SELECT * FROM test_data",
    connection=user_conn,
    schema_overrides={"normalised_score": pl.UInt8},
) 
# 读avro
pl.read_avro
df.write_avro(path)

2. 查询

from datetime import datetime
import polars as pl


df = pl.DataFrame(
    {
        "a": [1, 2, 3],
        "b": [
            datetime(2022, 1, 1),
            datetime(2022, 1, 2),
            datetime(2022, 1, 3),
        ],
        "c": [4.0, 5.0, 6.0],
    }
)

# 查询所有列
df.select('*')
df.select(pl.col('*'))
# 查询指定列
df.select(pl.col('a', 'b'))
df.select(['a', 'b'])
df.select(pl.col('a'), pl.col('b'))
df[['a', 'b']]
# 排除指定列
df.select(pl.exclude("a"))
# 增加虚拟列（新增字段）
df.with_columns(pl.col("b").sum().alias("e"), (pl.col("b") + 42).alias("b+42"))

3. 过滤

df.filter(pl.col("c").is_between(datetime(2022, 12, 2), datetime(2022, 12, 8)),)
df.filter((pl.col("a") <= 3) & (pl.col("d").is_not_nan()))

4. 分组

分组后利用Polars的并行计算能力也是我们非常需要的功能。

df = pl.DataFrame(
    {
        "x": range(8),
        "y": ["A", "A", "A", "B", "B", "C", "X", "X"],
    }
)

# 分组统计
df.group_by("y", maintain_order=True).count()
# 利用agg分组聚合，这里只有x一列需要聚合，所以不会有别名冲突
df.group_by("y", maintain_order=True).agg(
    pl.col("*").count().alias("count"),
    pl.col("*").sum().alias("sum"),
)

5. Series API

详情参考Series官方API。
Series的参数如下，注意和pd.Series不同，第一个参数不是data（values），但是也可以接收ArrayLike类型参数，此时不能指定name参数。

class polars.Series(
	name: str | ArrayLike | None = None,
	values: ArrayLike | None = None,
	dtype: PolarsDataType | None = None,
	*,
	strict: bool = True,
	nan_to_null: bool = False,
	dtype_if_empty: PolarsDataType = Null,
)

s1 = pl.Series("a", [1, 2, 3])
s2 = pl.Series("a", [1, 2, 3], dtype=pl.Float32)

Series常用API如下：
尤其需要注意，应优先使用表达式操作（列操作，如select、filter、with_columns、group_by），而不是map_elements / apply，因为表达式操作操作性能更高。表达式计算可以利用Rust计算、并行计算、逻辑优化，而UDF（map_elements ）往往不行。

import polars as pl

s = pl.Series([1, -2, -3])

# 绝对值
s.abs()

# rename
s.alias("b")

# and
pl.Series([False, True]).all()  # 结果False
pl.Series([None, True]).all()	# 结果True
pl.Series([None, True]).all(ignore_nulls=False)  # 结果None
# or
pl.Series([True, False]).any()  # 结果True
pl.Series([None, False]).any()  # 结果False
pl.Series([None, False]).any(ignore_nulls=False)  # 结果None

# 追加，注意会修改a，且append会同时返回a
a = pl.Series("a", [1, 2, 3])
b = pl.Series("b", [4, 5])
a.append(b)
a.n_chunks()  # 结果为2
# extend同样可实现追加功能。append的是将其他Series的chunk添加到自身（拼接），底层仍然是多个chunk。
# extend将其他Series的数据追加自身内存，因此可能会导致重新分配内存。
# 所以extend执行过程可能会比append更久，但是extend的结果会比append的结果查询更快。
# 如果是追加之后立刻查询，则建议使用extend；如果需要添加多个Series之后再查询，则建议使用append，然后再调用a.rechunk()
# Series.rechunk(*, in_place: bool = False)
a = pl.Series("a", [1, 2, 3])
b = pl.Series("b", [4, 5])
a.extend(b)
a.n_chunks()  # 结果为1

# 0.19.0以后已经被删除，改为 map_elements，参数一致
# apply，和pandas功能一致，skip_nulls为True表示空值不进入function计算，效率会更高
Series.apply(
	function: Callable[[Any], Any],
	return_dtype: PolarsDataType | None = None,
	*,
	skip_nulls: bool = True,
) → Self
# map_elements和apply效果相同，如果可以通过表达式（列操作）实现的功能（如select、filter）,应避免使用map_elements，因为表达式操作效率更高
# return_dtype 应显示指定，尤其是返回值和输入值类型不一致的情况
# 如果function的开销很大，可考虑使用@lru_cache装饰器优化
Series.map_elements(
	function: Callable[[Any], Any],
	return_dtype: PolarsDataType | None = None,
	*,
	skip_nulls: bool = True,
) → Self

# 三角函数
arccos()、arccosh()、arcsin()、arcsinh()、arctan()、arctanh()、cos()、cosh()、cot()

# arg_max、arg_min 输出是标量
s = pl.Series("a", [3, 2, 1])
s.arg_max()  # 结果为0
s.arg_min()  # 结果为2

# 排序
Series.sort(*, descending: bool = False, in_place: bool = False)
# 标记有序，对某些操作提高计算效率，如max/min
Series.set_sorted(*, descending: bool = False)

# 排序索引，输出结果是排序后对应位置对应元素的索引值，注意不是每个元素对应的排名
Series.arg_sort(
	*,
	descending: bool = False,
	nulls_last: bool = False,
) → Series
s = pl.Series("a", [5, 3, 4, 1, 2])
s.arg_sort()  # 结果是 [3 4 1 2 0]
# 获取为True的索引结果
(s == 2).arg_true()
# 获取只出现一次的值索引
s.arg_unique()
# 按索引取值
s = pl.Series("a", [1, 2, 3, 4])
s.gather([1, 3])  # 结果是[2 4]
# 按固定步长采样，每n个值取一次
Series.gather_every(n: int, offset: int = 0)

# 返回前n个，如果n小于0，表示取排除后|n|后的所有数据
Series.head(n: int = 10) → Series[source]
Series.limit(n: int = 10) → Series[source]
# 返回k个最小的元素
Series.bottom_k(k: int | IntoExprColumn = 5) → Series
# 返回k个最大的元素
Series.top_k(k: int | IntoExprColumn = 5) → Series
# 返回后n个，如果n小于0，则返回排除前|n|个后的所有数据
Series.tail(n: int = 10) → Series

# 类型转换，strict若为True 如果无法进行强制转换(例如，由于溢出)，则抛出错误。
Series.cast(
	dtype: PolarsDataType | type[int] | type[float] | type[str] | type[bool],
	*,
	strict: bool = True,
) → Self
s = pl.Series("a", [True, False, True])
s.cast(pl.UInt32)

# 计算立方根，下面两种等价
s.cbrt()
s ** (1.0 / 3)
# 计算平方根，下面两种等价
s.sqrt()
s ** 0.5

# 向上取整
Series.ceil() → Series
# 向下取整
Series.floor() → Series[source]

# 创建空数据拷贝，默认返回一个空的同类型Series，n表示需要填充几个空值，默认0，所以默认返回空，不修改原始数据s
Series.clear(n: int = 0) → Series

# 拷贝
s.clone()

# 限制边界值，小于下边界的置为下边界，大于上边界的置为上边界
# lower_bound和upper_bound可以是表达式，也可以是标量值，可以只设置一个
Series.clip(
	lower_bound: NumericLiteral | TemporalLiteral | IntoExprColumn | None = None,
	upper_bound: NumericLiteral | TemporalLiteral | IntoExprColumn | None = None,
) → Series
s.clip(1, 10)

# zip_with，类似于np.where，mask是布尔值类型的Series，如果为True，则取self对应位置的值，如果为False，则取other对应位置的值
Series.zip_with(mask: Series, other: Series) → Self
# when then otherwise，可以有多个when then，如果没写otherwise且所有条件都不满足，则返回空
df = pl.DataFrame({"foo": [1, 3, 4], "bar": [3, 4, 0]})
df.with_columns(
    pl.when(pl.col("foo") > 2)
    .then(1)
    .when(pl.col("bar") > 2)
    .then(4)
    .otherwise(-1)
    .alias("val")
)
┌─────┬─────┬─────┐
│ foo ┆ bar ┆ val │
│ --- ┆ --- ┆ --- │
│ i64 ┆ i64 ┆ i32 │
╞═════╪═════╪═════╡
│ 1   ┆ 3   ┆ 4   │
│ 3   ┆ 4   ┆ 1   │
│ 4   ┆ 0   ┆ 1   │
└─────┴─────┴─────┘
# 设置多个and条件
df.with_columns(
    val=pl.when(
        pl.col("bar") > 0,
        pl.col("foo") % 2 != 0,
    )
    .then(99)
    .otherwise(-1)
)
df.with_columns(val=pl.when(foo=4, bar=0).then(99).otherwise(-1))

# 统计非空元素数量
s.count()

# 计算依次累计最大值
Series.cum_max(*, reverse: bool = False)
s = pl.Series("s", [3, 5, 1])
s.cum_max()  # 结果：3 5 5
# 累乘
Series.cum_prod(*, reverse: bool = False) → Series
# 自定义累计运算
Series.cumulative_eval(
	expr: Expr,
	min_periods: int = 1,
	*,
	parallel: bool = False,
) → Series
s = pl.Series("values", [1, 2, 3, 4, 5])
s.cumulative_eval(pl.element().first() - pl.element().last() ** 2)
# 结果
[
    0.0
    -3.0
    -8.0
    -15.0
    -24.0
]

# 数据离散/切分，默认是左开右闭，left_closed=True，则设为左闭右开
Series.cut(
	breaks: Sequence[float],
	*,
	labels: Sequence[str] | None = None,
	left_closed: bool = False,
	include_breaks: bool = False,
) → Series | DataFrame
s = pl.Series("foo", [-2, -1, 0, 1, 2])
s.cut([-1, 1], labels=["a", "b", "c"])
# 结果
[
        "a"
        "a"
        "b"
        "b"
        "c"
]
# 根据分位数离散数据
Series.qcut(
	quantiles: Sequence[float] | int,
	*,
	labels: Sequence[str] | None = None,
	left_closed: bool = False,
	allow_duplicates: bool = False,
	include_breaks: bool = False,
) → Series | DataFrame

# 计算偏差，n默认为1，表示计算相邻元素之间的偏差
Series.diff(n: int = 1, null_behavior: NullBehavior = 'ignore')

# 计算内积
s1 = pl.Series("a", [1, 2, 3])
s2 = pl.Series("b", [4.0, 5.0, 6.0])
s1.dot(s2)   # 结果是32

# 删除空值，注意null和NaN不同
s = pl.Series([1.0, None, 3.0, float("nan")])
s.drop_nans()   # 结果是[1.0 null 3.0]
s.drop_nulls()  # 结果是[1.0 3.0 NaN]

# 填充空值
Series.fill_nan(value: int | float | Expr | None) → Series
# strategy{None, ‘forward’, ‘backward’, ‘min’, ‘max’, ‘mean’, ‘zero’, ‘one’}
Series.fill_null(
	value: Any | None = None,
	strategy: FillNullStrategy | None = None,
	limit: int | None = None,
) → Series
s = pl.Series("a", [1, 2, 3, None])
s.fill_null(strategy="forward")


# 指数移动加权平均，com、span、half_life、alpha之间的关系见注1
Series.ewm_mean(
	com: float | None = None,
	span: float | None = None,
	half_life: float | None = None,
	alpha: float | None = None,
	*,
	adjust: bool = True,
	min_periods: int = 1,
	ignore_nulls: bool = True,
) → Series
# 指数移动加权标准差
Series.ewm_std(
	com: float | None = None,
	span: float | None = None,
	half_life: float | None = None,
	alpha: float | None = None,
	*,
	adjust: bool = True,
	bias: bool = False,
	min_periods: int = 1,
	ignore_nulls: bool = True,
) → Series

# 指数运算
s.exp()

# sign函数
s.sign()

# 压平
s = pl.Series("a", [[1, 2, 3], [4, 5, 6]])
s.list.explode()
# 结果是 [1 2 3 4 5 6]
s = pl.Series("a", ["foo", "bar"])
s.str.explode()
# 结果是 ["f" "o" "o" "b" "a" "r"]

# 聚合，和explode相反，所有行压到一行中的一个list中
s.implode()

# 插值（空值），method {‘linear’, ‘nearest’}
Series.interpolate(method: InterpolationMethod = 'linear') → Series

# 判断是否在范围内
Series.is_between(
	lower_bound: IntoExpr,
	upper_bound: IntoExpr,
	closed: ClosedInterval = 'both',
) → Series
s.is_between(2, 4)
# 是否是重复值
s.is_duplicated() → Series
# 是否是布尔值
s.dtype == pl.Boolean
# 是否为空Series
s.is_empty()
# 是否有限值（非无穷大）
s.is_finite()
# 是否第一次出现
s.is_first_distinct()
# s1是否在s2中
s1.is_in(s2)
# 是否是NaN
s.is_nan()
# 是否是null
s.is_null()
# 是否有序
Series.is_sorted(*, descending: bool = False)

# 对数函数计算，默认以e为底
Series.log(base: float = 2.718281828459045) → Series
s.log()
# 以10为底
s.log10()
# 所有元素值+1后，做ln计算
s.log1p()

# 四舍五入
Series.round(decimals: int = 0)
# 四舍五入digits位有效数字
Series.round_sig_figs(digits: int)

# replace
Series.replace(
	old: IntoExpr | Sequence[Any] | Mapping[Any, Any],
	new: IntoExpr | Sequence[Any] | NoDefault = _NoDefault.no_default,
	*,
	default: IntoExpr | NoDefault = _NoDefault.no_default,
	return_dtype: PolarsDataType | None = None,
)
# 标量替换
s.replace(2, 100)
# 多个标量替换
s.replace([2, 3], [100, 200])
# map提换
mapping = {2: 100, 3: 200}
s.replace(mapping, default=-1)
# 若替换前后值类型不同，则最好指定return_dtype
s.replace(mapping, return_dtype=pl.UInt8)
# Series默认值
default = pl.Series([2.5, 5.0, 7.5, 10.0])
s.replace(2, 100, default=default)

# 数理统计函数(忽略空值)
s.mean()、s.median()、s.max()、s.min()、s.len()
# 如果有NaN则返回空
s.nan_max()/s.nan_min()
# 出现次数最多的值
s.mode()
# 去重，maintain_order=True表示保留原始顺序，会降低性能
Series.unique(*, maintain_order: bool = False) → Series
# 去重后元素的数量
s.n_unique()
# 每个元素出现次数，若sort=True表示按出现次数降序排序，False表示随机
Series.value_counts(*, sort: bool = False, parallel: bool = False) → DataFrame
# 分位数，interpolation：插值方法，{‘nearest’, ‘higher’, ‘lower’, ‘midpoint’, ‘linear’}
Series.quantile(
	quantile: float,
	interpolation: RollingInterpolationMethod = 'nearest',
) → float | None

# 排名
Series.rank(
	method: RankMethod = 'average',
	*,
	descending: bool = False,
	seed: int | None = None,
) → Series

# reshape
Series.reshape(dimensions: tuple[int, ...]) → Series

# 翻转
Series.reverse() → Series

# 滑动窗口，应计量避免直接使用rolling_map(效率低)，使用下面内置的rolling_xxx系列函数
Series.rolling_map(
	function: Callable[[Series], Any],
	window_size: int,
	weights: list[float] | None = None,
	min_periods: int | None = None,
	*,
	center: bool = False,
) → Series
# rolling_xxx系列函数
s.rolling_max、s.rolling_mean、s.rolling_median、s.rolling_min、s.rolling_quantile、s.rolling_skew、s.rolling_std、s.rolling_sum、s.rolling_var、

# 平移，n可以为负值，表示向上平移，fill_value 如何填充平移产生的空值
Series.shift(n: int = 1, *, fill_value: IntoExpr | None = None) → Series

# 优化内存，按实际数据适配内存，减少冗余内存（数据不再变动情况）
Series.shrink_to_fit(*, in_place: bool = False) → Series

# 计算偏度，正态分布偏度为0
Series.skew(*, bias: bool = True) → float | None

# 按索引取指定长度值，含offset对应元素
Series.slice(offset: int, length: int | None = None) → Series

# to_frame，pl.Series转为pl.DataFrame，name可以重命名字段名
Series.to_frame(name: str | None = None) → DataFrame
# to_list，use_pyarrow：使用pyarrow进行转换。
Series.to_list(*, use_pyarrow: bool | None = None)
# to_numpy，转为np.ndarray，关于to_numpy的注意事项和参数解释见注2
Series.to_numpy(
	*args: Any,
	zero_copy_only: bool = False,
	writable: bool = False,
	use_pyarrow: bool = True,
) → ndarray[Any, Any]
# to_pandas，转换为pandas.Series
Series.to_pandas(
	*args: Any,
	use_pyarrow_extension_array: bool = False,
	**kwargs: Any,
) → pd.Series[Any]
#

注1：
$\frac{1}{1 + com}\; \forall \; com \geq 0$
$\frac{2}{span + 1} \; \forall \; span \geq 1$
$\exp \left\{ \frac{ -\ln(2) }{ half\_life } \right\} \; \forall \; half\_life > 0$

注2：
to_numpy和to_list不同，如果Series是纯数字并且没有null（注意不是nan），则是零拷贝生成，即返回的ndarray是只读的，如果需要修改ndarray，则需要设置writable=True，表示创建一个拷贝。zero_copy_only参数表示使用零拷贝生成ndarray，但是如果需要做拷贝则会触发异常。

助力您发SCI 机器学习（ML）在材料领域应用专题 YEcenfei 分子动力学催化材料机器学习人工智能 python
第一天机器学习在材料与化学常见的方法理论内容1.机器学习概述2.材料与化学中的常见机器学习方法3.应用前沿实操内容Python基础1.开发环境搭建2.变量和数据类型3.列表4.if语句5.字典6.For和while循环实操内容Python基础（续）1.函数2.类和对象3.模块Python科学数据处理1.NumPy2.Pandas3.Matplotlib第二天机器学习材料与化学应用<
Edge-TTS在广电系统中的语音合成技术的创新应用
Edge-TTS在广电系统中的语音合成技术的创新应用作者：本人是一名县级融媒体中心的工程师，多年来一直坚持学习、提升自己。喜欢Python编程、人工智能、网络安全等多领域的技术。摘要随着人工智能技术的快速发展，文字转语音(Text-to-Speech,TTS)系统已成为多种应用的重要组成部分，尤其在广播电视领域。本文介绍了一种基于Edge-TTS大模型的文字转语音工具，该工具结合了现代文本处理和语
如何修改Python安装路径壹只小小码农 python 学习开发语言
在安装软件时，很多人都会发现默认的安装路径不是他们想要的，于是就想要修改安装路径。那么如何修改安装路径呢？本文将从多个角度为大家进行分析。一、在安装向导中更改一般情况下，我们在安装软件时会看到安装向导，其中会有一个“安装路径”选项，我们可以在这里手动更改安装路径。不同软件的安装向导可能略有不同，但是一般都会有这个选项。二、使用修改器有些软件虽然没有提供修改安装路径的选项，但是我们可以使用一些修改器
Python中类基础知识详解和应用点云SLAM Python python 开发语言深度学习人工智能计算机视觉 python中的类学习
Python类知识详解类的定义语法class类名:#类体（属性、方法）示例：classPerson:pass创建类的实例（对象）p=Person()#创建一个类的对象（实例）类的构造方法（__init__）__init__是类的构造函数，在实例化对象时自动调用，用于初始化属性。classPerson:def__init__(self,name,age):self.name=nameself.age
python+requests+excel 接口测试鱼鱼说测试 postman python 开发语言
1、EXCEL文件接口保存方式，如图。2、然后就是读取EXCEL文件中的数据方法，如下：1importxlrd234classreadExcel(object):5def__init__(self,path):6self.path=path78@property9defgetSheet(self):10#获取索引11xl=xlrd.open_workbook(self.path)12sheet=x
Flask(二) 路由routes @昵称不存在 Flask flask
文章目录基本路由定义路由参数路由规则设置请求方法（GET/POST）路由函数返回静态文件和模板Blueprint（模块化路由）显示当前所有路由Flask路由是Web应用程序中将URL映射到Python函数的机制。定义路由：使用@app.route(‘/path’)装饰器定义URL和视图函数的映射。路由参数：通过动态部分在URL中传递参数。路由规则：使用类型转换器指定URL参数的类型。请求方法：指定
python中random中uniform怎么用_Python中的random.uniform()函数教程与实例解析 weixin_39763640
random.uniform()函数教程与实例解析1.uniform()函数说明random.uniform(x,y)方法将随机生成一个实数，它在[x,y]范围内。2.uniform()的语法与参数2.1语法#_*_coding:utf-8_*_importrandomrandom.uniform(x,y)或#_*_coding:utf-8_*_fromrandomimportuniformuni
Python实例题：基于 KNN 算法的手写数字识别
目录Python实例题题目要求：解题思路：代码实现：Python实例题题目基于KNN算法的手写数字识别要求：实现一个基于K-NearestNeighbors(KNN)算法的手写数字识别系统。支持以下功能：使用MNIST数据集训练和测试模型实现KNN分类算法可视化手写数字样本评估模型性能（准确率、混淆矩阵等）添加用户交互界面，允许用户绘制数字并进行识别。解题思路：使用sklearn加载MNIST数据
Python实例题：基于遗传算法的旅行商问题求解狐凄实例 python 开发语言
目录Python实例题题目要求：解题思路：代码实现：Python实例题题目基于遗传算法的旅行商问题求解要求：使用遗传算法解决旅行商问题（TSP）。支持以下功能：随机生成城市坐标或导入预定义城市实现遗传算法的基本操作（选择、交叉、变异）可视化进化过程和最终路径统计进化过程中的适应度变化允许用户调整遗传算法参数（种群大小、迭代次数、交叉率、变异率等）。解题思路：用列表表示城市访问顺序作为染色体。使用欧
Python Flask Web教程004：Flask 变量规则若北辰 flask python 前端
FlaskWeb教程004：Flask变量规则1.Flask变量规则2.实例3.转换器构建规则4.规范的URL5.路由尾部有无斜杠的区别路由尾部斜杠的影响推荐使用带尾斜杠的路由结论1.Flask变量规则通过向规则参数添加变量部分，可以动态构建URL。此变量部分标记为。它作为关键字参数传递给与规则相关联的函数。2.实例在以下示例中，route()装饰器的规则参数包含附加到URL'/hello’的。因
Club_IntelliMatch_Development_Guide Joseit python python pygame django flask
ClubIntelliMatch系统-全栈开发流程文档概述ClubIntelliMatch系统是一个现代化的社团活动智能匹配平台，采用前后端分离架构。系统基于PythonFlask构建RESTfulAPI后端，Vue.js3+Vite构建现代化前端，MySQL作为持久化数据存储。本文档深入分析了整个开发流程的技术架构、设计原则和实现细节。系统架构流程图后端API架构前端组件架构app.pyFlas
Python实例题：基于 Flask 的博客系统狐凄实例 python 开发语言
目录Python实例题题目要求：解题思路：代码实现：1.base.html2.index.html3.post.html4.create_post.html5.login.html6.register.htmlPython实例题题目基于Flask的博客系统要求：使用Flask框架构建一个简单的博客系统。实现用户认证（注册、登录、注销）。支持博客文章的创建、编辑、删除和查看。使用SQLite数据库存
Python助力自动驾驶：深度学习模型优化全攻略 Echo_Wish Python！实战！python 自动驾驶深度学习
Python助力自动驾驶：深度学习模型优化全攻略说起自动驾驶，大家第一反应往往是“高精地图”“传感器融合”“路径规划”等等，背后真正的“大脑”其实是各式各样的深度学习模型。它们负责感知环境、识别路况、预测行为，甚至实时做出决策。可是，跑在车上的这些模型不仅要精准，还得轻量、实时、稳定，这可不是简单的“丢GPU就能解决”的问题。今天，咱们就从Python开发者的视角，聊聊自动驾驶里深度学习模型的优化
Ansible部署MySQL实操码农运维知识运维 mysql ansible mysql
一、Ansible概述Ansible是一款开源的自动化运维工具，由MichaelDeHaan于2012年创建，2015年被红帽（RedHat）收购（收购金额超1亿美元）。它基于Python开发，通过SSH协议实现远程节点管理，无需在被控端安装任何客户端代理（Agentless）。这种设计使其成为轻量级、易部署的自动化解决方案，特别适合批量系统配置、应用程序部署和任务编排等场景。核心特点无代理架构：
AI绘画背后的技术：Stable Diffusion原理详解与实战 AI学长带你学AI ai
AI绘画背后的技术：StableDiffusion原理详解与实战关键词：StableDiffusion、扩散模型、AI绘画、潜在空间、文本生成图像摘要：本文将带你揭开AI绘画“魔法”背后的核心技术——StableDiffusion的神秘面纱。我们会用“给小学生讲故事”的方式，从生活中的例子出发，逐步解释扩散模型的底层逻辑、StableDiffusion的关键创新，并用Python代码实战演示如何生
matplotlib 绘制热力图扶子 python matplotlib绘图代码 matplotlib python 经验分享热力图
1、功能介绍：使用了matplotlib和seaborn两个python库来创建并显示一个热力图。热力图是一种通过颜色变化来表示二维表格数据集中值分布的图形，适合用于展示矩阵数据或数据分析结果中的模式和趋势。2、代码部分：importmatplotlib.pyplotaspltimportseabornassnsimportnumpyasnp#设置中文字体plt.rcParams['font.sa
open3d 使用 RANSAC 算法拟合平面扶子 python 点云处理平面 python open3d 经验分享点云拟合平面
1、功能介绍：一个python代码演示了如何使用open3d和numpy来完成一个完整的点云平面拟合任务。它包括以下几个主要部分：生成符合某一平面方程的随机点云数据、使用RANSAC算法对这些点云进行平面拟合、可视化原始点云和平面拟合结果2、代码部分：importnumpyasnpimportopen3daso3d#生成随机点云np.random.seed(42)n_points=100#假设这些
pycharm——djiango之数据迁移，终端操作 Pop– python
首先在pycharm中找到terminal(终端)，输入指令：pythonmanage.pymakemigrations之后你会看到如下图：这表示创建成功。接着输入指令：pythonmanage.pymigrate就能看到好多ok，你在数据库中也能看到很多表你可以在终端打开数据库查看表，也可以使用客户端的可视化界面查看，还可以在pycharm中右边的database里边打开查看，如下图：之后你就可
python 百度云api_Python使用百度API上传文件到百度网盘代码分享 weixin_39775577 python 百度云api
#coding:UTF-8importurllibimporturllib2__author__='Administrator'fromposter.encodeimportmultipart_encodefromposter.streaminghttpimportregister_openersregister_openers()defupload(fileName):"""通过百度开发者API
Flask入门基础1 浅清陌 Flask flask python 后端
1Flask简介Flask诞生于2010年，是Arminronacher（阿明·罗纳彻）用Python语言基于Werkzeug工具箱编写的轻量级Web开发框架。Flask本身相当于一个内核，其他几乎所有的功能都要用到扩展（邮件扩展Flask-Mail，用户认证Flask-Login，数据库Flask-SQLAlchemy），都需要用第三方的扩展来实现。比如可以用Flask扩展加入ORM、窗体验证工
C++封装python调用库技术大白 c++开发语言
传结构体中间用空字符串问题使用callback传输结构体，中间出现\0字符，使用std::vector类型voidPyProcessInterface::ProcessContent(constchar*buff,UINT32size,boolfromSelf){if(callback){std::vectordataVec(buff,buff+size);callback(std::move(d
量化价值投资入门：Fama-French三因子模型详解与实战应用量化价值投资入门到精通 ai
量化价值投资入门：Fama-French三因子模型详解与实战应用关键词：量化投资、Fama-French三因子模型、价值投资、因子投资、资产定价、Python实现、投资组合管理摘要：本文深入解析Fama-French三因子模型的理论基础、数学原理和实际应用。作为现代金融学最重要的资产定价模型之一，三因子模型通过市场因子、规模因子和价值因子解释股票收益差异。我们将从模型起源开始，详细讲解其数学表达和
Python操作百度网盘指南 weixin_47233946 编程 python 开发语言
##介绍百度网盘是中国流行的云存储服务，通过API可以实现自动化操作。本指南介绍如何使用Python操作百度网盘，包括上传、下载、管理文件等功能。##准备工作###1.获取百度网盘开发者权限1.访问[百度开发者中心](https://pan.baidu.com/union/home)2.注册开发者账号并创建应用3.获取API密钥（AppKey和SecretKey）###2.安装必要的Python库
python读取sas数据集_SASpy模块，利用Python操作SAS
SASpy模块打通了Python与SAS之间的连接。有了SASpy模块，我们就能够在Python中操控SAS。本文将首先介绍SASpy模块的一些基本方法，最后通过一个聚类分析的例子，来展示如何在Python中调用SAS的机器学习过程，以及对聚类结果的可视化。SASpy模块特点1、需要Python3.X及以上，SAS9.4及以上，需要Java环境；2、无论是本地SAS还是远程服务器上的SAS，都可以
从数据抓取到分析：用Python爬虫获取、清洗与可视化数据程序员威哥 python 爬虫 c++
在数据科学领域，数据的获取、清洗与分析是整个数据处理过程中的关键步骤。随着互联网上数据的不断增多，使用Python爬虫抓取网站数据并进行分析已成为数据科学家和分析师的常见任务。本篇文章将通过具体的实例，展示如何使用Python从零开始抓取数据，清洗数据，并进行数据分析和可视化。1.数据抓取：用Python爬虫获取网页数据1.1选择爬虫工具Python提供了多个强大的爬虫框架和库，常用的工具包括：r
Python基础（吃洋葱小游戏） aaiier python pygame 开发语言
下面我将为你设计一个"吃洋葱小游戏"的Python实现方案，使用Pygame库开发。这个游戏模拟吃洋葱的过程，玩家需要收集不同种类的洋葱以获得高分，同时避免吃到辣椒。吃洋葱小游戏-Python实现方案1.游戏设计概念游戏目标：玩家控制角色吃掉尽可能多的洋葱获得高分核心机制：洋葱从屏幕上方随机下落玩家左右移动角色接住洋葱不同洋葱有不同分值（普通洋葱+10，红洋葱+20，紫洋葱+50）辣椒会扣减生命值
模拟工作队列 - 华为OD机试真题(JavaScript卷) 什码情况算法面试 javascript 数据结构华为od
华为OD机试题库《C++》限时优惠9.9华为OD机试题库《Python》限时优惠9.9华为OD机试题库《JavaScript》限时优惠9.9针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。看不懂有疑问需要答疑辅导欢迎私VX：code5bug题目描述让我们来模拟一个工作队列的运作，有一个任务提交者和若干任务执行者，执行者从1开始编号。提交者会在给定的时
数据分类 - 华为OD机试真题(JavaScript 题解) 什码情况华为od javascript 开发语言数据结构算法机试
华为OD机试题库《C++》限时优惠9.9华为OD机试题库《Python》限时优惠9.9华为OD机试题库《JavaScript》限时优惠9.9针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。看不懂有疑问需要答疑辅导欢迎私VX：code5bug题目描述对一个数据a进行分类，分类方法为：此数据a（四个字节大小）的四个字节相加对一个给定的值b取模，如果得到的
odrive软件的版本 m0_55305757 stm32 电机嵌入式硬件 odrive
odrive软件的版本0.4.0通信方面引入一个fibre变复杂了（节点还是手工生成的），cpp程序开始变多了。（sensorless我看到变成独立文件了）pythontool开始使用pip安装形式。0.5.0开始支持spi的encoder，as5047之类0.5.1据说之后的版本controlloop开始变化0.5.2开始应该是大修改了//RequiredtouseOC4forADCtrigge
说说自己Python 代码优化实践 chilavert318 大数据 linux 运维 python
今年上半年在外省做一个大数据相关的项目，在review项目组成员的代码时，发现一段处理大数据集的模块存在明显性能瓶颈：10万条数据的清洗流程耗时近20分钟，CPU占用率却始终在30%以下。深入分析后发现，看似简洁的Python代码背后，隐藏着诸多可以优化的细节——这并非个例，我们的程序在追求代码可读性时，往往忽略了Python特有的性能陷阱。今天抽点时间，从我实践中的代码就python开发，从内存
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri