幸运的小菜鸟

时间序列预测框架--Darts--快速开始（上）

时间序列框架-Darts

快速开始
- 安装Darts
- 构建和操作时间序列
- - 读取数据并构建时间序列
  - 一些时间序列操作
  - - splitting
    - slicing
    - arithmetic operations
    - stacking
    - mapping
    - 同时在时间戳和值之间进行映射
    - 添加一些datetime属性作为额外的维度(产生多元序列)
    - 添加一些二进制节日组件:
    - differencing(差分？)
    - 填充缺失的值(使用' ' utils ' '函数)
  - 构建训练序列和验证序列
- 训练预测模型并进行预测
- - playing with toy models
  - - 检查季节性
    - 一个稍微naive的模型
  - 计算误差指标
  - 快速尝试几个模型
  - - 用Theta方法搜索超参数
- 回测：模拟历史预测
- 机器学习和全局模型
- - 两个序列的例子
  - 使用深度学习:N-BEATS的例子

快速开始

安装Darts

pip 安装：

pip install darts

conda安装：

conda install -c conda-forge -c pytorch u8darts-all

首先引入一些包

%load_ext autoreload
%autoreload 2
%matplotlib inline

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

from darts import TimeSeries
from darts.datasets import AirPassengersDataset

构建和操作时间序列

TimeSeries是dart中的主要数据类。TimeSeries表示单变量或多变量时间序列，具有适当的时间索引。时间索引可以是pandas类型。DatetimeIndex(包含日期时间)或pandas类型。RangeIndex(包含整数;用于表示没有特定时间戳的顺序数据)。在某些情况下，TimeSeries甚至可以表示概率序列，例如，为了获得置信区间。dart中的所有模型都输入TimeSeries并输出TimeSeries。

读取数据并构建时间序列

使用一些factory方法可以轻松构建时间序列：

从一个完整的Pandas DataFrame，使用TimeSeries.from_dataframe()
从时间索引和相应值的数组中获取TimeSeries.from_times_and_values()
从NumPy值数组中，使用TimeSeries.from_values()
从Pandas系列中，使用TimeSeries.from_series()
从xarray.DataArray,使用TimeSeries.from_xarray ()
从CSV文件，使用TimeSeries.from_csv()

下面，我们通过直接从dart中提供的一个数据集加载航空乘客系列来获得TimeSeries

series = AirPassengersDataset().load()
series.plot()

一些时间序列操作

splitting

我们还可以以系列的一小部分、pands的时间戳或整数索引值进行分割

series1, series2 = series.split_before(0.75)
series1.plot()
series2.plot()

slicing

series1, series2 = series[:-36], series[-36:]
series1.plot()
series2.plot()

arithmetic operations

series_noise = TimeSeries.from_times_and_values(
    series.time_index, np.random.randn(len(series))
)
(series / 2 + 20 * series_noise - 10).plot()

stacking

连接一个新的维度以产生一个新的单一的多元序列。

(series / 50).stack(series_noise).plot()

mapping

series.map(np.log).plot()

同时在时间戳和值之间进行映射

series.map(lambda ts, x: x / ts.days_in_month).plot()

添加一些datetime属性作为额外的维度(产生多元序列)

(series / 20).add_datetime_attribute("month").plot()

添加一些二进制节日组件:

(series / 200).add_holidays("US").plot()

differencing(差分？)

填充缺失的值(使用’ ’ utils ’ '函数)

缺失值用np.nan表示

from darts.utils.missing_values import fill_missing_values

values = np.arange(50, step=0.5)
values[10:30] = np.nan
values[60:95] = np.nan
series_ = TimeSeries.from_values(values)

(series_ - 10).plot(label="with missing values (shifted below)")
fill_missing_values(series_).plot(label="without missing values")

构建训练序列和验证序列

接下来，我们将把TimeSeries分成训练集和验证集。注意:通常，将测试集放在一边，直到过程结束时才接触它，这也是一个很好的实践。在这里，为了简单起见，我们只构建了一个训练集和验证集。

训练集将是一个TimeSeries，其中包含1958年1月之前的值(除外)，验证集是一个TimeSeries，其中包含其他值

train, val = series.split_before(pd.Timestamp("19580101"))
train.plot(label="training")
val.plot(label="validation")

训练预测模型并进行预测

playing with toy models

在dart中有一组“naive”的基线模型，这对于获得人们所期望的最低精度非常有用。例如，NaiveSeasonal(K)模型总是“重复”发生在K个时间步之前的值。

在最简单的情况下，当K=1时，这个模型只是简单地重复训练序列的最后一个值。

from darts.models import NaiveSeasonal

naive_model = NaiveSeasonal(K=1)
naive_model.fit(train)
naive_forecast = naive_model.predict(36)

series.plot(label="actual")
naive_forecast.plot(label="naive forecast (K=1)")

在TimeSeries上拟合模型和产生预测非常容易。所有模型都有一个fit()和一个predict()函数。这类似于Scikit-learn，只不过它是特定于时间序列的。fit()函数的参数是拟合模型的训练时间序列，predict()函数的参数是要预测的时间步数(在训练序列结束后)

检查季节性

我们上面的模型可能有点太naive了。我们已经可以通过利用数据中的季节性来改进。很明显，数据具有年度季节性，我们可以通过观察自相关函数(ACF)和突出滞后m=12来确认这一点。

from darts.utils.statistics import plot_acf, check_seasonality

plot_acf(train, m=12, alpha=0.05)

ACF在x = 12处呈现一个峰值，这表明了年度季节性趋势(用红色突出显示)。蓝色区域决定了置信水平的统计数据的显著性。我们还可以对每个候选时期m进行季节性的统计检查。

for m in range(2, 25):
    is_seasonal, period = check_seasonality(train, m=m, alpha=0.05)
    if is_seasonal:
        print("There is seasonality of order {}.".format(period))

There is seasonality of order 12.

一个稍微naive的模型

让我们再次尝试NaiveSeasonal模型，将季节性设置为12

seasonal_model = NaiveSeasonal(K=12)
seasonal_model.fit(train)
seasonal_forecast = seasonal_model.predict(36)

series.plot(label="actual")
seasonal_forecast.plot(label="naive forecast (K=12)")

这是更好的，但我们仍然忽略了趋势。幸运的是，还有另一个naive基线模型捕捉了这一趋势，它被称为NaiveDrift。这个模型只是产生线性预测，其斜率由训练集的第一个和最后一个值决定。

from darts.models import NaiveDrift

drift_model = NaiveDrift()
drift_model.fit(train)
drift_forecast = drift_model.predict(36)

combined_forecast = drift_forecast + seasonal_forecast - train.last_value()

series.plot()
combined_forecast.plot(label="combined")

我们只是简单地拟合一个朴素的漂移模型，并将其预测添加到我们之前的季节预测中。我们还从结果中减去训练集的最后一个值，这样得到的组合预测从正确的偏移量开始。

计算误差指标

这看起来已经是一个相当不错的预测，而且我们还没有使用任何非幼稚模型。事实上，任何模型都应该能够克服这个问题。
那么我们需要克服什么误差呢?我们将使用平均绝对百分比误差(MAPE)(注意，在实践中，不使用MAPE通常有很好的理由—我们在这里使用它，因为它非常方便并且与规模无关)。在dart中，它是一个简单的函数调用:

from darts.metrics import mape

print(
    "Mean absolute percentage error for the combined naive drift + seasonal: {:.2f}%.".format(
        mape(series, combined_forecast)
    )
)

Mean absolute percentage error for the combined naive drift + seasonal: 5.66%.
darts.metrics指标包含更多用于比较时间序列的指标。当两个级数没有对齐时，该度量将只比较级数的普通片段，并对大量的级数对进行并行计算—但我们不要过于超前。

快速尝试几个模型

dart的建立是为了便于以统一的方式训练和验证几个模型。让我们再训练一些代码，并在验证集中计算它们各自的MAPE。

from darts.models import ExponentialSmoothing, TBATS, AutoARIMA, Theta


def eval_model(model):
    model.fit(train)
    forecast = model.predict(len(val))
    print("model {} obtains MAPE: {:.2f}%".format(model, mape(val, forecast)))


eval_model(ExponentialSmoothing())
eval_model(TBATS())
eval_model(AutoARIMA())
eval_model(Theta())

model ExponentialSmoothing(trend=ModelMode.ADDITIVE, damped=False, seasonal=SeasonalityMode.ADDITIVE, seasonal_periods=12 obtains MAPE: 5.11%
model (T)BATS obtains MAPE: 5.87%
model Auto-ARIMA obtains MAPE: 11.65%
model Theta(2) obtains MAPE: 8.15%

在这里，我们只使用默认参数构建了这些模型。如果我们对问题进行微调，可能会做得更好。我们试试θ法。

用Theta方法搜索超参数

模型Theta包含Assimakopoulos和Nikolopoulos的Theta方法的实现。这种方法已经取得了一些成功，特别是在m3比赛中。

虽然在应用程序中Theta参数的值经常被设置为0，但我们的实现支持变量值，以进行参数调优。让我们试着为Theta找到一个好的值:

# Search for the best theta parameter, by trying 50 different values
thetas = 2 - np.linspace(-10, 10, 50)

best_mape = float("inf")
best_theta = 0

for theta in thetas:
    model = Theta(theta)
    model.fit(train)
    pred_theta = model.predict(len(val))
    res = mape(val, pred_theta)

    if res < best_mape:
        best_mape = res
        best_theta = theta

best_theta_model = Theta(best_theta)
best_theta_model.fit(train)
pred_best_theta = best_theta_model.predict(len(val))

print(
    "The MAPE is: {:.2f}, with theta = {}.".format(
        mape(val, pred_best_theta), best_theta
    )
)

The MAPE is: 4.40, with theta = -3.5102040816326543.

train.plot(label="train")
val.plot(label="true")
pred_best_theta.plot(label="prediction")

我们可以观察到，就MAPE而言，带best_theta的模型是目前为止最好的

回测：模拟历史预测

所以在这一点上，我们有了一个在验证集上表现良好的模型，这很好。但是，如果我们在历史上一直使用这个模型，我们如何知道我们会获得的性能呢?

回溯测试模拟的是在给定模型的历史上获得的预测。它可能需要一段时间来生成，因为(默认情况下)每当模拟预测时间向前推进时，都会对模型进行重新训练。

这种模拟预报总是根据forecast horizon来定义的，它是将预测时间与预报时间分开的时间步数。在下面的例子中，我们模拟了未来3个月的预测(与预测时间相比)。调用historical_forecasts()的结果(默认)是一个包含未来3个月预测的TimeSeries:

historical_fcast_theta = best_theta_model.historical_forecasts(
    series, start=0.6, forecast_horizon=3, verbose=True
)

series.plot(label="data")
historical_fcast_theta.plot(label="backtest 3-months ahead forecast (Theta)")
print("MAPE = {:.2f}%".format(mape(historical_fcast_theta, series)))

MAPE = 7.70%

因此，当我们进行回测时，我们在验证集上最好的模型似乎不再那么好了(我听到过拟合了吗:D)
为了更仔细地查看错误，我们还可以使用backtest()方法来获得所有原始错误(例如，MAPE错误)，这些错误将由我们的模型获得:

best_theta_model = Theta(best_theta)

raw_errors = best_theta_model.backtest(
    series, start=0.6, forecast_horizon=3, metric=mape, reduction=None, verbose=True
)

from darts.utils.statistics import plot_hist

plot_hist(
    raw_errors,
    bins=np.arange(0, max(raw_errors), 1),
    title="Individual backtest error scores (histogram)",
)

最后，使用backtest()我们还可以得到历史预测平均误差的一个更简单的视图:

average_error = best_theta_model.backtest(
    series,
    start=0.6,
    forecast_horizon=3,
    metric=mape,
    reduction=np.mean,  # this is actually the default
    verbose=True,
)

print("Average error (MAPE) over all historical forecasts: %.2f" % average_error)

Average error (MAPE) over all historical forecasts: 6.36
例如，我们也可以指定参数reduction=np.mean。来得到中值MAPE。

我们来看看我们现在的Theta模型的拟合残差，即模型在之前所有点上拟合得到的每个时间点上的1步预测与实际观测值的差值。

from darts.utils.statistics import plot_residuals_analysis

plot_residuals_analysis(best_theta_model.residuals(series))

我们可以看到分布不是以0为中心，这意味着我们的Theta模型是有偏差的。我们还可以得出一个较大的滞后ACF值为12，这表明残差中包含了模型没有用到的信息。

我们能用简单的指数平滑模型做得更好吗?

model_es = ExponentialSmoothing()
historical_fcast_es = model_es.historical_forecasts(
    series, start=0.6, forecast_horizon=3, verbose=True
)

series.plot(label="data")
historical_fcast_es.plot(label="backtest 3-months ahead forecast (Exp. Smoothing)")
print("MAPE = {:.2f}%".format(mape(historical_fcast_es, series)))

MAPE = 4.45%

这个更好!在这种情况下，当使用3个月的预测水平进行回溯测试时，我们得到了大约4-5%的平均绝对百分比误差。

plot_residuals_analysis(model_es.residuals(series))

残差分析还反映了性能的改进，因为我们现在有一个残差分布集中在值0，而ACF值虽然不是无关紧要，但具有较低的幅度。

机器学习和全局模型

dart为机器学习和深度学习预测模型提供了丰富的支持;例如:

regression model可以围绕任何sklearn兼容的回归模型来产生预测(它在下面有自己的部分)。
RNNModel是一个灵活的RNN实现，可以像DeepAR一样使用。
NBEATSModel实现了N-BEATS模型。
TFTModel实现了Temporal Fusion Transformer model.
TCNModel实现了时间卷积网络

除了支持与其他模型相同的基本fit()/predict()接口外，这些模型也是全局模型，因为它们支持对多个时间序列进行训练(有时称为元学习)。

这是使用基于ML的模型进行预测的关键点:通常，ML模型(尤其是深度学习模型)需要在大量数据上进行训练，这通常意味着大量独立但相关的时间序列。

在dart中，指定多个TimeSeries的基本方法是使用一个TimeSeries序列(例如，一个简单的TimeSeries列表)。

两个序列的例子

这些模型可以在数千个序列上训练。在这里，为了说明问题，我们将加载两个不同的序列——航空交通乘客数和另一个系列，包含每头奶牛每月生产的牛奶的磅数。我们也将我们的级数转换为np.Float32会稍微加快训练速度:

from darts.datasets import AirPassengersDataset, MonthlyMilkDataset

series_air = AirPassengersDataset().load().astype(np.float32)
series_milk = MonthlyMilkDataset().load().astype(np.float32)

# set aside last 36 months of each series as validation set:
train_air, val_air = series_air[:-36], series_air[-36:]
train_milk, val_milk = series_milk[:-36], series_milk[-36:]

train_air.plot()
val_air.plot()
train_milk.plot()
val_milk.plot()

首先，让我们在0到1之间缩放这两个序列，因为这将使大多数ML模型受益。我们将使用一个标量:

from darts.dataprocessing.transformers import Scaler

scaler = Scaler()
train_air_scaled, train_milk_scaled = scaler.fit_transform([train_air, train_milk])

train_air_scaled.plot()
train_milk_scaled.plot()

请注意我们如何一次扩展多个系列。我们还可以通过指定n_jobs来在多个处理器上并行处理这类操作。

使用深度学习:N-BEATS的例子

接下来，我们将建立一个N-BEATS模型。这个模型可以通过许多超参数(如栈数、层数等)进行调优。这里，为了简单起见，我们将使用默认超参数。我们只需要提供两个超参数:

nput_chunk_length:这是模型的“回望窗口”——即，神经网络在前向传递中以多少时间步作为输入来产生输出。
Output_chunk_length:这是模型的“前向窗口”，即神经网络在前向传递中输出未来值的时间步数。
random_state参数用于获得可重现的结果。
darts中的大多数神经网络都需要这两个参数。在这里，我们将使用季节性的倍数。现在，我们准备对两个系列的模型进行拟合(通过给出包含两个系列的列表to fit()):

from darts.models import NBEATSModel

model = NBEATSModel(input_chunk_length=24, output_chunk_length=12, random_state=42)

model.fit([train_air_scaled, train_milk_scaled], epochs=50, verbose=True);

[2022-06-21 16:04:42,259] INFO | darts.models.forecasting.torch_forecasting_model | Train dataset contains 194 samples.
[2022-06-21 16:04:42,259] INFO | darts.models.forecasting.torch_forecasting_model | Train dataset contains 194 samples.
2022-06-21 16:04:42 darts.models.forecasting.torch_forecasting_model INFO: Train dataset contains 194 samples.
[2022-06-21 16:04:42,341] INFO | darts.models.forecasting.torch_forecasting_model | Time series values are 32-bits; casting model to float32.
[2022-06-21 16:04:42,341] INFO | darts.models.forecasting.torch_forecasting_model | Time series values are 32-bits; casting model to float32.
2022-06-21 16:04:42 darts.models.forecasting.torch_forecasting_model INFO: Time series values are 32-bits; casting model to float32.
2022-06-21 16:04:42 pytorch_lightning.utilities.rank_zero INFO: GPU available: False, used: False
2022-06-21 16:04:42 pytorch_lightning.utilities.rank_zero INFO: TPU available: False, using: 0 TPU cores
2022-06-21 16:04:42 pytorch_lightning.utilities.rank_zero INFO: IPU available: False, using: 0 IPUs
2022-06-21 16:04:42 pytorch_lightning.utilities.rank_zero INFO: HPU available: False, using: 0 HPUs
2022-06-21 16:04:42 pytorch_lightning.callbacks.model_summary INFO:
  | Name          | Type             | Params
---------------------------------------------------
0 | criterion     | MSELoss          | 0
1 | train_metrics | MetricCollection | 0
2 | val_metrics   | MetricCollection | 0
3 | stacks        | ModuleList       | 6.2 M
---------------------------------------------------
6.2 M     Trainable params
1.4 K     Non-trainable params
6.2 M     Total params
24.787    Total estimated model params size (MB)

现在让我们对未来36个月的两个序列做一些预测。我们可以使用fit()函数的serise参数来告诉模型预测哪个级数。重要的是，output_chunk_length并没有直接限制可与predict()一起使用的预测水平n。在这里，我们用Output_chunk_length =12，并对未来n=36个月进行预测;这只是在幕后以一种自动回归的方式完成的(网络递归地消耗它以前的输出)。

pred_air = model.predict(series=train_air_scaled, n=36)
pred_milk = model.predict(series=train_milk_scaled, n=36)

# scale back:
pred_air, pred_milk = scaler.inverse_transform([pred_air, pred_milk])

plt.figure(figsize=(10, 6))
series_air.plot(label="actual (air)")
series_milk.plot(label="actual (milk)")
pred_air.plot(label="forecast (air)")
pred_milk.plot(label="forecast (milk)")

考虑到我们使用一个带有默认超参数的模型来捕捉航空乘客和牛奶产量，我们的预测实际上并不那么可怕!

这个模型似乎很好地捕捉了每年的季节，但错过了air series的趋势信息。在下一节中，我们将尝试使用外部数据(协变量)来解决这个问题。

你可能感兴趣的:(深度学习,python,机器学习之python学习,python,pandas,开发语言)

Python 库包 sentence-transformers 音程机器学习人工智能 python 开发语言
sentence-transformers是一个非常流行的Python库，专门用于将文本（句子、段落、文档）转换为高质量的语义向量（嵌入）。它基于Transformer架构（如BERT、RoBERTa、DistilBERT等）的预训练模型，并在大量语义相似性数据上进行了微调，能够捕捉句子之间的深层语义关系。什么是sentence-transformers？项目地址：https://www.sber
【python】解决No module named _sqlite3的问题欧阳秦穆
环境版本说明：centos7python3.6.4django2.0在创建django项目时候。报错以下信息详细错误信息如下：原因：未安装sqlite模块解决：1安装sqlite-develyuminstallsqlite-devel2重新编译pythoncd/usr/local/python3.6.4./configuremakemakeinstall
利用反汇编技术将游戏《英雄无敌3》修改为硬盘版安联酋长汇编游戏汇编
最近好不容易找到我最喜欢的游戏《英雄无敌3之埃拉西亚的光复》，可惜是光盘版的，要用虚拟光驱来运行，感觉不爽，网上也找不到免CD补丁，于是决定自己动手。首先感谢这篇文章的作者http://bbs.pediy.com/showthread.php?t=101023是他引领我进入反汇编的大门。这篇文章的第一步，就是找到GetDriveType的调用（GetDriveType就是判断某盘符是光驱、硬盘或网
面试必问之JVM原理 teayear 面试 jvm 职场和发展
1：什么是JVMJVM是JavaVirtualMachine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以
SIMULINK开发项目实例 1000 例专栏之第663例：基于simulink的SVPWM技术的研究的三相电压源逆变器建模仿真 xiaoheshang_123 MATLAB 开发项目实例 1000 例专栏手把手教你学 MATLAB 专栏 matlab simulink
目录准备工作步骤详解第一步：创建Simulink项目第二步：选择并添加合适的库组件第三步：构建基本的三相电压源逆变器模型第四步：实现SVPWM算法第五步：仿真与调试第六步：结果分析第七步：优化与改进第八步：导出与部署总结三相电压源逆变器（VoltageSourceInverter,VSI）在电力电子中是将直流电转换为交流电的一种重要设备，广泛应用于电机驱动、不间断电源（UPS）、可再生能源系统等领
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
Python Scrapy的爬虫中间件开发 AI天才研究院 python scrapy 爬虫 ai
PythonScrapy爬虫中间件开发：从原理到实战的深度解析关键词Scrapy中间件、爬虫扩展、请求响应处理、反爬绕过、中间件生命周期、钩子函数、分布式爬取摘要本文系统解析Scrapy爬虫中间件（SpiderMiddleware）的开发方法论，覆盖从基础概念到高级实践的全链路知识。通过第一性原理推导中间件的核心机制，结合层次化架构分析（理论→设计→实现→应用），提供生产级代码示例与可视化流程模型
Pandas-数据组合赛丽曼 Pandas pandas
文章目录一.concat二.merge三.join(了解)day09一.concat二.merge三.join(了解)
使用Python将PDF转换成word、PPT wh3933 python pdf word
在现代企业环境中，文档格式的转换是一项普遍且关键的需求。PDF（PortableDocumentFormat）作为一种最终的、通常不可编辑的“打印”状态格式，被广泛用于分发和归档。然而，内容的创建、协作和修改主要在MicrosoftOffice套件中进行，特别是Word（DOCX）和PowerPoint（PPTX）。因此，以编程方式弥合这两种格式之间的鸿沟，已成为数据提取、内容迁移和工作流自动化领
Python实现文件移动到指定文件夹 wh3933 python java 前端
在Python中，将文件从一个位置移动到另一个位置是一项常见的操作。无论是整理下载、归档旧文件，还是在复杂的项目中管理文件结构，掌握文件移动的技巧都至关重要。本文将全面介绍在Python中移动文件的各种方法，并提供详尽的代码示例，帮助您轻松应对不同场景下的文件管理需求。核心方法：shutil.move()在Python标准库中，shutil模块提供了高级的文件操作功能，其中的shutil.move
Python设置国内镜像教程 wh3933 python 开发语言
####引言Python是一种广泛使用的高级编程语言，用于各种编程任务，从简单的脚本到复杂的机器学习算法。在安装Python包时，通常需要从Python包索引（PyPI）下载。由于网络原因，直接从PyPI下载可能速度较慢，因此，使用国内的镜像源可以显著提高下载速度。本文将详细介绍如何在Python中设置国内镜像。####文章目的本篇文章旨在指导用户如何将Python的包管理工具`pip`的默认源切
python中使用pyinstaller将python项目打包为exe可执行文件不吃西红柿丿 python windows
1、安装pyinstallerpipinstallpyinstaller-ihttps://pypi.tuna.tsinghua.edu.cn/simple2、打包应用2.1、使用命令行直接打包pyinstaller-F-w-iyour_path/log.icomain.py命令：-F将项目打包为单个exe文件，没有其它文件-D将项目打包为一个文件夹里面又有一个exe文件以及其它依赖，启动速度比-
如何解决pip安装报错ModuleNotFoundError: No module named ‘os’问题 lyzybbs 全栈Bug解决方案专栏 pip python pycharm 开发语言 pandas numpy beautifulsoup
【Python系列Bug修复PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘os’问题1.摘要在使用PyCharm2025的控制台执行pipinstall时，常常会遇到各种奇怪的安装失败或安装后仍然报ModuleNotFoundError的问题，例如“Nomodulenamed‘os’”。本文将从开发场景、环境
如何解决pip安装报错ModuleNotFoundError: No module named ‘sys’问题 lyzybbs 全栈Bug解决方案专栏 pip pycharm python pandas scrapy beautifulsoup matplotlib
【Python系列Bug修复PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘sys’问题摘要在使用PyCharm内置终端或控制台执行pipinstallsys等命令时，常常会遇到如下异常：ModuleNotFoundError:Nomodulenamed‘sys’该错误看似与常驻Python核心库sys有关，但
OPENAI中Assistants API的实现原理及示例代码python实现 dzend aigc python ai
OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
Java+Python智能化云盘【Day5-1】关沐吖 Java+Python Ai智能云盘项目开发专栏 python java 开发语言
RAG系统链路和数据加载Loaders技术OK啊昨天Day4-2，最后提及了很多的一些Loader加载器，有文档类型、数据库类型、网页加载器类型等等，它们其实都是属于langchain_community.document_loaders这个包下的类。今天来先复习一下都有哪些，再讲讲其中的代码运行的基本框架，和文档中有图片的处理方式。Loader的分类与常见类型文件加载器（FileLoaders）
Java+Python智能化云盘【Day3】关沐吖 Java+Python Ai智能云盘项目开发专栏 java python 开发语言
提示词工程Prompt简介：大模型必备Prompt提示词工程讲解什么是PromptEngineering提示词工程通过特定格式的文本输入引导AI模型生成期望输出的技术，明确地告诉模型你想要解决的问题或完成的任务也是大语言模型理解用户需求并生成相关、准确回答或内容的基础类比：给Java程序员的任务需求文档（越清晰明确，结果越符合预期）为什么需要学习？大模型就是你的员工，你可以有多个助手，OpenAI
Java+Python智能化Ai云盘[Day2]
OK啊，为了完成学校老师布置的UML作业主播也是开始拿自己的项目开始当成期末大作业来交了。顺道的我也把自己的项目整个的梳理了一通，如果大家最近有UML的大作业要交也可以自取，到时候我把文章word版本直接发到百度网盘上去。里面我只有类图、用例图、活动图、顺序图、状态图。这次也算是一个提前复习了一下项目了把，整个的文档文字都是拿ai去写的，图的话也是我先看了一遍代码，然后给ai说了一遍也算是自己理通
24Ghz毫米波微动雷达感应开关传感器，灯控节能又省心，人走灯灭飞睿科技人体感应器人体传感器跌倒探测微动雷达传感器照明控制节能
你是否曾经走进一栋楼，发现走廊的灯一直亮着，即使空无一人？又或者，你是否曾在夜晚离开办公室，却忘记关灯，结果第二天被同事提醒浪费了电？这些情况在日常生活中屡见不鲜，而背后隐藏的问题则是能源浪费。现在，飞睿智能毫米波微动雷达感应开关传感器的新技术，正悄然改变这一现状，它能够实现“人来灯亮，人走灯灭”的智能灯控，为楼区带来显著的节能效果。毫米波微动雷达感应开关传感器：节能的智慧之眼想象一下，如果楼区的
基于uniapp小程序的诗词学习系统附带文章源码部署视频讲解等
文章目录前言详细视频演示具体实现截图核心技术介绍小程序框架Uniapp前端框架Vue持久层框架MyBaits为什么选择我代码参考数据库参考测试用例参考源码获取前言博主介绍：✌CSDN特邀作者、资深全栈开发程序员，曾在互联网大厂担任高级职位、码云/掘金/华为云/阿里云/InfoQ/StackOverflow/github等平台优质作者、专注于Java、小程序、前端、python等技术领域毕业项目实战
鸿蒙设备开发OpenHarmony深度解读之设备认证：HiChain机制部分源码解析1（推荐模块之外）
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……一、概述H
Windows安装MySQL及Python操作MySQL数据库脚本实例详解
1、Windows上安装MySQL便于测试，笔者在windows上安装MySQL，如有现成Linux下的MySQL和Python环境，也可直接使用。MySQL的官网下载链接安装步骤1)下载后的mysql-5.7.23-winx64.zip安装包解压至某一位置，在mysql-5.7.23-winx64.zip根目录下创建my.ini文件添加以下内容：my.ini[mysql]default-char
（纯新手练习五）python基础代码，我手把手带你敲（类与对象，实例，构造函数__init__初始化对象属性，继承，方法重写，类的文档字符串，模块化）星期天要睡觉 python 开发语言
目录1.基本理论简述类与对象构造函数（Constructor）继承（Inheritance）方法重写（MethodOverriding）四者关系总结类的文档字符串（Docstring）2.练习开始3.代码模块化练习（纯新手练习五）python基础代码，我手把手带你敲（类与对象，实例，构造函数__init__初始化对象属性，继承，方法重写，类的文档字符串，模块化）（下一节课：文件操作）基本理论简述类
计算机毕业设计之springboot书法字典小程序的设计与实现 2301_77990509 课程设计 spring boot 小程序
本项目旨在设计与实现一个基于SpringBoot的书法字典小程序，通过整合现代互联网技术与传统书法艺术，为用户提供一个便捷的书法字典查询平台。该小程序主要功能包括书法字的查询、学习资料、字帖的存储及分享等。首先，项目采用SpringBoot框架进行后端开发，利用其简化的配置和强大的模块支持，提高开发效率。为了实现高效的数据存储与查询，系统使用了MySQL数据库，存储书法字的基本信息、释义及相关图片
区间求最值问题高效解决方法东皇太星 python
对于区间求最值场景，如果区间不定长度的，可以使用稀疏表进行求解，如果区间是固定长度的，则可以使用分块的思想（与稀疏表原理类似），都是通过压缩状态个数，1关于稀疏表的原理详见：稀疏表（SparseTable，ST原理及应用场景下面是一个稀疏表的python实现classSolution:def__init__(self,nums):self.nums=numsself.init_value=-999
python优先队列使用_Python优先队列实现方法示例
本文实例讲述了Python优先队列实现方法。分享给大家供大家参考，具体如下：1.代码importQueueimportthreadingclassJob(object):def__init__(self,priority,description):self.priority=priorityself.description=descriptionprint'Newjob:',description
python优先队列使用_python 线程队列PriorityQueue（优先队列）（37）
在线程队列Queue/线程队列LifoQueue文章中分别介绍了先进先出队列Queue和先进后出队列LifoQueue，而今天给大家介绍的是最后一种：优先队列PriorityQueue，对队列中的数据按照优先级排序，那么具体怎么用呢？一.队列Queue分类：1.线程队列Queue—FIFO(先进先出队列)，即哪个数据先存入，取数据的时候先取哪个数据，同生活中的排队买东西；2.线程队列LifoQue
机器学习宝典——第6章爱看烟花的码农机器学习人工智能
第6章：聚类算法(Clustering)你好，同学！欢迎来到无监督学习的世界。与监督学习不同，这里的我们没有“标准答案”（标签），我们的目标是在数据中发现隐藏的、内在的结构。聚类算法就是实现这一目标的核心工具，它试图将数据集中的样本划分为若干个不相交的子集，我们称之为“簇”(cluster)。本章我们将深入探讨三种最具代表性的聚类算法：K-均值(K-Means)、层次聚类(Hierarchical
Python|Pyppeteer规避反自动化检测方法【最新方案】(33) 写python的鑫哥 Pyppeteer从入门到精通 python pyppeteer puppeteer 规避反自动化检测反爬虫
前言本文是该专栏的第33篇，结合优质项目案例持续分享Pyppeteer的干货知识，记得关注。相信有些同学在使用Pyppeteer框架进行某个自动化操作的时候，会触发平台的检测机制，让目标平台识别出当前是机器人在操作，而非人为操作，导致让你的程序无法继续进行下一步。对于上述这种情况，你是不是有很大的疑惑呢？别担心，本文笔者专门针对上述问题，来详细介绍在使用Pyppeteer的过程中，出现反自动化机制
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。