肖永威

时间序列分析ARMA模型原理及Python statsmodels实践（下）

4. ARMA模型预测销量实践
- 4.1. 统计分析包statsmodels
- 4.2. 常用函数概述
- - 4.2.1. 绘制自相关、偏自相关图
  - 4.2.2. 白噪声检验
  - 4.2.3. 单位根检验
  - - 4.2.3.1. 单位根如何确定数据是否平稳？
  - 4.2.4. 选定模型参数
  - 4.2.5. ARIMA模型函数
  - - 4.2.5.1. 常用方法
    - 4.2.5.2. 常用属性/参数
- 4.3. Python实践过程
- - 4.3.1. 时序数据平稳性检验
  - 4.3.2. 差分及相关检验
  - 4.3.3. 白噪声检验
  - - 4.3.3.1. 单位根ADF检验
    - 4.3.3.2. Ljung-Box检验
  - 4.3.4. 模型定阶
  - 4.3.5. 模型训练及拟合分析
  - 4.3.6. 残差分析
  - 4.3.7. 模型报告与预测
5. 总结
- 5.1. 适用场景
- 5.2. 应用效果
- 5.3. 结论

续上文，时间序列分析ARMA模型原理及Python statsmodels实践（上）。

4. ARMA模型预测销量实践

实践概述：
以每月销售油量时序数据为分析对象，按时序数据分析方法，建立ARMA模型，预测未来油的销量。
实践目标：
- 时序数据检验
- ARMA建模
- 销售预测

4.1. 统计分析包statsmodels

statsmodels（http://www.statsmodels.org）是一个Python库，用于拟合多种统计模型，执行统计测试以及数据探索和可视化。statsmodels包含更多的“经典”频率学派统计方法，而贝叶斯方法和机器学习模型可在其他库中找到。

与scikit-learn相比，statsmodels包含经典的（高频词汇）统计学、经济学算法。它所包含的模型如下。

回归模型：线性回归、通用线性模型、鲁棒线性模型、线性混合效应模型等
方差分析（ANOVA ）
时间序列分析：AR、ARMA、ARIMA、VAR等模型
非参数方法：核密度估计、核回归
统计模型结果可视化

statsmodels更专注于统计推理，提供不确定性评价和p值参数。相反，scikit-learn更专注于预测。能够很好的和Numpy和Pandas等库结合起来，提高工作效率。

安装statsmodels包：

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple statsmodels

注，本文仅讨论普通ARMA模型，未讨论季节性ARMA，请关注后续内容。

4.2. 常用函数概述

4.2.1. 绘制自相关、偏自相关图

statsmodels.graphics.tsa.plot_acf()，绘制时间序列的自相关图。
statsmodels.graphics.tsa.plot_pacf()，绘制时间序列的偏自相关图。

其中，参数(x, ax=None, lags=None, alpha=0.05, use_vlines=True, unbiased=False, fft=False, title=‘Autocorrelation’, zero=True, **kwargs)

x：一维的数据序列。
lags：滞后阶数，若未提供，则取np.arange(len(corr))
alpha：如果给定一个数字，则返回给定级别的置信区间。例如，如果alpha=0.05，返回95%置信区间，如果无，则不绘制置信区间。

4.2.2. 白噪声检验

对数据序列的随机性做假设检验，如果是随机序列，那它们的值之间没有任何关系，使用statsmodels.stats.diagnostic.acorr_ljungbox(x, lags=None, boxpierce=False, model_df=0, period=None,
return_df=True, auto_lag=False)函数检验白噪声。

主要输入：

x：一维的数据序列；
lags：滞后阶数；
period：季节性时间序列的周期。用于计算最大滞后阶数，对于使用min（2*period，nobs//5）（如果设置）的季节性数据。如果为None，使用默认lags规则设置滞后阶数。设置后，必须大于等于2。

lb_stat：Ljung-Box测试统计。
pvalue：它主要返回一个基于卡方分布的p值。
原假设：是随机的序列，既是白噪声序列。计算p值，p值大，接受原假设；p值小，拒绝原假设。分割线：0.05。
0.05置信区间以下，可以认为出现显著的自回归关系，且序列为非白噪声。

4.2.3. 单位根检验

ADF检验全称是 Augmented Dickey-Fuller test，是 Dickey-Fuller检验的增广形式。DF检验只能应用于一阶情况，当序列存在高阶的滞后相关时，可以使用ADF检验，所以说ADF是对DF检验的扩展。

statsmodels.tsa.stattools.adfuller(x, maxlag=None, regression=‘c’, autolag=‘AIC’, store=False, regresults=False)

输入：

x：1维时间序列
maxlag：最大延迟阶数
regression：回归中包含的常数和趋势阶数。
- ‘c’：默认，仅有常数均值
- ‘ct’ ：有常数均值，有趋势
- ‘ctt’ ：有常数均值有线性和二次趋势
- ‘nc’：无常数均值，无趋势。

返回值说明：

行号	返回	类型	说明
1	adf	float	测试统计值，用于和下边 1%，5%，和10%临界值比较。
2	pvalue	float	p值，即数据不平稳的概率
3	usedlag	int	使用的滞后数
4	nobs	int	本次检测用到的观测值个数
5~7	Critical values	dict	1%（无截距无趋势项形式）、5%（有截距无趋势项形式）、10%（有截距有趋势项形式）标准下的临界值
8	icbest	float	如果自动滞后不是“无”，则为最大化信息标准

4.2.3.1. 单位根如何确定数据是否平稳？

有两种看法：

1%、%5、%10不同程度拒绝原假设的统计值【第五~第七行】和 adf【第一行】的比较，adf同时小于1%、5%、10%即说明非常好地拒绝该假设。
P-value是否非常接近0，接近0，则是平稳的，否则，不平稳。

4.2.4. 选定模型参数

statsmodels.tsa.stattools.arma_order_select_ic(y, max_ar=4, max_ma=2, ic=‘bic’, trend=‘c’, model_kw=None, fit_kw=None)

该方法可用于初步识别ARMA的阶数过程，前提是时间序列是平稳的和可逆的。这个函数计算每个模型的完全精确MLE估计，因此有点慢。

输入：

y：待输入的时间序列，是pandas.Series类型
max_ar、max_ma：是p、q值的最大备选值

order.bic_min_order返回以BIC准则确定的阶数，是一个tuple类型。

4.2.5. ARIMA模型函数

Autoregressive Integrated Moving Average (ARIMA) model。
该模型是ARIMA型模型的基本接口，包括具有外生回归因子的模型和具有季节成分的模型。模型的最一般形式是SARIMAX(p,d,q)x(p,d,q,s)。它还允许所有特殊情况，包括

自回归模型：AR§
移动平均模型：MA(q)
混合自回归滑动平均模型：ARMA(p,q)
集成模型：ARIMA(p,d,q)
季节模型：SARIMA(P,D,Q,s)
具有遵循上述ARIMA-type模型之一的误差的回归

4.2.5.1. 常用方法

方法名称	说明
clone(endog[, exog])	使用新数据和可选的新规范克隆状态空间模型
filter(params[, transformed, …])	卡尔曼滤波
fit([start_params, transformed, …])	拟合（估计）模型参数
fit_constrained(constraints[, start_params])	使用受等式约束的某些参数拟合模型
initialize()	初始化SARIMAX模型
predict(params[, exog])	模型拟合后，预测返回拟合值。

4.2.5.2. 常用属性/参数

resid. 残差
param_names：可读的参数名称列表（用于模型中实际包含的参数）

4.3. Python实践过程

时序数据的数据源为实际工作中部分按月统计的销售数据。开发实践环境是基于python3.8环境，导入statsmodels及相关包。

import matplotlib.pyplot as plt
import matplotlib.ticker as mticker
import numpy as np
import pandas as pd
import statsmodels.api as sm
from scipy import stats
from statsmodels.tsa.arima.model import ARIMA
from statsmodels.graphics.api import qqplot

4.3.1. 时序数据平稳性检验

dta = pd.read_csv('citymonthvolumn202209.csv')
df = dta[['ym','volumn']].loc[略去筛选条件].sort_values(by=['ym'], ascending=True).copy()
df = df.reset_index(drop=True)
xticks = df['ym'].to_list()
del df['ym']
df = df.rename(columns={'volumn':'x'})

ax = df.plot(figsize=(12, 8))

#以每5显示
ticks = []
lables = []
for i in range(len(xticks)):
    v = i%5
    if v == 0:
        ticks.append(i)
        lables.append(xticks[i])

ax.xaxis.set_major_locator(mticker.FixedLocator(lables))  # 定位到图的x轴
ax.set_xticks(ticks)
ax.set_xticklabels(lables)

plt.rcParams['font.sans-serif']=['SimHei'] #显示中文标签
plt.rcParams['axes.unicode_minus']=False  
plt.rcParams.update({"font.size":10.5})
fig = plt.figure(figsize=(12, 8))
ax1 = fig.add_subplot(211)
fig = sm.graphics.tsa.plot_acf(df.values.squeeze(), lags=24, title='自相关', ax=ax1)
ax2 = fig.add_subplot(212)
fig = sm.graphics.tsa.plot_pacf(df, lags=5, title='偏自相关', ax=ax2)

按月统计油销量图。

自相关与偏自相关图。

4.3.2. 差分及相关检验

# 一阶差分
diff=df.diff(1)
diff.dropna(inplace=True)
diff.plot(figsize=(12,8),marker='o',color='black') #画图

一阶差分图

一阶差分自相关与偏自相关图。

4.3.3. 白噪声检验

4.3.3.1. 单位根ADF检验

sm.tsa.adfuller(df,regression='c')

数据标签	原值	一阶值	说明
adf	(-2.954,	(-6.077	原值和下边 10%临界值比较小，一阶都满足
pvalue	0.039,	1.117e-07	p值小于0.05，即数据是平稳的概率
usedlag	0,	0,	使用的滞后数
nobs	27	26	本次检测用到的观测值个数
Critical values	{‘1%’: -3.670,	{‘1%’:-3.711,
Critical values	‘5%’: -2.976,	‘5%’:-2.981,
Critical values	‘10%’: -2.628},	‘10%’:-2.630},
icbest	763.205)	724.925)	如果自动滞后不是“无”，则为最大化信息标准

注：一阶差分满足单位根检验，adf值-6.077小于1%、5%、10%的值,落在置信区间，而原值只有满足10%，也就是说置信区间在90%。

4.3.3.2. Ljung-Box检验

# 使用LB检验来检验序列是否为白噪声，原假设为在延迟期数内序列之间相互独立。
from statsmodels.stats.diagnostic import acorr_ljungbox

lags = [1,2,4,8,12]
p_value = acorr_ljungbox(df, lags=lags) #lags可自定义,返回统计量和p值  lags为检验的延迟数
p_value

	lb_stat	lb_pvalue
1	4.637966	0.031272
2	4.839239	0.088955
4	7.909142	0.094964
8	14.755725	0.064073
12	22.947166	0.028178

对于每一个P值都小于0.05或等于0，说明该数据不是白噪声数据，数据有价值，可以继续分析。因此，只有延迟1和12有分析意义。

4.3.4. 模型定阶

在模型定阶过程中，如果时间序列的ACF和PACF不是很明确，我们可以用其他模型来定阶。其中就包括AIC和BIC信息准备判别。

这里的定阶结果都是理论给出的结果，实际中的定阶还是要根据模型表现不断调整，一般阶数越高越复杂，拟合效果越强，但过拟合概率也越高，所以要不断尝试不断调整。

import statsmodels.tsa.stattools as st
order_analyze = st.arma_order_select_ic(df, max_ar=5, max_ma=5, ic=['aic', 'bic'])
order_analyze.bic_min_order

输出结果是(1,0)，可以选定AR(1)模型。

我们常用的是AIC准则，AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合(Overfitting)的情况。所以优先考虑的模型应是AIC值最小的那一个模型。

为了控制计算量，我们限制AR最大阶不超过5，MA最大阶不超过5。但是这样带来的坏处是可能为局部最优。

4.3.5. 模型训练及拟合分析

# 模型训练
arma_mod111 = ARIMA(df, order=(1, 0, 0)).fit()
print(arma_mod111.params)

const     2.301073e+09
ar.L1     4.252070e-01
sigma2    1.327135e+17

# 拟合情况
predictions_ARIMA = arma_mod111.fittedvalues
df['y'] = predictions_ARIMA
ax = df.plot(figsize=(12, 8))

#以每5显示
ticks = []
lables = []
for i in range(len(xticks)):
    v = i%5
    if v == 0:
        ticks.append(i)
        lables.append(xticks[i])

ax.xaxis.set_major_locator(mticker.FixedLocator(lables))  # 定位到图的x轴
ax.set_xticks(ticks)
ax.set_xticklabels(lables)

4.3.6. 残差分析

## 查看模型的拟合残差分布
fig = plt.figure(figsize=(12,5))
ax = fig.add_subplot(1,2,1)
plt.plot(arma_mod111.resid)
plt.title("ARMA(1,0)残差曲线")
## 检查残差是否符合正太分布
ax = fig.add_subplot(1,2,2)
sm.qqplot(arma_mod111.resid, line='q', ax=ax)
plt.title("ARMA(1,0)残差Q-Q图")
plt.tight_layout()
plt.show()

4.3.7. 模型报告与预测

print(arma_mod111.summary()) #给出一份模型报告
print(arma_mod111.forecast(12)) #作为期12个月的预测，返回预测结果、标准误差、置信区间。

预测结果：

5. 总结

5.1. 适用场景

ARMA可谓是时间序列最为经典常用的预测方法，广泛应有于涉及时间序列的各个领域。特别是时间序列预测的应用在经济领域，例如文中参考的资料，北京大学数学科学学院金融数学系金融数学应用硕士《金融时间序列分析》，在经济量化分析中被广泛使用。

ARMA在市场研究中常用于长期追踪资料的研究，如：Panel研究中，用于消费行为模式变迁研究；在零售研究中，用于具有季节变动特征的销售量、市场规模的预测等[百度]。

5.2. 应用效果

从结果来看，当数据波动不大时，用ARIMA模型比LSTM要更好。而当数据变化比较大时，ARIMA的预测效果就不如LSTM了。

个人理解ARIMA原理时滑动平均和自回归，所以预测的结果都和历史的平均值比较接近，当真实值波动不是很剧烈是，用ARIMA预测可能更适用。

而神经网络LSTM由于对于过往数据都会存到‘记忆神经’，也就是遗忘门，输入门，输出门中。也就不是只简单看一个平均，所以预测可能会激进偏颇一点，但是对于原始数据波动比较大时，可能效果更好。

简单的结论就是：原始数据波动不大（例如稳定股票每天价格，汇率等），建议用ARIMA模型。原始数据波动较大（例如每天成交额，购买额），建议用神经网络预测效果更好。[21]

5.3. 结论

本文通过一段时间的销售数据集来实战演示ARIMA模型的理论、建模及调参选择过程，其中包括时序数据的随机性、稳定性检验，综合ARMA模型表现的不理想，考虑到销售的季节性，后续将实践季节ARMA模型。本文旨在通过实践的操作过程，完成ARIMA模型的分享，相信大家也会通过此文而有所收获，欢迎讨论反馈。

参考：

[1]. 阿丢是丢心心. 【Python数据分析】时间序列分析——AR/MA/ARMA/ARIMA. CSDN博客. 2022.02
[2]. Autoregressive Moving Average (ARMA): Sunspots data
[3]. 数据分析-中志. 一文搞懂时间序列预测模型（2）：ARIMA模型的理论与实践. CSDN博客. 2022.03
[4]. geek精神. Python时间序列数据分析–以示例说明. 博客园. 2017.05
[5]. 李东风. 金融时间序列分析讲义. 北京大学数学科学学院. 2022
[6]. 酒酿小圆子～. 利用ARIMA模型进行时间序列分析（Python_Statsmodels包）. CSDN博客. 2020.06
[7]. 灯下鼠. 理解 AR 和 MA 模型. 简书. 2022.05
[8]. TUJC. Arima相关概念. CSDN博客. 2019.03
[9]. 大象咖啡. 时间序列学习（5）：ARMA模型定阶（AIC、BIC准则、Ljung-Box检验）. CSDN博客. 2021.09
[10]. Avasla. 模型评估方法【附python代码】（信息准则：赤池信息量准则AIC、贝叶斯信息准则BIC）. CSDN博客. 2022.05
[11]. 心诣. Python ARMA模型. 知乎. 2022.09
[12]. 爱雅. ARMA模型时间序列分析全流程（附python代码）. 知乎. 2022.07
[13]. CCC考研. 《利用Python进行数据分析》13.3statsmodels介绍. 简书. 2018.12
[14]. 天海一直在. 机器学习——时间序列ARIMA模型(四)：自相关函数ACF和偏自相关函数PACF用于判断ARIMA模型中p、q参数取值.CSDN博客. 2022.05
[15]. 李东风. 应用时间序列分析备课笔记. 北京大学数学科学学院…2021.11
[16]. 米米吉吉. 时间序列之单位根检验（1）. CSDN博客. 2020.11
[17]. pingzishinee. 白噪声检验. CSDN博客. 2020.09
[18]. KaneBurger. python数据分析之时间序列分析详情. 脚本之家. 2022.08
[19]. 时光之笛. ARIMA模型的定阶原理与建模分析. 知乎. 2022.08.
[20]. lbship. 数据分析之利用ARMA算法对销售进行预测. CSDN博客. 2019.03
[21]. herain. ARIMA时间序列与LSTM神经网络的对比. 知乎. 2022.01

解锁Archive of Our Own的无限可能 sgsdhd sqlite oracle json sql database redis
项目介绍AO3API是一个非官方的Python库，旨在通过编程方式访问ArchiveofOurOwn（AO3）网站的数据。AO3是一个广受欢迎的同人作品存档网站，拥有大量的同人小说、评论和用户数据。通过AO3API，开发者可以轻松地获取、处理和分析这些数据，从而为同人社区带来更多创新的应用和服务。项目技术分析AO3API的核心功能被划分为九个模块：works、chapters、users、seri
2025年智慧化工园区整体解决方案-下载：安全生产管控，全生命周期数字管理架构百家方案解决方案安全架构智慧化工园区
随着化工产业的快速发展，化工园区作为产业集聚的重要载体，面临着安全生产、环境保护、高效运营等诸多挑战。传统管理模式已难以满足现代化发展需求，智慧化工园区的建设成为必然趋势。本文将介绍智慧化工园区的整体解决方案，重点聚焦于安全生产管控和全生命周期数字管理架构。智慧化工园区标准规范及顶层设计指南、整体解决方案及售前PPT、大厂解决方案宣讲视频案例等全套资料。11名专业售前方案工程师，工作中精心总结准备
连锁收银系统的核心架构与技术选型连锁收银系统收银系统连锁收银系统架构连锁收银系统
在连锁门店的日常运营里，连锁收银系统扮演着极为重要的角色，它不仅承担着交易结算的基础任务，还关联着库存管理、会员服务、数据分析等多个关键环节。一套设计精良的核心架构与合理的技术选型，是保障收银系统高效、稳定运行的基础。一、核心架构分层架构设计：通常采用经典的三层架构，即表现层、业务逻辑层和数据访问层。表现层负责与用户交互，比如收银员操作界面、顾客支付界面等，需要设计得简洁直观，操作便捷，以提高收银
Python阶段小结：从零基础到项目实战的蜕变之旅 GHXX. python 学习笔记
️知识肌肉训练清单训练部位核心动作（知识点）动作标准（关键要点）基础代谢变量/数据类型、运算符、f-stringtype()类型检测，f"{value:.2f}"精度控制条件反射if-elif-else结构、逻辑运算符三目运算xifconditionelsey简化分支循环耐力while/for循环、range序列生成、break/continue嵌套循环实现矩阵遍历，enumerate获取索引功能
Python 中如何 import 绝对路径的模块斐硕人僧旅 python 开发语言后端
问题：jupter-lab使用时用到其他文件夹下的一个自定义模块，试图使用绝对路径导入解决方式：importsyssys.path.append('模块所在路径')import路径下需要的模块使用场景：importsyssys.path.append('/Users/feishuoren/Projects/pytorch_learning/')#自定义模块fromtorchLearningimpo
华为 MindStudio 安装指南丰年稻香人工智能 python 人工智能
1.MindStudio介绍华为MindStudio是一款集成开发环境（IDE），用于AscendAI处理器的开发调试。它支持模型训练、推理、算子开发、性能优化等AI任务，并依赖CANN（ComputeArchitectureforNeuralNetworks）作为计算架构基础。本指南介绍如何在KunLunG2280服务器上安装MindStudio，包括环境准备、依赖安装、CANN安装及MindS
深入浅出链表：Python实现与应用全面解析吴师兄大模型链表 python 数据结构算法编程开发语言单链表
系列文章目录01-从零开始掌握Python数据结构：提升代码效率的必备技能！02-算法复杂度全解析：时间与空间复杂度优化秘籍03-线性数据结构解密：数组的定义、操作与实际应用04-深入浅出链表：Python实现与应用全面解析文章目录系列文章目录前言一、链表的定义与特点1.1链表的基本结构1.1.1链表节点结构图示1.2链表的特点1.2.1优点1.2.2缺点二、单链表、双链表、循环链表的区别2.1单
机器学习·逻辑回归 AAA顶置摸鱼 python 深度学习机器学习逻辑回归人工智能
前言逻辑回归虽然名称中有“回归”，但实际上用于分类问题。基于线性回归的模型，通过使用逻辑函数（如Sigmoid函数）将线性组合的结果映射到0到1之间的概率值，用于表示属于某个类别的可能性。一、逻辑回归vs线性回归特性逻辑回归线性回归任务类型分类（二分类为主）回归（预测连续值）输出范围(0,1)（概率值）(-∞,+∞)核心函数Sigmoid函数线性函数损失函数对数损失函数（交叉熵）均方误差（MSE）
Meta AI 最近推出了一款全新的机器学习框架ParetoQ，专门用于大型语言模型的4-bit 以下量化新加坡内哥谈技术人工智能语言模型自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/MetaAI最近推出了一款全新的机器学习框架——ParetoQ，专门用于大型语言模型的4
Python：import语句的详细解析（绝对路径导入和相对路径导入）日晨难再 Python python 开发语言
相关阅读Pythonhttps://blog.csdn.net/weixin_45791458/category_12403403.html?spm=1001.2014.3001.5482import语句是Python中一个很重要的机制，允许在一个文件中访问另一个文件的函数、类、变量等，本文就将进行详细介绍。在具体谈论import语句前，首先介绍相关的前置知识——导入的搜索目录。导入的搜索目录既然
http 与 https 的区别? 祈澈菇凉前端面试题合集 http https 网络协议
HTTP（超文本传输协议）和HTTPS（安全超文本传输协议）是互联网通信的基础协议。随着网络技术的发展和安全需求的提升，HTTPS变得越来越重要。本文将深入探讨HTTP与HTTPS之间的区别，包括其工作原理、安全性、性能、应用场景及未来发展等。1.HTTP与HTTPS的基本概念1.1HTTP概述HTTP（HyperTextTransferProtocol）是用于在客户端（如浏览器）和服务器之间传输
速度超越DeepSeek！Le Chat 1100tok/s闪电回答，ChatGPT 4o和DeepSeek R1被秒杀？ LinkTime_Cloud chatgpt DeepSeek Le Chat
2023年，当全球科技界还在ChatGPT引发的AI狂潮中沉浮时，一场来自欧洲的"静默革命"正悄然改变游戏规则。法国人工智能公司MistralAI推出的聊天机器人LeChat以"比ChatGPT快10倍"的惊人宣言震动业界，其背后承载的不仅是技术突破，更折射出全球AI版图重构的深层暗涌。一、法兰西奇迹：Mistral的逆袭密码在巴黎第十区一栋不起眼的办公楼里，Mistral团队用9个月时间创造了令
Python Cookbook-1.13 访问子字符串我不会编程555 #Python学习 python 开发语言
任务获取字符串的某个部分。解决方案切片是个好方法，但是它一次只能取得一个字段；如果还考虑字段的长度，struct.unpack可能更适合。importstructdeffields(baseformat,theline,lastfield=False):#theline超出的长度也由这个base-format确定#（通过struct.calcsize计算确切的长度）numremain=len(th
python票务系统_python基础学习：模拟火车订票系统一愫 python票务系统
2020-12-20str1=["车次","出发站-到达站","出发时间","到达时间","历时"]train_numbers=["T40","T298","Z158"]train_place=["长春-北京","哈尔滨-北京","青岛-北京"]train_outTime=["00:12","00:06","12:48"]train_arriveTime=["12:20","10:50","21:
Andrej Karpathy：计算范式的变革者 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
《AndrejKarpathy：计算范式的变革者》概述本文旨在全面探讨AndrejKarpathy在计算范式变革中的角色和贡献。AndrejKarpathy是一位世界级的人工智能专家，程序员，软件架构师，CTO，同时也是计算机图灵奖获得者，计算机编程和人工智能领域大师。他以其深刻的技术见解，对深度学习和自然语言处理领域的贡献，以及对计算范式的革新性思考，成为了当今技术领域的引领者之一。本文分为六个
python中异常处理 suanfa_student python 前端开发语言
异常处理#tryexcept结构#coding:utf-8try:num=int(input("intputscore"))ifnum<100:print("yes")exceptExceptionase:print(e)print("输入不合法")#tryexceptelse结构#coding:utf-8mathScore=input("数学分数")try:mathScore=int(mathS
力扣（leetcode）第455题分发饼干（Python）十八子是李 Python题集 leetcode python 算法开发语言
455.分发饼干题目链接：455.分发饼干假设你是一位很棒的家长，想要给你的孩子们一些小饼干。但是，每个孩子最多只能给一块饼干。对每个孩子i，都有一个胃口值g[i]，这是能让孩子们满足胃口的饼干的最小尺寸；并且每块饼干j，都有一个尺寸s[j]。如果s[j]>=g[i]，我们可以将这个饼干j分配给孩子i，这个孩子会得到满足。你的目标是尽可能满足越多数量的孩子，并输出这个最大数值。示例1:输入:g=[
【python Pandas】读取与存储hdf5文件人才程序员杂谈 python pandas 开发语言 python3.11 目标检测机器学习深度学习
文章目录Pandas读取与存储HDF5文件1.HDF5文件简介通俗的介绍：学术概念：2.读取HDF5文件2.1读取简单的HDF5文件2.2读取多个数据集2.3使用过滤条件读取数据2.4读取HDF5文件的所有数据集3.存储HDF5文件3.1存储简单的`DataFrame`到HDF5文件3.2追加数据到已有的HDF5文件3.3存储多个数据集3.4使用压缩存储数据3.5存储时不存储索引4.总结Panda
基于Python、使用`pandas`库和`Brightway2`库实现根据Excel表格某一列内容与数据库进行匹配 go5463158465 python 算法 python pandas excel
以下是一个基于Python、使用pandas库和Brightway2库实现根据Excel表格某一列内容与数据库进行匹配，然后抓取匹配成功的数据并导出为新Excel表格的示例代码。这里假设你已经成功导入了数据库，并且了解数据库中数据的结构。安装必要的库首先确保你已经安装了pandas和Brightway2库。如果没有安装，可以使用以下命令进行安装：pipinstallpandasbrightway2
【Python】取整函数 Layne... Python学习笔记
int()向下取整：内置函数round()四舍五入取整：内置函数，还可在保留x位小数的前提下四舍五入>>>n=2.7562>>>int(n)2>>>round(n)3>>>round(n,2)2.76floor()向下取整math模块函数ceil()向上取整math模块函数>>>importmath>>>n=2.7>>>math.floor(n)2>>>math.ceil(n)3modf()分别取
Python取整的方法 HackDyno python 开发语言 Python
Python取整的方法在Python编程中，我们经常需要对数字进行取整操作。无论是向下取整、向上取整还是四舍五入，Python都提供了相应的方法和函数来实现这些操作。本文将介绍几种常用的取整方法，并提供相应的源代码示例。向下取整向下取整是指将一个数值向下舍入到最接近的较小整数。在Python中，可以使用math模块的floor函数来实现向下取整操作。下面是一个示例代码：importmathnum=
人工智能之自然语言处理技术演进香橙薄荷心 AI 人工智能自然语言处理
自然语言处理技术演进自然语言处理（NaturalLanguageProcessing，NLP）是人工智能的重要分支，旨在使计算机能够理解、生成和处理人类语言。近年来，NLP技术经历了从规则驱动到数据驱动的革命性演进，尤其是在深度学习和大规模预训练模型的推动下，取得了显著突破。本文将深入探讨NLP技术的演进历程、核心模型及其应用，并通过具体案例和代码示例帮助读者理解其实际应用。1.NLP技术演进历程
爬虫代码中如何设置请求间隔？数据小小爬虫爬虫
在爬虫代码中设置请求间隔是确保爬虫稳定运行并避免对目标服务器造成过大压力的重要措施。合理设置请求间隔可以有效降低被目标网站封禁IP的风险，同时也有助于爬虫程序的稳定运行。以下是几种常见的方法来设置请求间隔：一、使用time.sleep()time.sleep()是Python中用于暂停程序执行的函数，可以在每次请求之间添加适当的延时。这是最简单直接的方法。示例代码：importrequestsim
Aider: 人工智能辅助编程的革命性工具 2401_87189860 人工智能
Aider:人工智能辅助编程的革命性工具在当今快速发展的科技世界中,人工智能正在改变着我们工作和生活的方方面面。在软件开发领域,一款名为Aider的创新工具正在引领一场编程革命。Aider是一个强大的AI辅助编程工具,它能让开发者在终端中与大型语言模型(LLM)进行结对编程,极大地提升编码效率和质量。让我们深入了解这个令人兴奋的项目,看看它如何改变着软件开发的未来。Aider的核心功能Aider的
软件工程-模块化设计夏旭泽软件工程
分解（decomposition）C（P1+P2）>C（P1）+C（P2）E（P1+P2）>E（P1）+E（P2）C为问题的复杂程度，E为解题需要的工作量关于模块的一些概念深度：系统结构中的控制层数宽度：同一层次的模块总数的最大值扇入&扇出：如图所示作用范围：受到该模块内部一个判定影响的所有模块的集合（同样包括控制范围以外的模块）控制范围：包括该模块本身及所有下属模块的集合（优化原则：作用范围应该
高效利用Python爬虫开发批量获取商品信息数据小小爬虫 python 爬虫开发语言
在当今电商行业竞争激烈的环境下，精准且高效地获取商品信息对于商家和数据分析师来说至关重要。无论是进行市场调研、优化商品布局，还是制定竞争策略，商品信息的全面掌握都是关键。Python爬虫技术以其强大的功能和灵活性，成为批量获取商品信息的理想选择。本文将详细介绍如何高效利用Python爬虫开发批量获取商品信息，助力电商从业者在市场中脱颖而出。一、Python爬虫技术的优势Python作为一种广泛使用
面向生成式语言模型场景到底是选择4卡5080还是选择两卡5090D weixin_40941102 语言模型人工智能自然语言处理
四卡RTX5080VS两卡RTX5090D：AI大模型性能比拼实践与思考本文主要从算力、显存、多卡扩展效率以及性价比等多个角度，分析在部署和训练大规模AI模型时，采用四卡RTX5080方案与两卡RTX5090D方案的优劣对比。对于从事AI开发的同学来说，如何在有限预算内选择最合适的硬件平台至关重要。下面将详细解读各项指标及实际应用场景下的影响，并给出总结建议。1.算力对比——单卡TOPS与总算力在
Python面试宝典：Python中与Django相关的面试笔试题（1000加面试笔试题助你轻松捕获大厂Offer）脑洞笔记 python全栈面试宝典 python 面试 django
Python面试宝典：1000加python面试题助你轻松捕获大厂Offer【第二部分：Python高级特性：第十六章：Web开发：第二节：Django】第十六章：Web开发第二节：DjangoMTV架构（模型-模板-视图）特性快速开始数据库和模型URL路由和视图模板Django面试题面试题1面试题2面试题3面试题4面试题5面试题6面试题7面试题8面试题9面试题10更多面试题请查阅：Python面
【Python】简单的Python滑块验证码处理 FelixStudio python小日常 python opencv 自动化
Python系列文章目录Python系列前言一、技术要点二、使用步骤1.引入库2.构建方法前言该代码可解决登录验证的普通滑块验证码验证过程，分享仅为技术探讨。一、技术要点cv2.matchTemplate是OpenCV库中的一个函数，用于在一幅图像中查找与模板图像匹配的部分。二、使用步骤1.引入库代码如下：importbase64fromPILimportImagefromioimportByte
183、Django实战：掌握表单处理与数据安全多多的编程笔记 django 数据库 sqlite
Python开发框架Django之表单（Form）：处理用户输入与验证大家好，今天我将向大家介绍Python开发框架Django中的一个重要组成部分——表单（Form）。通过这篇文章，你将了解到Django表单的基本概念、使用方法以及如何处理用户输入和验证。1.什么是Django表单？在Web开发中，表单是用户与网站进行交互的重要方式。用户可以通过表单输入数据，提交给服务器进行处理。Django表
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。