Python for Finance

【Python计量】自相关性（序列相关性）的检验

文章目录

一、图示法
- （一）滞后图
- （二）自相关图
- （三）自相关图和偏自相关图
二、DW检验法
三、Breusch-Godfrey检验
- （一）手动编制函数进行BG检验
- （二）调用statsmodels的函数进行BG检验
四、Ljung-Box检验

多元线性回归模型的基本假设之一就是模型的随机干扰项相互独立或不相关。如果模型的随机干扰项违背了相互独立的基本假设，则称为存在序列相关性（自相关性）。

我们以伍德里奇《计量经济学导论：现代方法》的”第12章时间序列回归中序列相关和异方差性“的案例12.4为例，使用BARIUM中的数据来进行序列相关性的检验。

import wooldridge as woo
import pandas as pd
import numpy as np
import statsmodels.api as sm
import statsmodels.formula.api as smf

barium = woo.dataWoo('barium')
T = len(barium)
barium.index = pd.date_range(start='1978-02', periods=T, freq='M')

reg = smf.ols(formula='np.log(chnimp) ~ np.log(chempi) + np.log(gas) +'
                      'np.log(rtwex) + befile6 + affile6 + afdec6',
              data=barium)
results = reg.fit()
resid = results.resid#获取残差

一、图示法

由于残差 $e_t$ 可以作为扰动项 $u_t$ 的估计，因此，如果存在序列相关性，必然会由残差项 $e_t$ 反映出来，因此可利用 $e_t$ 的变化图形来判断随机干扰项的序列相关性。

（一）滞后图

滞后图，就是将残差 $e_t$ 和残差滞后n阶的散点图，需要用到pandas的lag_plot函数。

from pandas.plotting import lag_plot

lag_plot函数用法：

lag_plot(series, lag=1, ax=None, **kwds)
主要参数：
series :时间序列数据
lag : 滞后阶数，默认为1
ax : Matplotlib的子图对象，可选

我们绘制残差 $e_t$ 和残差滞后1阶 $e_{t-1}$ 的自相关图，代码如下：

lag_plot(resid, lag=1)
plt.show()

如果我们要绘制残差 $e_t$ 与其滞后1-4阶的图，代码如下：

fig, axes = plt.subplots(1, 4, figsize=(10,3), sharex=True, sharey=True, dpi=100)#1行4列的画布
for i in range(4):
    lag_plot(resid,lag=i+1, ax=axes[i])
    axes[i].set_title(f'Lag{i+1}')

结果如下：

（二）自相关图

自相关图的绘制，可以使用pandas库的autocorrelation_plot函数

from pandas.plotting import autocorrelation_plot

生成图片的横轴是滞后阶数，纵轴是自相关系数。

我们绘制残差项的自相关图，代码如下：

autocorrelation_plot(resid)
plt.show()

（三）自相关图和偏自相关图

自相关系数和偏自相关系数的区别

假设时间序列数据 $y_t$
$y_t=\alpha_0+\alpha_1y_{t-3}$ ，这个 $\alpha_1$ 就是, $y_t$ 和 $y_{t-3}$ 的自相关系数。
$y_t=\alpha_0+\alpha_1y_{t-1}+\alpha_2y_{t-2}+\alpha_3y_{t-3}$ ，这个 $\alpha_3$ 就是, $y_t$ 和 $y_{t-3}$ 的偏自相关系数。

自相关图和偏自相关图，建议使用statsmodels包的plot_acf, plot_pacf函数。

from statsmodels.graphics.tsaplots import plot_acf, plot_pacf #自相关图、偏自相关图
import matplotlib.pyplot as plt

plot_acf、plot_pacf函数的参数意义

plot_acf(x, ax=None, lags=None, *, alpha=0.05, use_vlines=True, adjusted=False, fft=False, missing='none', title='Autocorrelation', zero=True, auto_ylims=False, bartlett_confint=True, vlines_kwargs=None, **kwargs)
plot_pacf(x, ax=None, lags=None, alpha=0.05, method=None, use_vlines=True, title='Partial Autocorrelation', zero=True, vlines_kwargs=None, **kwargs)
x：一维的数据序列。
lags：滞后阶数，若未提供，则取np.arange(len(corr))

我们绘制残差项的自相关图，代码如下：

 plot_acf(resid,lags=20) 
 plt.show()

上图反映了resid序列的各阶自相关系数的大小，该图的高度值对应的是各阶自相关系数的值，蓝色区域是95%置信区间，这两条界线是检测自相关系数是否为0时所使用的判别标准：当代表自相关系数的柱条超过这两条界线时，可以认定自相关系数显著不为0。观察上图可知，1、2、3阶的自相关系数都在蓝色范围外，也就是落在了95%置信区间外，所以初步判断该序列可能存在短期的自相关性。

我们还可以绘制出残差项的偏自相关系数图，代码如下：

plot_pacf(resid,lags=20)
plt.show()

我们若希望将自相关系数图和偏自相关系数图合并成一张图，可以定义函数。

import matplotlib.pyplot as plt
def acf_pacf_plot(timeseries,lags):
    fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(15, 4), dpi=100)
    plot_acf(timeseries, lags=lags,ax=axes[0])
    axes[0].set_title('acf') #设置自相关图标题，也可不设置，采用默认值Autocorrelation
    plot_pacf(timeseries,lags=lags,ax=axes[1])
    axes[1].set_title('pacf') #设置偏自相关图标题，也可不设置，采用默认值Partial Autocorrelation
    plt.show()

若我们需要对残差项做20阶的自相关图、偏自相关图，则调用上述函数即可，参数timeseries设置为resid，参数lags设置为20。

acf_pacf_plot(resid,20)

结果如下：

二、DW检验法

DW检验是较早提出的自相关检验，现已不常用。它的主要缺点是只能检验一阶自相关，且必须在解释变量满足严格外生性的情况下才成立。

from statsmodels.stats.stattools import durbin_watson
print(f'D-W检验值为{durbin_watson(results.resid)}')
#返回结果：
D-W检验值为1.4584144308481417

三、Breusch-Godfrey检验

BG检验克服了DW检验的缺陷，适合于高阶序列相关及模型中存在滞后被解释变量的情形。

考虑如下多元线性模型：
$y_t=\beta_0+\beta_1x_{t1}+\beta_2x_{t2}+...+\beta_kx_{tk}+u$
若怀疑随机干扰项存在p阶序列相关：
$u_t=\rho_1u_{t-1}+\rho_2u_{t-2}+...+\rho_pu_{t-p}+\varepsilon_t$
检验原假设：
$H_0:\rho_1=\rho_2=...=\rho_p=0$
由于 $u_t$ 不可测，故用 $e_t$ 替代，并引入解释变量，进行如下辅助回归：
$e_t=\gamma_1x_{t1}+\gamma_2x_{t2}+...+\gamma_kx_{tk}+\delta_1e_{t-1}+\delta_2e_{t-2}+...+\delta_pe_{t-p}+\varepsilon_t$
无自相关的原假设相当于检验：
$H_0:\gamma_1=\gamma_2=...=\gamma_p=0$
BG检验的步骤：

（1）将 $y_t$ 对 $x_{t1}$ , $x_{t2}$ ,…, $x_{tk}$ 做回归，求出OLS残差 $e_t$

（2）将 $e_t$ 对 $x_{t1}$ , $x_{t2}$ ,…, $x_{tk}$ , $e_{t-1}$ , $e_{t-2}$ ,…, $e_{t-p}$ 做回归

（3）计算 $e_{t-1}$ , $e_{t-2}$ ,…, $e_{t-p}$ 联合显著的F检验

（一）手动编制函数进行BG检验

barium['resid'] = results.resid
barium['resid_lag1'] = barium['resid'].shift(1)
barium['resid_lag2'] = barium['resid'].shift(2)
barium['resid_lag3'] = barium['resid'].shift(3)

reg_manual = smf.ols(formula='resid~ np.log(chempi) + np.log(gas) +'
                             'np.log(rtwex) + befile6 + affile6 + afdec6+'
                             'resid_lag1 + resid_lag2 + resid_lag3', data=barium)
results_manual = reg_manual.fit()

hypotheses = ['resid_lag1 = 0', 'resid_lag2 = 0', 'resid_lag3 = 0']
ftest_manual = results_manual.f_test(hypotheses)
F_statistic = ftest_manual.fvalue
F_pval = ftest_manual.pvalue
print(f'BG检验的F统计量: {F_statistic}')
print(f'BG检验的p值: {F_pval}')

'''
BG检验的F统计量: 5.122907054069363
BG检验的p值: 0.0022898028329663344
'''

我们可以查看辅助回归的回归结果：

print(results_manual.summary())
'''
                            OLS Regression Results                            
==============================================================================
Dep. Variable:                  resid   R-squared:                       0.116
Model:                            OLS   Adj. R-squared:                  0.048
Method:                 Least Squares   F-statistic:                     1.719
Date:                Sat, 14 May 2022   Prob (F-statistic):             0.0920
Time:                        09:28:33   Log-Likelihood:                -104.56
No. Observations:                 128   AIC:                             229.1
Df Residuals:                     118   BIC:                             257.6
Df Model:                           9                                         
Covariance Type:            nonrobust                                         
==================================================================================
                     coef    std err          t      P>|t|      [0.025      0.975]
----------------------------------------------------------------------------------
Intercept        -14.3691     20.656     -0.696      0.488     -55.273      26.535
np.log(chempi)    -0.1432      0.472     -0.303      0.762      -1.078       0.792
np.log(gas)        0.6233      0.886      0.704      0.483      -1.131       2.378
np.log(rtwex)      0.1787      0.391      0.457      0.649      -0.596       0.953
befile6           -0.0859      0.251     -0.342      0.733      -0.583       0.411
affile6           -0.1221      0.255     -0.479      0.632      -0.626       0.382
afdec6            -0.0668      0.274     -0.244      0.808      -0.610       0.476
resid_lag1         0.2215      0.092      2.417      0.017       0.040       0.403
resid_lag2         0.1340      0.092      1.454      0.148      -0.048       0.317
resid_lag3         0.1255      0.091      1.378      0.171      -0.055       0.306
==============================================================================
Omnibus:                        6.375   Durbin-Watson:                   1.947
Prob(Omnibus):                  0.041   Jarque-Bera (JB):                5.978
Skew:                          -0.444   Prob(JB):                       0.0503
Kurtosis:                       3.576   Cond. No.                     9.78e+03
==============================================================================

Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
[2] The condition number is large, 9.78e+03. This might indicate that there are
strong multicollinearity or other numerical problems.
'''

由于辅助回归使用了 $e_{t-p}$ 损失了p个样本观测值，故样本容量仅有 $(n - p)$ 。Davidson and MacKinnon(1993)建议，把残差中因滞后而缺失的项用其期望值0来代替，以保持样本容量为n。

则代码修改为：

barium['resid'] = results.resid
barium['resid_lag1'] = barium['resid'].shift(1).fillna(0) #将残差缺失项用0来代替
barium['resid_lag2'] = barium['resid'].shift(2).fillna(0) #将残差缺失项用0来代替
barium['resid_lag3'] = barium['resid'].shift(3).fillna(0) #将残差缺失项用0来代替

reg_manual = smf.ols(formula='resid~ np.log(chempi) + np.log(gas) +'
                             'np.log(rtwex) + befile6 + affile6 + afdec6+'
                             'resid_lag1 + resid_lag2 + resid_lag3', data=barium)
results_manual = reg_manual.fit()

hypotheses = ['resid_lag1 = 0', 'resid_lag2 = 0', 'resid_lag3 = 0']
ftest_manual = results_manual.f_test(hypotheses)
F_statistic = ftest_manual.fvalue
F_pval = ftest_manual.pvalue
print(f'BG检验的F统计量: {F_statistic}')
print(f'BG检验的p值: {F_pval}')

'''
BG检验的F统计量: 5.124662239772509
BG检验的p值: 0.002263719767131574
'''

我们可以查看辅助回归的回归结果：

print(results_manual.summary())
'''
                            OLS Regression Results                            
==============================================================================
Dep. Variable:                  resid   R-squared:                       0.113
Model:                            OLS   Adj. R-squared:                  0.047
Method:                 Least Squares   F-statistic:                     1.708
Date:                Sat, 14 May 2022   Prob (F-statistic):             0.0942
Time:                        09:26:57   Log-Likelihood:                -106.95
No. Observations:                 131   AIC:                             233.9
Df Residuals:                     121   BIC:                             262.7
Df Model:                           9                                         
Covariance Type:            nonrobust                                         
==================================================================================
                     coef    std err          t      P>|t|      [0.025      0.975]
----------------------------------------------------------------------------------
Intercept        -13.1407     20.351     -0.646      0.520     -53.431      27.149
np.log(chempi)    -0.0435      0.457     -0.095      0.924      -0.948       0.862
np.log(gas)        0.5436      0.876      0.621      0.536      -1.190       2.277
np.log(rtwex)      0.2024      0.386      0.525      0.601      -0.561       0.966
befile6           -0.0815      0.251     -0.325      0.746      -0.578       0.415
affile6           -0.1243      0.254     -0.489      0.626      -0.628       0.379
afdec6            -0.0776      0.274     -0.283      0.777      -0.619       0.464
resid_lag1         0.2186      0.090      2.416      0.017       0.039       0.398
resid_lag2         0.1341      0.092      1.458      0.147      -0.048       0.316
resid_lag3         0.1257      0.091      1.381      0.170      -0.054       0.306
==============================================================================
Omnibus:                        5.672   Durbin-Watson:                   1.955
Prob(Omnibus):                  0.059   Jarque-Bera (JB):                5.196
Skew:                          -0.414   Prob(JB):                       0.0744
Kurtosis:                       3.516   Cond. No.                     9.76e+03
==============================================================================

Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
[2] The condition number is large, 9.76e+03. This might indicate that there are
strong multicollinearity or other numerical problems.
'''

（二）调用statsmodels的函数进行BG检验

从statsmodels库的stats子模块的diagnostic工具中导入acorr_breusch_godfrey

from statsmodels.stats.diagnostic import acorr_breusch_godfrey #BG检验

acorr_breusch_godfrey函数的参数意义及返回结果

acorr_breusch_godfrey(res, nlags=None, store=False)
参数介绍：
res : 回归结果，对该模型的残差进行自相关检验。
nlags : 滞后阶数
store : 默认为False；若为True，则会返回ResultsStore

返回值：
lm : LM统计量值
lm_pvalue : LM统计量的p值，若p值小于显著性水平，则拒绝无自相关性的原假设，即存在自相关性
fvalue : F统计量值       
f_pvalue : F统计量对应的p值，若p值小于显著性水平，则拒绝无自相关性的原假设，即存在自相关性
res_store：ResultsStore，若store为True则返回

Davidson and MacKinnon(1993)建议，把残差中因滞后而缺失的项用其期望值0来代替，以保持样本容量为n。acorr_breusch_godfrey函数采用的是Davidson-MacKinnon方法。

对上述模型做BG检验，代码如下：

bg_result = acorr_breusch_godfrey(results,nlags=3) 
bg_lm_statistic = bg_result[0]
bg_lm_pval = bg_result[1]
bg_F_statistic= bg_result[2] 
bg_F_pval = bg_result[3]
bg_test_output=pd.Series(bg_result[0:4],index=['bg_lm_statistic','bg_lm_pval','bg_F_statistic','bg_F_pval'])   
print(bg_test_output)

'''
bg_lm_statistic    14.768156
bg_lm_pval          0.002026
bg_F_statistic      5.124662
bg_F_pval           0.002264
dtype: float64
'''

同时，我们可以查看BG检验的辅助回归模型结果：

print(bg_result[4].resols.summary())
'''
                            OLS Regression Results                            
==============================================================================
Dep. Variable:                      y   R-squared:                       0.113
Model:                            OLS   Adj. R-squared:                  0.047
Method:                 Least Squares   F-statistic:                     1.708
Date:                Fri, 13 May 2022   Prob (F-statistic):             0.0942
Time:                        20:26:10   Log-Likelihood:                -106.95
No. Observations:                 131   AIC:                             233.9
Df Residuals:                     121   BIC:                             262.7
Df Model:                           9                                         
Covariance Type:            nonrobust                                         
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const         -6.5703     10.175     -0.646      0.520     -26.715      13.575
x1            -0.0435      0.457     -0.095      0.924      -0.948       0.862
x2             0.5436      0.876      0.621      0.536      -1.190       2.277
x3             0.2024      0.386      0.525      0.601      -0.561       0.966
x4            -0.0815      0.251     -0.325      0.746      -0.578       0.415
x5            -0.1243      0.254     -0.489      0.626      -0.628       0.379
x6            -0.0776      0.274     -0.283      0.777      -0.619       0.464
x7            -6.5703     10.175     -0.646      0.520     -26.715      13.575
x8             0.2186      0.090      2.416      0.017       0.039       0.398
x9             0.1341      0.092      1.458      0.147      -0.048       0.316
x10            0.1257      0.091      1.381      0.170      -0.054       0.306
==============================================================================
Omnibus:                        5.672   Durbin-Watson:                   1.955
Prob(Omnibus):                  0.059   Jarque-Bera (JB):                5.196
Skew:                          -0.414   Prob(JB):                       0.0744
Kurtosis:                       3.516   Cond. No.                     7.48e+16
==============================================================================

Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
[2] The smallest eigenvalue is 1.33e-29. This might indicate that there are
strong multicollinearity problems or that the design matrix is singular.
'''

acorr_breusch_godfrey函数做辅助回归的因变量为残差项，自变量为[1,A,1,B]，其中A为解释变量，B为残差滞后项。

在以上回归结果中，y代表残差项，x1-x6代表解释变量，x8-x10代表残差滞后项，(const+x7)代表常数项。

我们可以在acorr_breusch_godfrey函数的基础上，编制一个能返回自相关性检验结果的函数。

def bg_test(results,nlags):
    bg_result = acorr_breusch_godfrey(results,nlags=3) 
    bg_lm_statistic = bg_result[0]
    bg_lm_pval = bg_result[1]
    bg_F_statistic= bg_result[2] 
    bg_F_pval = bg_result[3]
    bg_test_output=pd.Series(bg_result[0:4],index=['bg_lm_statistic','bg_lm_pval','bg_F_statistic','bg_F_pval'])   
    return bg_test_output

#失败，先放着。同时，我们可以编制一个函数，可以

p_value_threshold=0.1
autocorrelation_results = pd.DataFrame(columns=['Autocorrelation test', 'lag', 'p-value', 'outcome']
for i in range(0, 5):
	lag=i+1
    bg_F_pval = acorr_breusch_godfrey(results, nlags=lag)[3]
    autocorrelation_results.iloc[i] = ['Breusch-Godfrey', lag, bg_F_pval, 'Pass' if bg_F_pval> p_value_threshold else 'Fail']

四、Ljung-Box检验

LB检验：

H0假设：序列的每个值是独立的，即纯随机
HA假设：序列之间不是独立的，即存在相关性

从statsmodels库的stats子模块的diagnostic工具中导入acorr_ljungbox

from statsmodels.stats.diagnostic import acorr_ljungbox #LB检验

acorr_ljungbox函数的参数意义及返回结果

acorr_ljungbox(x, lags=None, boxpierce=False, model_df=0, period=None, return_df=True, auto_lag=False)
y : 一维的数据序列
lags:滞后阶数，若lags为整数，则会对[1,lags]区间的所有滞后阶数做LB检验；若lags为列表，则只展示列表内的滞后阶数的LB检验结果。
boxpierce：默认False,为True时表示除返回LB统计量还会返回Box和Pierce的Q统计量

返回结果为：
lbvalue: Ljung-Box检验统计量
pvalue: Ljung-Box检验统计量对应的p值，若p值小于显著性水平，则拒绝纯随机序列的原假设，即序列不是纯随机序列
bpvalue:Box-Pierce检验统计量
bppvalue: Box-Pierce检验统计量对应的p值，若p值小于显著性水平，则拒绝纯随机序列的原假设

对上述模型做LB检验，代码如下：

print(acorr_ljungbox(results.resid, lags=[10])) #对10阶做LB检验
'''
      lb_stat  lb_pvalue
10  24.445298   0.006502
'''
print(acorr_ljungbox(results.resid, lags=10)) #对1-10阶均做LB检验
'''
      lb_stat  lb_pvalue
1    9.821711   0.001725
2   16.072867   0.000323
3   21.332651   0.000090
4   21.532752   0.000248
5   21.571232   0.000632
6   21.619047   0.001419
7   22.365714   0.002197
8   22.973536   0.003398
9   24.381012   0.003738
10  24.445298   0.006502
'''

LB检验的p值小于0.01, 则拒绝纯随机序列的原假设，即序列不是纯随机序列。

参考文献：

Python时间序列分析https://www.machinelearningplus.com/time-series/time-series-analysis-python/

Python与时间序列https://blog.csdn.net/yuanzhoulvpi/article/details/120384708

过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶 Ryan_sz1
1、过拟合、欠拟合及其解决方案过拟合、欠拟合机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题，但是，一开始我们的模型往往是欠拟合的，也正是因为如此才有了优化的空间，我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了。也就是说欠拟合是模型表达能力不够，达不到很好的表达效果。而过拟合是在训练集的范围内表达能力过强，导致完全拟合了训练集。解决
python爬大学生就业信息报告_Python语言爬虫——Python 岗位分析报告 weixin_39578457
本文主要向大家介绍了Python语言爬虫——Python岗位分析报告，通过具体的内容向大家展示，希望对大家学习Python语言有所帮助。前两篇我们分别爬取了糗事百科和妹子图网站，学习了Requests,BeautifulSoup的基本使用。不过前两篇都是从静态HTML页面中来筛选出我们需要的信息。这一篇我们来学习下如何来获取Ajax请求返回的结果。本篇以拉勾网为例来说明一下如何获取Ajax请求内容
快速入门Robocorp：用Python构建和操作工作流 jaioyfpo python 开发语言
快速入门Robocorp：用Python构建和操作工作流引言在现代开发环境中，自动化是提高效率和降低成本的关键。Robocorp作为一个强大的平台，它帮助您使用Python构建和操作工作流，无论在何地运行都可以保持无缝连接和高扩展性。本文将带领您快速入门Robocorp的基本安装和设置，并展示如何使用ActionServer进行项目的创建和管理。主要内容1.安装和设置要开始使用Robocorp，首
Python关于pandas的基础知识 WeiJingYu. python pandas 开发语言
一.扫盲（一）、pandas是什么pandas是Python的一个第三方数据处理库，它提供了高效、灵活的数据结构（如Series和DataFrame），能方便地对结构化数据进行清洗、转换、分析和处理。（二）、pandas与NumPy的关系NumPy是Python中用于科学计算的基础库，主要用于存储和处理数值型数组。但它有一个局限，就是不能直接存储和处理字符串等非数值类型的数据。而pandas是在N
Python 爬虫——Pyppeteer
Python爬虫——PyppeteerPythonSpider——Pyppeteer一、爬虫的两种方式二、Pyppeteer三、爬虫实现PythonSpider——Pyppeteer爬虫具有时效性，该文产生于2023年末一、爬虫的两种方式爬虫大致可以分为两类方式：直接请求直接请求的方式一般是使用python的HTTP请求库发起HTTP请求，然后接收返回的数据再进行解析，这种方式存在很大的局限性。当
Python关于numpy的基础知识数组的升维 WeiJingYu. python numpy 开发语言
在Python数据处理中，numpy是常用的科学计算库，数组操作是其核心内容之一。下面通过代码示例，展示如何从Python自带列表构建numpy一维数组，再进一步升维构建二维数组。\importnumpyasnp#一维数组构建：从Python列表到numpy一维数组list1=[1,2,3,4,5]#Python自带的列表数据类型print("Python列表list1:",list1)v=np.
Selenium Python 代码之打开网页自动填充内容并搜索 iCloudEnd
SeleniumPython代码之打开网页自动填充内容并搜索流程通过id找到文本框inputElement.send_keys(Keys.BACK_SPACE)发送删除键，清除一下之前文字inputElement.send_keys(Keys.BACK_SPACE)发送需要查询对内容并送个回车inputElement=driver1.find_element_by_id("TextBox1")in
python双引号打不出来_在python 3中使用单引号和双引号时出错 - python weixin_39897749 python双引号打不出来
使用os.system（）函数时，我在python中遇到了EOL错误。以下是代码行生成错误：os.system("catsubdomains.txt|cut-d'"'-f1")基本上，我试图使用分号[“]修改输出字符串（双引号）参考方案如果需要在带"的字符串中编写"，则可以将其写为\""catsubdomains.txt|cut-d'\"'-f1"在PythonCloudFunction中使用错误
python办自动化--读取邮箱中特定的邮件，并下载特定的附件宝山哥哥 python办公自动化 python 自动化信息可视化
系列文章目录python办公自动化–数据可视化（pandas+matplotlib）–生成条形图和饼状图python办公自动化–数据可视化（pandas+matplotlib）–生成折线图python办公自动化–数据可视化（pandas读取excel文件，matplotlib生成可视化图表）python办公自动化-openpyxl学习-工资表生成工资条python办公自动化–使用将csv大文件分割
Here-Document的`＜＜` 与 `＜＜-` 与 `＜＜＜` 多解说笔记250722 kfepiza #Linux #控制台命令行 Shell bash cmd 等笔记 linux bash
Here-Document的poem.txt静夜思床前明月光疑是地上霜FORMATTED#2.空格敏感的配置catconfig.ymlindentation:level:4#必须4空格SPACE何时用tabs.txt重要制表符:→这里Tab会被保留但行首Tab会被移除TABS#2.空格缩进的环境#（如Python脚本）技术原理图解HereDocumentquery.sqlSELECT*FROM${
数字人系统：AI界的超级巨星，你准备好了吗？优秘智能UMI 数字人人工智能深度学习计算机视觉机器学习自然语言处理语言模型图像处理
在这个日新月异的科技时代，每一个创新的火花都可能点燃一场变革的燎原之火。今天，我们要聊的，正是那颗在AI领域熠熠生辉的璀璨新星——优秘数字人系统。它不仅仅是技术的飞跃，更是对未来生活方式的深刻重塑，一场关于人机交互、智能共生的美好预演。技术原理：深度解析与智能构建的奥秘1.深度学习：智能的基石数字人系统的核心技术之一在于深度学习。深度学习是一种模仿人脑神经网络结构和功能的机器学习技术，通过构建多层
第二阶段-第二章—8天Python从入门到精通【itheima】-133节（SQL——DQL——基础查询） Patrick_kafka sql python 数据库开发语言学习 android 程序人生
目录133节——DQL：基础查询1.学习目标2.基础数据查询：select3.进行过滤的基础数据查询：where4.代码演练5.小节总结6.关于MySQL和SQL的DDL、DML、DCL、DQL的最底层逻辑MySQL与SQL的底层逻辑：从磁盘到内存的数据流解析一、DDL（数据定义语言）：构建数据大厦的蓝图二、DML（数据操作语言）：数据流动的三重关卡三、DCL（数据控制语言）：权限的多维管控四、D
Python爬虫教程：抓取地方政府网站的公开文件与政策信息 Python爬虫项目 python 爬虫开发语言数据分析 mysql
1.引言在信息化时代，政府网站已成为信息公开的重要渠道。各级地方政府网站上发布的政策、公告和公开文件，通常包含了政府决策、法律法规等关键信息。爬取这些公开数据，可以为研究人员、政策分析师、企业决策者等提供有价值的数据支持。本文将通过Python爬虫技术，展示如何抓取地方政府网站上的公开文件、政策等信息。我们将使用最新的爬虫技术，如requests、BeautifulSoup、Selenium等工具
Python 库手册：xml.etree.ElementTree 处理 XML 数据模块
xml.etree.ElementTree（简称ElementTree）是Python标准库中用于解析、创建和操作XML数据的模块。它提供了一种轻量、易用的方式来读取、修改和写入XML文件，适用于配置文件处理、数据交换、网络通信等应用场景。常见应用场景：（1）读取XML配置文件并提取参数。（2）修改XML数据结构（如节点属性、内容）。（3）创建新的XML文档并保存。（4）从WebAPI获取的XML
[学习] 笛卡尔坐标系的任意移动与旋转详解极客不孤独学习算法信号处理
笛卡尔坐标系的任意移动与旋转详解文章目录笛卡尔坐标系的任意移动与旋转详解**1.笛卡尔坐标系基础****2.坐标变换原理****2.1平移变换****2.2旋转变换****3.组合变换**Python仿真与动态展示**动画说明**：**关键数学原理**：1.笛卡尔坐标系基础笛卡尔坐标系用(x,y)(x,y)(x,y)表示平面内任意点的位置，原点为(0,0)(0,0)(0,0)。几何图形可视为点的集
第二阶段-第二章—8天Python从入门到精通【itheima】-134节（SQL——DQL——分组聚合） Patrick_kafka sql 数据库 mysql 大数据开发语言 python pycharm
目录134节——DQL：分组聚合1.学习目标2.分组聚合3.论MySQL中GROUPBY和WHERE的异同MySQL中GROUPBY和WHERE的异同：一、相同点：都是“筛数据”的工具二、不同点：筛的时机和对象完全不一样1.作用时机不同：先筛行，再分组2.作用对象不同：筛单行vs筛分组3.不能混搭的“规矩”三、一句话总结4.小节总结编辑好了，又一篇博客和代码写完了，励志一下吧，下一小节等等继续：1
python库下载超时_Python pip使用超时问题解决方案 weixin_39597318 python库下载超时
Pythonpip使用超时问题解决方案引言之前有位群友在群里发了个问题，说使用pip安装第三方包遇到"Readtimeout"。我相信很多时候，大家在使用pip都会遇到这个问题，所以，我想有必要写一遍文章来总结一下。具体如下：解决方案在这之前，你要明白一点，直接使用pip安装超时，绝大多数原因是pip源在外国，所以国内使用，网络就算稳定，也有一定超时。要想解决pip安装软件包超时问题，目前只有两种
python基础变量之---集合暴龙胡乱写博客 python基础 python chrome 开发语言
python基础变量之—集合文章目录python基础变量之---集合一、集合1.集合介绍2.集合创建3.集合操作4.集合常见API二，可变与不可变类型1.可变2.不可变3.二者区别三，类型转换一、集合1.集合介绍在Python中，集合（set）是一种无序的、不重复的数据结构，用于存储唯一的元素，支持数学集合的一些操作，如交集、并集、差集等。集合中的元素是无序的，即不记录元素的插入顺序，且每个元素只
聚焦基础研究突破，北电数智联合复旦大学等团队提出“AI安全”DDPA方法入选ICML CSDN资讯人工智能安全数据要素大数据
近日，由北电数智首席科学家窦德景教授牵头，联合复旦大学和美国奥本大学等科研团队共同研发，提出一种DDPA（DynamicDelayedPoisoningAttack）新型对抗性攻击方法，为机器学习领域的安全研究提供新视角与工具，相关论文已被国际机器学习大会（ICML2025）收录。ICML由国际机器学习学会（IMLS）主办，聚焦深度学习、强化学习、自然语言处理等机器学习前沿方向，是机器学习与人工智
解决pip指令超时问题好学近乎知o pip python
用pip指令，在安装Django3.2时报错，询问ChatGpt后得到的解决方案pip下载超时——是当前网络连接到PyPI官方源太慢或不稳定，甚至可能连不上了，而pip默认的超时时间又太短，就导致了中途失败：ReadTimeoutError:HTTPSConnectionPool(host='files.pythonhosted.org',port=443):Readtimedout.解决方案：换
Python通关秘籍（五）数据结构——元组 Smile丶Life丶 Python 通关指南：从零基础到高手之路 Python python 数据结构 android
前文复习五、数据结构5.1列表（List）列表是一种有序的可变数据集合，可以包含不同类型的元素。5.2元组（Tuple）元组是一种有序的不可变数据集合，通常用于存储一组相关的值。5.2.1元组的定义与创建
闲鱼监控助手实战项目：用 Python 实现闲鱼监控+自动秒拍
项目背景：为什么要做这个闲鱼助手？在闲鱼上抢东西，永远拼不过“秒拍党”。游戏机低价挂出，几秒没了优酷年卡、流量卡一上架立刻被拍想转卖赚差价，总是慢一步于是我写了一个Python闲鱼助手，实现自动闲鱼监控+秒拍下单，帮助我快速捡漏、低买高卖。核心功能一览（关键词自然带入）功能模块说明️‍♀️闲鱼监控实时监控指定关键词商品，自动刷新，发现即处理⚡闲鱼秒拍自动拍下匹配条件商品，支持延迟策略更隐蔽钉钉推送
vscode创建Python虚拟环境无法激活问题处理
系统环境win7环境，Python3.7，VScode1.70.3问题报错：PSC:\Users\Administrator\PycharmProjects\websites>.\venv\Scripts\activate无法加载文件C:\Users\Administrator\PycharmProjects\websites\venv\Scripts\Activate.ps1，因为在此系统中禁止
python+requests+pytest qiumiaomi 接口 python python pytest 开发语言
|-----api|-----------------init.py|-----------------api_np.py||-----scripts------------------init.py|------------------test01_mp.py|||-----pytest.iniapiinit.py##公共变量#1.请求域名host="127.0.0.1”#2.请求信息头head
Python 线程优先队列 PriorityQueue - Python零基础入门教程猿说编程
目录一.Python线程队列Queue分类二.Python线程优先队列PriorityQueue简介三.Python线程优先队列PriorityQueue函数介绍四.Python线程优先队列PriorityQueue使用五.猜你喜欢零基础Python学习路线推荐:Python学习目录>>Python基础入门在线程队列Queue/线程队列LifoQueue文章中分别介绍了先进先出队列Queue和先进
阿里云态势感知和安骑士有什么区别？阿腾云
阿里云态势感知和安骑士均是阿里云云盾安全产品，态势感知属于安全管理类的产品，安骑士数据服务器安全类产品，阿里云百科网来详细说下阿里云态势感知和安骑士之间的区别：态势感知和安骑士的区别简单来说，安骑士是检测云服务器漏洞的，态势感知提供安全类的大数据分析服务。态势感知：安全大数据分析平台，通过机器学习和结合全网威胁情报，发现传统防御软件无法覆盖的网络威胁，溯源攻击手段、并且提供可行动的解决方案。安骑士
【Python练习】056. 编写一个函数，实现简单的CSV文件解析器视睿从零开始学习机器人 python 前端服务器
056.编写一个函数，实现简单的CSV文件解析器056.编写一个函数，实现简单的CSV文件解析器示例代码示例CSV文件内容示例运行代码说明扩展功能支持自定义分隔符的示例注意事项实现CSV文件解析的方法使用标准库csv模块解析使用pandas库解析手动实现基础解析器处理复杂CSV格式性能优化建议056.编写一个函数，实现简单的CSV文件解析器以下是一个简单的Python函数，用于解析CSV文件。这个
【Python练习】031. 解释python中的深拷贝和浅拷贝
031.解释python中的深拷贝和浅拷贝031.解释python中的深拷贝和浅拷贝1.浅拷贝（ShallowCopy）浅拷贝的实现方式示例代码2.深拷贝（DeepCopy）深拷贝的实现方式示例代码区别总结适用场景注意事项浅拷贝的应用深拷贝的应用不同数据类型的拷贝行为自定义对象的拷贝控制性能与适用场景031.解释python中的深拷贝和浅拷贝在Python中，深拷贝（DeepCopy）和浅拷贝（S
2022爆火的游戏wordle，python实现刘先生的u写倒了数据结构与算法（C）所有文章 python 游戏开发语言
2022爆火的游戏wordle实现近日，名为Wordle的填字游戏成为继《宝可梦GO》之后又一款在欧美流行的网红游戏，推出不到4个月便引发全球百万玩家抢玩。更让人意想不到的是，2月1日，《纽约时报》宣布收购Wordle，据称收购价格价值“7位数”美元。Wordle是一款免费无广告的网页填字游戏，玩法非常简单：玩家需要在6次机会中猜出一个由5个英文字母组成的英文单词，玩家猜中的字母会以绿底呈现，黄底
从API到Agent：万字洞悉LangChain工程化设计 bpluo42657 langchain
——构建下一代AI应用的核心范式迁移一、传统API范式的局限性：为什么需要Agent？接口式AI的痛点python#传统NLPAPI调用示例response=openai.Completion.create(model="text-davinci-003",prompt="请翻译：Helloworld",max_tokens=50)单次请求/响应模式缺乏状态管理与上下文延续硬编码逻辑难以应对复杂场
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，