statistics_man

定量预测方法总结及案例实践

文章目录

1 前序
2 预测方法及案例
- 2.1 回归分析
- - 2.1.1 含有哑变量的线性回归分析案例
  - 2.1.2 自变量之间有交互作用的回归分析案例
  - 2.1.3 非线性回归分析——预测第三产业国内生产总值案例
- 2.2 时间序列分析与市场预测
- - 2.2.1 简单指数平滑（SES，Simple Exponential Smoothing）预测时间序列
  - 2.2.2 用Holt指数平滑模型预测2006年的人均GDP
  - 2.2.3 指数曲线预测
  - 2.2.4 多项式曲线预测
  - 2.2.5 用Winters指数平滑模型预测啤酒的销售量
  - 2.2.6 分解预测法预测啤酒的销售量

1 前序

常见的两类方法：

基于相关原则的回归分析法
基于惯性原则的时间序列法

回归分析的基本步骤：

（1）重点考察一个特定的变量（因变量），而把其他变量（自变量）看作是影响这一变量的因素，并通过适当的数学模型将变量间的关系表达出来；
（2）利用样本数据建立模型的估计方程；
（3）对模型进行显著性检验；
（4）通过一个或几个自变量的取值来估计或预测因变量的取值。

预测方法的选择（仅供参考）：

数据模式	预测方法	对数据的要求	预测期
平稳序列	移动平均	数据个数与移动平均步长相等	非常短
平稳序列	简单指数平滑	5个以上	短期
线性趋势	Holt指数平滑	5个以上	短期至中期
线性趋势	一元线性回归	10个以上	短期至中期
非线性趋势	指数模型	10个以上	短期至中期
非线性趋势	多项式函数	10个以上	短期至中期
趋势和季节成分	Winter指数平滑	至少有四个周期的季节或月份数据	短期至中期
趋势和季节成分	季节性多元回归	至少有四个周期的季节或月份数据	短期、中期、长期
趋势、季节成分和循环成分	分解预测	至少有四个周期的季节或月份数据	短期、中期、长期

预测方法的评估：一种预测方法的好坏取决于预测误差的大小。预测误差是预测值与实际值的差距，度量方法有：

平均误差（Mean Error）
平均绝对误差（Mean Absolute Deviation）
均方误差（Mean Square Error,MSE）(常用)
平均百分比误差（Mean Percentage Error）
平均绝对百分比误差（Mean Absolute Percentage Error）

2 预测方法及案例

2.1 回归分析

2.1.1 含有哑变量的线性回归分析案例

为研究员工月工资收入与工作年限和性别之间的关系，从某公司职员中随机抽取男女各4名，他们的月工资收入与工作年限和性别之间的关系表如下：

月工资收入(元)	工作年限	性别
2900	2	男
3000	6	女
4800	8	男
1800	3	女
2900	2	男
4900	7	男
4200	9	女
4800	8	女

令 $y$ 表示月工资收入， $x_1$ 表示工作年限， $x_2$ 表示性别，性别作为哑变量引入时，回归方程如下： $y=\beta_0+\beta_1 x_1 + \beta_2 x_2$ ，于是我们可以得到：

女（ $x_2=0$ ）： $y_{女性}=\beta_0+\beta_1 x_1$
男( $x_2=1$ )： $y_{男性}=(\beta_0+\beta_2)+\beta_1 x_1$

其中各参数的含义如下：

$\beta_0$ 的含义是女性职工的基本月工资收入
$(\beta_0+\beta_2)$ 的含义是男性职工的基本月工资收入
$\beta_1$ 的含义是工作年限每增加1年，男性或女性工资的平均增加值
$\beta_2$ 的含义是男性职工的月工资收入与女性职工的月工资收入之间的差值，即 $y_{男性}-y_{女性}=(\beta_0+\beta_2)+\beta_1 x_1-\beta_0+\beta_1 x_1=\beta_2$

python实现代码如下：

import pandas as pd
import numpy as np
import statsmodels.api as sm

data = pd.DataFrame({
    '月工资收入':[2900,3000,4800,1800,2900,4900,4200,4800],
    '工作年限':[2,6,8,3,2,7,9,8],
    '性别':['男','女','男','女','男','男','女','女']
})

# 哑变量处理
dummy_variables = pd.get_dummies(data=data['性别'].values)

X = np.column_stack(tup=(data['工作年限'].values,dummy_variables.values))
X = sm.add_constant(data=X)     # 加一列常数项
y = data['月工资收入'].values

# 用最小二乘法拟合回归方程
linear_model = sm.OLS(endog=y,exog=X)
ols_result = linear_model.fit()

# 输出拟合结果
print(ols_result.summary())
'''
                            OLS Regression Results                            
==============================================================================
Dep. Variable:                      y   R-squared:                       0.901
Model:                            OLS   Adj. R-squared:                  0.862
Method:                 Least Squares   F-statistic:                     22.78
Date:                Sun, 22 May 2022   Prob (F-statistic):            0.00307
Time:                        17:02:55   Log-Likelihood:                -58.036
No. Observations:                   8   AIC:                             122.1
Df Residuals:                       5   BIC:                             122.3
Df Model:                           2                                         
Covariance Type:            nonrobust                                         
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const        950.7246    247.685      3.838      0.012     314.029    1587.420
x1           397.5845     60.183      6.606      0.001     242.879     552.290
x2           -85.0242    231.138     -0.368      0.728    -679.184     509.135
x3          1035.7488    172.207      6.015      0.002     593.076    1478.421
==============================================================================
Omnibus:                        4.593   Durbin-Watson:                   1.536
Prob(Omnibus):                  0.101   Jarque-Bera (JB):                1.483
Skew:                           1.049   Prob(JB):                        0.477
Kurtosis:                       3.219   Cond. No.                     7.55e+16
==============================================================================
Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
[2] The smallest eigenvalue is 5.64e-32. This might indicate that there are
strong multicollinearity problems or that the design matrix is singular.

从上面结果可以看到，拟合优度R方为0.901，调整R方为0.862，模型拟合显著性检验的P值为0.00307 < 0.05，说明模型拟合效果还是可以的，
再看到参数拟合结果，x2的参数p值为0.728 > 0.05，因此下面我们剔除x2后再做一次拟合
'''

X1 = X[:,[0,1,3]]

# 用最小二乘法拟合回归方程
linear_model1 = sm.OLS(endog=y,exog=X1)
ols_result1 = linear_model1.fit()

# 输出拟合结果
print(ols_result1.summary())
'''
                            OLS Regression Results                            
==============================================================================
Dep. Variable:                      y   R-squared:                       0.901
Model:                            OLS   Adj. R-squared:                  0.862
Method:                 Least Squares   F-statistic:                     22.78
Date:                Sun, 22 May 2022   Prob (F-statistic):            0.00307
Time:                        17:18:21   Log-Likelihood:                -58.036
No. Observations:                   8   AIC:                             122.1
Df Residuals:                       5   BIC:                             122.3
Df Model:                           2                                         
Covariance Type:            nonrobust                                         
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const        865.7005    447.091      1.936      0.111    -283.583    2014.984
x1           397.5845     60.183      6.606      0.001     242.879     552.290
x2          1120.7729    323.747      3.462      0.018     288.554    1952.992
==============================================================================
Omnibus:                        4.593   Durbin-Watson:                   1.536
Prob(Omnibus):                  0.101   Jarque-Bera (JB):                1.483
Skew:                           1.049   Prob(JB):                        0.477
Kurtosis:                       3.219   Cond. No.                         20.8
==============================================================================
Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.

可以看到，模型整体的拟合是没有变的，在显著性水平为0.05的条件下，x1和x2的参数显著性通过检验，但常数项的显著性不明显，因此下面我们剔除常数项再做一次拟合
'''

X2 = X[:,[1,3]]

# 用最小二乘法拟合回归方程
linear_model2 = sm.OLS(endog=y,exog=X2)
ols_result2 = linear_model2.fit()

# 输出拟合结果
print(ols_result2.summary())
'''
                                 OLS Regression Results                                
=======================================================================================
Dep. Variable:                      y   R-squared (uncentered):                   0.986
Model:                            OLS   Adj. R-squared (uncentered):              0.981
Method:                 Least Squares   F-statistic:                              210.6
Date:                Sun, 22 May 2022   Prob (F-statistic):                    2.77e-06
Time:                        17:22:47   Log-Likelihood:                         -60.274
No. Observations:                   8   AIC:                                      124.5
Df Residuals:                       6   BIC:                                      124.7
Df Model:                           2                                                  
Covariance Type:            nonrobust                                                  
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
x1           499.5470     35.188     14.197      0.000     413.446     585.648
x2          1502.1518    310.270      4.841      0.003     742.948    2261.356
==============================================================================
Omnibus:                        0.202   Durbin-Watson:                   1.923
Prob(Omnibus):                  0.904   Jarque-Bera (JB):                0.253
Skew:                          -0.258   Prob(JB):                        0.881
Kurtosis:                       2.297   Cond. No.                         10.5
==============================================================================
Notes:
[1] R² is computed without centering (uncentered) since the model does not contain a constant.
[2] Standard Errors assume that the covariance matrix of the errors is correctly specified.

可以看大，模型显著性和参数显著性都得到了提升，最终我们模型估计结果为：y = 499.5470*x1 + 1502.1518*x2
'''

2.1.2 自变量之间有交互作用的回归分析案例

某牙膏制造企业要求销售部门根据市场调查，找出公司生产的牙膏销售量与销售价格、广告投入等之间的关系，从而预测出在不同价格和广告费用下的销售量。为此，销售部收集了过去30个销售周期公司生产的牙膏的销售量、销售价格、广告费用，以及同期其他厂家生产的同类牙膏的平均销售价格，数据如下：

销售周期	公司销售价格(元)	其他厂家平均价格(元)	广告费用(百万元)	价格差(元)	销售量(百万支)
1	3.85	3.8	5.5	-0.05	7.38
2	3.75	4	6.75	0.25	8.51
3	3.7	4.3	7.25	0.6	9.52
……	……	……	……	……	……

试根据这些数据建立一个数学模型，分析牙膏销售量与其他因素的关系，为制定价格策略和广告投入策略提供数据依据

在购买同类产品的牙膏时，顾客会在意不同品牌之间的价格差异，而不是价格本身。设牙膏销售量为y，价格差为x1，广告费为x2，其他厂家平均价格为x3，公司销售价格为x4，x1=x3-x4。

回归分析过程如下：

（1）计算相关系数矩阵，观察自变量y与各因变量的相关程度，以及各因变量之间是否存在相关性；
（2）绘制自变量与因变量的散点图，通过散点图初步判断模型是线性还是非线性；
（3）建立模型，并对模型及其参数进行评估；
（4）模型改进。在初始假定中，价格差和广告费对牙膏销售量的影响是相互独立的，而据直觉和经验可以猜想，价格差与广告费的交互作用也会对牙膏销售量有影响。
（5）模型最终确定。

python代码如下：

import pandas as pd
import numpy as np
import statsmodels.api as sm

from matplotlib import pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']    # 解决中文显示问题
plt.rcParams['axes.unicode_minus'] = False      # 解决坐标轴负数的负号显示问题

data = pd.read_excel(r'G:\牙膏销售数据表.xlsx')
print(data.info())

# 1、计算相关系数矩阵
print(data[['公司销售价格(元)','其他厂家平均价格(元)','广告费用(百万元)','价格差(元)','销售量(百万支)']].corr())
'''
             公司销售价格(元)  其他厂家平均价格(元)  广告费用(百万元)    价格差(元)  销售量(百万支)
公司销售价格(元)     1.000000     0.078367  -0.468793 -0.322067 -0.469220
其他厂家平均价格(元)   0.078367     1.000000   0.604540  0.918566  0.740948
广告费用(百万元)    -0.468793     0.604540   1.000000  0.759964  0.875954
价格差(元)       -0.322067     0.918566   0.759964  1.000000  0.889672
销售量(百万支)     -0.469220     0.740948   0.875954  0.889672  1.000000

可以看到，销售量与价格差、广告费用的相关系数分别是89%、88%，相关度很高，另外价格差和广告费用的相关度也不低（76%左右）
'''

# 2、绘制自变量与因变量的散点图
fig1 = plt.figure()
plt.scatter(x=data['广告费用(百万元)'].values,y=data['销售量(百万支)'].values,marker='*')
plt.xlabel('广告费用(百万元)')
plt.ylabel('销售量(百万支)')
fig2= plt.figure()
plt.scatter(x=data['价格差(元)'].values,y=data['销售量(百万支)'].values,marker='o')
plt.xlabel('价格差(元)')
plt.ylabel('销售量(百万支)')
plt.show()
'''
可以看到，价格差对销售量的走势是近似线性的，而广告费对销售量的走势有一点弯曲，
因此在假设价格差和广告费对牙膏销售量的影响是相互独立的前提下，准对价格差和销售量建立线性回归方程，准对广告费和销售量建立非线性回归方程（二次项）
'''

# 3、建立模型，并对模型及其参数进行估计
# 3.1、价格差和销售量的线性回归方程估计
X1 = sm.add_constant(data=data['价格差(元)'].values)    # X1由1列常数项和价格差组成
y = data['销售量(百万支)']

# 用最小二乘法估计方程
model1 = sm.OLS(endog=y,exog=X1)
result1 = model1.fit()
print(result1.summary())
'''
                            OLS Regression Results                            
==============================================================================
Dep. Variable:               销售量(百万支)   R-squared:                       0.792
Model:                            OLS   Adj. R-squared:                  0.784
Method:                 Least Squares   F-statistic:                     106.3
Date:                Fri, 27 May 2022   Prob (F-statistic):           4.88e-11
Time:                        22:26:27   Log-Likelihood:                -7.0261
No. Observations:                  30   AIC:                             18.05
Df Residuals:                      28   BIC:                             20.85
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const          7.8141      0.080     97.818      0.000       7.650       7.978
x1             2.6652      0.258     10.310      0.000       2.136       3.195
==============================================================================
Omnibus:                        5.481   Durbin-Watson:                   2.414
Prob(Omnibus):                  0.065   Jarque-Bera (JB):                4.092
Skew:                           0.883   Prob(JB):                        0.129
Kurtosis:                       3.391   Cond. No.                         4.69
==============================================================================
Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.

可以看到，模型估计的拟合优度为0.792，在假设显著性水平α=0.05的条件下，模型显著性检验和参数显著性检验均通过，得到的回归方程为：y = 7.8141 + 2.6652*x1
'''

# 3.2、广告费和销售量的非线性回归方程估计
# 多项式处理
from sklearn.preprocessing import PolynomialFeatures
X2 = PolynomialFeatures(degree=2).fit_transform(X=data[['广告费用(百万元)']])

# 用最小二乘法估计方程
model2 = sm.OLS(endog=y,exog=X2)
result2 = model2.fit()
print(result2.summary())
'''
                            OLS Regression Results                            
==============================================================================
Dep. Variable:               销售量(百万支)   R-squared:                       0.838
Model:                            OLS   Adj. R-squared:                  0.826
Method:                 Least Squares   F-statistic:                     69.81
Date:                Fri, 27 May 2022   Prob (F-statistic):           2.14e-11
Time:                        22:45:32   Log-Likelihood:                -3.2455
No. Observations:                  30   AIC:                             12.49
Df Residuals:                      27   BIC:                             16.69
Df Model:                           2                                         
Covariance Type:            nonrobust                                         
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const         25.1091      6.863      3.659      0.001      11.028      39.190
x1            -6.5589      2.217     -2.958      0.006     -11.109      -2.009
x2             0.6101      0.178      3.432      0.002       0.245       0.975
==============================================================================
Omnibus:                        0.063   Durbin-Watson:                   1.523
Prob(Omnibus):                  0.969   Jarque-Bera (JB):                0.224
Skew:                          -0.090   Prob(JB):                        0.894
Kurtosis:                       2.617   Cond. No.                     5.98e+03
==============================================================================
Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
[2] The condition number is large, 5.98e+03. This might indicate that there are
strong multicollinearity or other numerical problems.

可以看到，模型估计的拟合优度为0.838，在假设显著性水平α=0.05的条件下，模型显著性检验和参数显著性检验均通过，得到的回归方程为：y = 25.1091 - 6.5589*x2 + 0.6101*(x2)**2
'''

# 4、模型改进：加入交互项和广告费的二次项
data['价格差*广告费用'] = data['价格差(元)'] * data['广告费用(百万元)']
X3 = np.column_stack(tup=(X1,X2[:,[1,2]],data['价格差*广告费用'].values))

# 用最小二乘法估计方程
model3 = sm.OLS(endog=y,exog=X3)
result3 = model3.fit()
print(result3.summary())
'''
                            OLS Regression Results                            
==============================================================================
Dep. Variable:               销售量(百万支)   R-squared:                       0.921
Model:                            OLS   Adj. R-squared:                  0.908
Method:                 Least Squares   F-statistic:                     72.78
Date:                Fri, 27 May 2022   Prob (F-statistic):           2.11e-13
Time:                        23:11:51   Log-Likelihood:                 7.5137
No. Observations:                  30   AIC:                            -5.027
Df Residuals:                      25   BIC:                             1.979
Df Model:                           4                                         
Covariance Type:            nonrobust                                         
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const         29.1133      7.483      3.890      0.001      13.701      44.525
x1            11.1342      4.446      2.504      0.019       1.978      20.291
x2            -7.6080      2.469     -3.081      0.005     -12.693      -2.523
x3             0.6712      0.203      3.312      0.003       0.254       1.089
x4            -1.4777      0.667     -2.215      0.036      -2.852      -0.104
==============================================================================
Omnibus:                        0.242   Durbin-Watson:                   1.512
Prob(Omnibus):                  0.886   Jarque-Bera (JB):                0.148
Skew:                          -0.153   Prob(JB):                        0.929
Kurtosis:                       2.843   Cond. No.                     9.81e+03
==============================================================================
Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
[2] The condition number is large, 9.81e+03. This might indicate that there are
strong multicollinearity or other numerical problems.

可以看到，模型估计的拟合优度提升至0.921，在假设显著性水平α=0.05的条件下，模型显著性检验和参数显著性检验均通过，最终确定回归方程为：
y = 29.1133 + 11.1342*x1 - 7.6080*x2 + 0.6712*(x2)**2 - 1.4777*x1*x2
'''

2.1.3 非线性回归分析——预测第三产业国内生产总值案例

某省为了研究第三产业在本省宏观经济发展中的运行情况，对影响第三产业的资本要素、劳动力要素及科技进步要素这三项主要因素进行了统计分析，并运用道格拉斯生产函数建立了基本数学模型。原始数据如下：

年份	第三产业国内生产总值	资本投入	从业人员
1992	448.96	524085	470.08
1993	611.23	1068889	480.77
1994	834.93	1632884	529.08
……	……	……	……
2002	3120	10029357	903.14

现需要预测当资本投入为11738245、劳动力投入为987.37时，第三产业国内生产总值是多少。

道格拉斯生产函数对应数学模型为 $Y=AK^{\alpha}L^{\beta}$ ，其中：

Y是第三产业国内生产总值
K是资金投入
L是劳动力投入
A是科技进步水平
$\alpha$ 是资本弹性系数
$\beta$ 是劳动弹性系数

上面的非线性模型我们可以通过对等号两边取对数，使之转换为多元线性模型，即 $\alpha LnK + \beta LnL$ ，令 $LnY=y，LnA=c，LnK=x_1，LnL=x_2$ ，于是得到 $y=c+\alpha x_1+\beta x_2$

下面我们用python实现上述的建模过程：

import pandas as pd
import numpy as np
import statsmodels.api as sm

data = pd.read_excel(r'G:\第三产业国内生产总值数据表.xlsx')

# 线性化处理
data1 = data[['第三产业国内生产总值', '资本投入', '从业人员']].apply(lambda x:np.log(x))

# 确定自变量和因变量
X = sm.add_constant(data=data1[['资本投入', '从业人员']].values)  # 添加常数列
y = data1['第三产业国内生产总值'].values

# 用最小二乘法估计方程
model = sm.OLS(endog=y,exog=X)
result = model.fit()
print(result.summary())
'''
                            OLS Regression Results                            
==============================================================================
Dep. Variable:                      y   R-squared:                       0.988
Model:                            OLS   Adj. R-squared:                  0.985
Method:                 Least Squares   F-statistic:                     338.6
Date:                Tue, 31 May 2022   Prob (F-statistic):           1.86e-08
Time:                        23:20:30   Log-Likelihood:                 15.034
No. Observations:                  11   AIC:                            -24.07
Df Residuals:                       8   BIC:                            -22.87
Df Model:                           2                                         
Covariance Type:            nonrobust                                         
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const         -4.4745      1.229     -3.641      0.007      -7.308      -1.641
x1             0.4797      0.095      5.060      0.001       0.261       0.698
x2             0.6947      0.393      1.768      0.115      -0.212       1.601
==============================================================================
Omnibus:                        2.430   Durbin-Watson:                   1.134
Prob(Omnibus):                  0.297   Jarque-Bera (JB):                0.971
Skew:                           0.197   Prob(JB):                        0.615
Kurtosis:                       1.598   Cond. No.                         967.
==============================================================================
Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
'''

根据返回的回归分析报告，我们可以看到：

样本回归方程为： $L n Y = - 4.4745 + 0.4797 L n K + 0.6947 L n L$ 。
模型拟合情况：调整R方为0.985，接近于1，说明回归线对数据的拟合程度很高，拟合优度检验通过。
回归方程的总体显著性检验（F检验）：F统计量为338.6，对应的p值为 $1.86 \times 10^{-8}<0.05$ ，拒绝原假设，因此我们认为在0.05的显著性水平下（置信度为95%），模型的线性显著性通过检验。
回归系数的显著性检验（t检验）：常数项系数的t统计量对应的p值为0.007<0.05，LnK项系数的t统计量对应的p值为0.001<0.05，LnL项系数的t统计量对应的p值为0.115>0.05，在0.05的显著性水平下，我们可以拒绝常数项系数和LnK项系数为0的原假设，而没有充分的理由拒绝LnL项系数为0的原假设，在牺牲一定的置信度情况下，我们将显著性水平调整为0.12，从而各项系数均能通过显著性检验。

解释模型的经济含义：从回归方程可以看到，1992——2002年某省第三产业产出的资本投入弹性和劳动投入弹性分别是0.4797和0.6947。换而言之，在研究期间，保持劳动投入不变，每增加1个单位的资本投入，第三产业国内生产总值增加0.4797；同理，保持资本投入不变，每增加1个单位的劳动投入，第三产业国内生产总值增加0.6947。把两个产出弹性相加得到1.1744，就是规模报酬参数的取值，而该值大于1，说明某省第三产业经历了轻微的规模报酬递增。

模型预测：已知资本投入为11738245，劳动力投入为987.37，将其代入回归方程得到： $L n Y = - 4.4745 + 0.4797 L n (11738245) + 0.6947 L n (987.37) = 8.124218321936784$ ，即LnY=8.124218321936784，两边取自然指数e，得到Y=e^(8.124218321936784)=3375.2285581155024，因此当资本投入为11738245、劳动力投入为987.37时，第三产业国内生产总值是3375.23。

2.2 时间序列分析与市场预测

2.2.1 简单指数平滑（SES，Simple Exponential Smoothing）预测时间序列

该预测方法是适合于平稳序列（没有趋势和季节变动的序列），对过去的观测值加权平均进行预测的一种方法。观测值时间越远，其权数也跟着呈现指数的下降，因而称为指数平滑。

t+1的预测值是t期观测值与t期平滑值 $S_t$ 的线性组合，其预测模型为： $F_{t+1}=\alpha Y_t + (1-\alpha)S_t$ ，其中

$F_{t+1}$ 为t+1期的简单指数平滑预测值
$Y_t$ 为第t期的实际观测值
$S_t$ 为第t期的预测值，可设 $S_0=Y_0$
$\alpha$ 为平滑系数， $\alpha<1$

因此模型又可以表示为 $\hat{y}_{t+1|t} = \alpha y_t + \alpha (1-\alpha)y_{t-1} + \alpha (1-\alpha)^2 y_{t-2} + \cdots$

简单指数平滑预测系数α的选择：

（1）不同的α会对预测结果产生不同的影响，当时间序列有较大的随机波动，宜选较小的α；注重于近期的实际值时，宜选较大的α
（2）选择α时，还应考虑预测误差。预测误差可以用均方误差来衡量。
（3）确定α时，可选择几个进行预测，然后找出预测误差最小的作为最后的值。
（4）有两种极端情况：
- $\alpha = 0$ 时，所有未来值的预测等于历史数据的平均值，称为平均值法
- $\alpha = 1$ 时，所有未来值的预测设置为最后一次观测的值，统计中称为朴素方法

python代码实现案例：

import pandas as pd
from statsmodels.tsa.holtwinters import SimpleExpSmoothing
from matplotlib import pyplot as plt

dt = pd.DataFrame(data={
    'year':list(range(1990,2006)),
    '棉花产量(万吨)':[450.77,567.50,450.84,373.93,434.10,476.75,420.33,460.27,450.10,382.88,441.73,532.35,491.62,485.97,632.35,571.42]
})

fig0 = plt.figure()
plt.plot(dt['棉花产量(万吨)'].values)
plt.show()
'''
可以看到，折线图的走势没有明显的趋势和季节性变动
'''

# 下面我们分别用α=0.2，α=0.6，允许statsmodels自动查找最优α这三种方式进行拟合预测
fit1 = SimpleExpSmoothing(endog=dt['棉花产量(万吨)'].values).fit(smoothing_level=0.2,optimized=False)  # 用α=0.2拟合
fit2 = SimpleExpSmoothing(endog=dt['棉花产量(万吨)'].values).fit(smoothing_level=0.6,optimized=False)  # 用α=0.6拟合
fit3 = SimpleExpSmoothing(endog=dt['棉花产量(万吨)'].values).fit()  # 不做设置，自动查找最优α

# 绘制折线图，查看拟合和未来3年的预测值位置
fig = plt.figure()
line1 = plt.plot(list(fit1.fittedvalues)+list(fit1.forecast(steps=3)),c='g',marker='o')
line2 = plt.plot(list(fit2.fittedvalues)+list(fit2.forecast(steps=3)),c='r',marker='o')
line3 = plt.plot(list(fit3.fittedvalues)+list(fit3.forecast(steps=3)),c='b',marker='o')
line4 = plt.plot(dt['棉花产量(万吨)'].values,c='y',marker='*')
plt.legend(labels = ['alpha=0.2','alpha=0.6','auto','data'],loc='best')    # 添加图例
plt.show()

2.2.2 用Holt指数平滑模型预测2006年的人均GDP

Holt指数平滑(二次指数平滑)预测模型，一般简称为Holt模型，适合于含有趋势成分（或有一定的周期成分）序列的预测。

Holt模型有两个平滑系数和三个方程：

1、平滑值方程： $S_t=\alpha Y_t + (1-\alpha)(S_{t-1}+T_{t-1})$ ，其中 $\alpha$ 是平滑参数（ $0<\alpha<1$ ）， $S_t$ 是t期的指数平滑值， $S_{t-1}$ 是t-1期的指数平滑值， $T_{t-1}$ 是t-1期的趋势值。该方程实际上是对t期平滑值 $S_t$ 的修正，它把上一期的趋势值 $T_{t-1}$ 加到 $S_{t-1}$ 上，这样可以消除因趋势而产生的滞后，使其尽可能接近实际观测值 $Y_t$ 。
2、趋势项更新方程： $T_t=\gamma(S_t-S_{t-1})+(1-\gamma)T_{t-1}$ ，其中 $\gamma$ 是平滑系数（ $0<\gamma<1$ ）， $T_{t}$ 是t期趋势的平滑值。该方程实际上是对趋势的修正， $T_{t}$ 被表示成相邻两项平滑值之差（ $S_t-S_{t-1}$ ），如果序列存在趋势，则新的观测值总是高于（上升趋势）或低于（下降趋势）前一期数值，同时由于随机波动的影响，需要用 $\gamma$ 平滑（ $S_t-S_{t-1}$ ）的趋势，然后再将平滑的结果加到前一期趋势的估计值 $T_{t-1}$ 与 $1-\gamma$ 的乘积上。
K期预测值方程： $F_{t+k}=S_t+k \times T_t$ ，其中k是用于预测的时期数，当k=1时，t+1期的预测值就是t期的平滑值 $S_t$ 加上t期的修正趋势值 $T_t$ 。

Holt模型中初始值的确定：

（1）由于在开始计算时，还没第1个时期的平滑值 $S_1$ 和修正趋势值 $T_1$ ，通常设 $S_1=Y_1，T_1=Y_2-Y_1$ ；
（2）平滑系数 $\alpha和\gamma$ 可根据实际情况确定，可用均方误差来衡量。

案例

1990年到2005年的人均GDP数据如下：

年份	人均GDP
1990	1644.42
1991	1892.76
1992	2311.09
1993	2998.36
1994	4044.00
1995	5045.73
1996	5845.89
1997	6420.18
1998	6796.03
1999	7158.50
2000	7857.68
2001	8621.71
2002	9398.05
2003	10541.97
2004	12335.58
2005	14040.00

可以看到人均GDP逐年增加，存在增长趋势，下面我们利用Holt模型预测2006年的人均GDP：

（1）由于我们要预测的是下一期（即2006年）的人均GDP，所以k=1，于是K期预测值方程转换为 $F_{t+1}=S_t+T_t$ ；
（2）在开始计算时，我们令 $S_1=Y_1，T_1=Y_2-Y_1$ ，于是对应地可以得到 $S_{1990}=Y_{1990}，T_{1990}=Y_{1991}-Y_{1990}$ ；
（3）确定好初始值之后，我们来确定平滑系数 $\alpha$ 和 $\gamma$ ，一般我们认为过去历史值对现在的影响比较弱小，下一期的变化走势主要由本期决定，因此可以设置平滑系数为0.7；
（4）确定好各项系数后，我们就可以利用预测方程 $F_{t+1}=S_t+T_t=0.7 \times Y_t + 0.3 \times (S_{t-1}+T_{t-1})+0.7 \times (S_t-S_{t-1})+0.3 \times T_{t-1}$ 进行迭代：
- （1） $F_{1991}=S_{1990}+T_{1990}=Y_{1990}+Y_{1991}-Y_{1990}=Y_{1991}=1892.76，S_{1991}=0.7 \times Y_{1991} + 0.3 \times (S_{1990} + T_{1990})=Y_{1991}=1892.76，T_{1991}=0.7 \times (S_{1991}-S_{1990})+0.3 \times T_{1990}=T_{1990}=Y_{1991}-Y_{1990}=248.29$
- （2） $F_{1992}=S_{1991}+T_{1991}=1892.76+248.29=2141.05，S_{1992}=0.7 \times Y_{1992} + 0.3 \times (S_{1991} + T_{1991})=2260.078，T_{1992}=0.7 \times (S_{1992}-S_{1991})+0.3 \times T_{1991}=331.6096$
- （3）以此类推，最后得到 $F_{2006}=S_{2005}+T_{2005}=15589.21213$

最终得到数据如下：

年份	人均GDP	S	T	predict
1990	1644.47	1644.47	248.29	1644.47
1991	1892.76	1892.76	248.29	1892.76
1992	2311.09	2260.078	331.6096	2141.05
1993	2998.36	2876.35828	530.879076	2591.6876
1994	4044.00	3852.971207	842.8927716	3407.237356
1995	5045.73	4940.770194	1014.327122	4695.863978
1996	5845.89	5878.652195	960.8155375	5955.097316
1997	6420.18	6545.96632	755.3645487	6839.467732
1998	6796.03	6947.620261	507.7671232	7301.330868
1999	7158.50	7247.566215	362.2923052	7455.387384
2000	7857.68	7783.333556	483.7248302	7609.85852
2001	8621.71	8515.314516	657.5041209	8267.058386
2002	9398.05	9330.480591	767.8674889	9172.818637
2003	10541.97	10408.88342	985.2422297	10098.34808
2004	12335.58	12053.1437	1446.554859	11394.12565
2005	14040.00	13877.90957	1711.302567	13499.69856
2006				15589.21213

对于长期预测，使用Holt方法的预测在未来会无限期地增加或减少，在这种情况下，我们使用具有阻尼参数 $\phi (0 < \phi < 1)$ 的阻尼趋势方法来防止预测 “失控”，因此我们对上面三个方程进行优化：

平滑值方程： $S_t=\alpha Y_t + (1-\alpha)(S_{t-1}+\phi T_{t-1})$
趋势项方程： $T_t=\gamma(S_t-S_{t-1})+(1-\gamma) \phi T_{t-1}$
预测值方程： $F_{t+k} = S_t + (\phi + \phi^2 + \cdots + \phi^k) T_t$

python代码实现案例：

import pandas as pd
from statsmodels.tsa.holtwinters import Holt
from matplotlib import pyplot as plt

dt = pd.DataFrame(data={
    'year':list(range(1990,2006)),
    '人均GDP':[1644.47,1892.76,2311.09,2998.36,4044.00 ,5045.73,5845.89,6420.18,6796.03,7158.50,7857.68,8621.71,9398.05,10541.97,12335.58,14040.00]
})

fig0 = plt.figure()
plt.plot(dt['人均GDP'].values)
plt.show()
'''
可以看到，折线图的走势有明显的上升趋势
'''

# 下面我们尝试Holt方法的三种变体，对比拟合效果
fit1 = Holt(endog=dt['人均GDP'].values).fit(smoothing_level=0.8,smoothing_trend=0.2,optimized=False)  # 设置alpha=0.8，gamma=0.2
fit2 = Holt(endog=dt['人均GDP'].values,exponential=True).fit(smoothing_level=0.8,smoothing_trend=0.2,optimized=False)  # 使用指数模型，而不是Holt的加法模型（默认）
fit3 = Holt(endog=dt['人均GDP'].values,damped_trend=True).fit(smoothing_level=0.8,smoothing_trend=0.2)  # 使用阻尼版本的Holt附加模型，但允许优化阻尼参数phi，同时固定alpha=0.8，gamma=0.2的值

# 绘制折线图，查看拟合和未来3年的预测值位置
fig = plt.figure()
line1 = plt.plot(list(fit1.fittedvalues)+list(fit1.forecast(steps=3)),c='g',marker='.')
line2 = plt.plot(list(fit2.fittedvalues)+list(fit2.forecast(steps=3)),c='r',marker='.')
line3 = plt.plot(list(fit3.fittedvalues)+list(fit3.forecast(steps=3)),c='b',marker='.')
line4 = plt.plot(dt['人均GDP'].values,c='y',marker='^')
plt.legend(labels = ["Holt's linear trend",'Exponential trend','Additive damped trend','data'],loc='best')    # 添加图例
plt.show()

2.2.3 指数曲线预测

当时间序列以几何级递增或递减时，适合用指数曲线对样本进行拟合，其模型的一般形式为 $\hat{Y}_t=b_0 \exp{(b_1t)}=b_0 e^{b_1t}$ ，式中 $b_0、b_1$ 为待定系数，exp表示自然对数 $\ln$ 的反函数，e=2.71828182845904。

对上面指数曲线模型线性化处理，即等号两边取自然对数得到： $\ln{\hat{Y}_t}=\ln{b_0}+b_1 t$ 。将模型线性化之后，我们就可以使用最小二乘法来估计参数。

2.2.4 多项式曲线预测

有些现象的变化形态比较复杂，它们不是按照某种固定的形态变化，而是有升有降，在变化过程中可能有几个拐点，这时就需要拟合多项式函数：

当只有一个拐点时，可以拟合二阶曲线，即抛物线；
当有两个拐点时，需要拟合三阶曲线；
当有k-1个拐点时，需要拟合k阶曲线。

k阶曲线函数的一般形式为： $\hat{Y_t} = b_0 + b_1 t + b_2 t^2 + b_k t^k$ 。

将函数线性化处理：令 $t=x_1，t^2=x_2，\cdots，t^k=x_k$ 。经过处理后，函数变成多元线性回归方程，于是我们就可以使用最小二乘法来估计 $b_0，b_1，b_2，\cdots，b_k$ 。

2.2.5 用Winters指数平滑模型预测啤酒的销售量

简单指数平滑模型适合于对平稳序列（没有趋势和季节成分）的预测；Holt指数平滑模型适合于含有趋势成分但不含季节成分序列的预测。

如果时间序列中既含有趋势成分又含有季节成分，则可以使用Winters指数平滑模型进行预测，该模型要求数据是按季度或月份收集的，而且至少需要4年（4个季节周期长度）以上的数据。

Winters指数平滑(三次指数平滑)模型包括三个平滑参数 $\alpha、\gamma、\delta$ （取值均在0和1之间）和四个方程：

（1）平滑值： $S_t = \alpha \frac{Y_t}{I_{t-L}} + (1-\alpha)(S_{t-1} + T_{t-1})$ ，其中L为季节周期的长度，若为季节数据，则L=4，若为月份数据，则L=12；I为季节调整因子， $\frac{Y_t}{I_{t-L}}$ 表示t期观测值剔除季节调整因子 $I_{t-L}$ 来消除季节变动。
（2）趋势项更新： $T_t = \gamma (S_t - S_{t-1}) + (1 - \gamma)T_{t-1}$ ，用参数 $\gamma$ 加权趋势增值 $S_t - S_{t-1})$ ，用 $(1-\gamma)$ 加权前期趋势值，以此来对趋势值 $T_{t-L}$ 进行修正。
（3）季节项更新： $I_t = \delta \frac{Y_t}{S_t} (1-\delta)I_{t-L}$ ，其中 $\frac{Y_t}{S_t}$ 是根据季节变动来调整实际值，用参数 $\delta$ 加权这一调整值，用 $(1-\delta)$ 加权前一个季度数据 $I_{t-L}$ ，其结果就是t期的季节调整因子。
（4）K期预测： $F_{t+k} = (S_t + kT_t)I_{t-L+k}$ 。

在进行预测时，模型中的参数即 $\alpha、\gamma、\delta$ 难以确定时，可采用spss软件自动搜寻的方式确定，而初始平滑值和趋势值也可以采用spss软件自动的方式确定。

Winters指数平滑法有两种变体：

加法形式：整个序列的季节变化基本保持不变。
乘法形式：季节变化与系列水平成比例变化。

python代码实现案例：

import pandas as pd
from statsmodels.tsa.holtwinters import ExponentialSmoothing
from matplotlib import pyplot as plt

dt = pd.DataFrame(data={
    'year_season':['2005_Q1','2005_Q2','2005_Q3','2005_Q4','2006_Q1','2006_Q2','2006_Q3','2006_Q4','2007_Q1','2007_Q2','2007_Q3','2007_Q4','2008_Q1','2008_Q2','2008_Q3','2008_Q4','2009_Q1','2009_Q2','2009_Q3','2009_Q4','2010_Q1','2010_Q2','2010_Q3','2010_Q4'],
    '销售量':[25,32,37,26,30,38,42,30,29,39,50,35,30,39,51,37,29,42,55,38,31,43,54,41]
})

fig0 = plt.figure()
plt.plot(dt['销售量'].values)
plt.show()
'''
可以看到，折线图的走势有明显的上升趋势和季节性变动
'''

# 下面我们尝试完整的Holt-Winters方法，包括趋势组件和季节性组件，对比拟合效果
fit1 = ExponentialSmoothing(endog=dt['销售量'].values,trend='add',seasonal='add',seasonal_periods=4).fit()  # 使用加法趋势，周期season_length = 4的加性季节
fit2 = ExponentialSmoothing(endog=dt['销售量'].values,trend='add',seasonal='mul',seasonal_periods=4).fit()  # 使用加法趋势，周期season_length = 4的乘法季节
fit3 = ExponentialSmoothing(endog=dt['销售量'].values,trend='add',seasonal='add',damped_trend=True,seasonal_periods=4).fit()  # 使用加性阻尼趋势，周期season_length = 4的加性季节
fit4 = ExponentialSmoothing(endog=dt['销售量'].values,trend='add',seasonal='mul',damped_trend=True,seasonal_periods=4).fit()  # 使用加性阻尼趋势，周期season_length = 4的加性季节

# 绘制折线图，查看拟合和未来3年的预测值位置
fig = plt.figure()
line1 = plt.plot(list(fit1.fittedvalues)+list(fit1.forecast(steps=4)),c='g',marker='*')
line2 = plt.plot(list(fit2.fittedvalues)+list(fit2.forecast(steps=4)),c='r',marker='*')
line3 = plt.plot(list(fit3.fittedvalues)+list(fit3.forecast(steps=4)),c='b',marker='*')
line4 = plt.plot(list(fit3.fittedvalues)+list(fit3.forecast(steps=4)),c='b',marker='*')
line5 = plt.plot(dt['销售量'].values,c='y',marker='^')
plt.legend(labels = ["aa",'am','aa damped','am damped','data'],loc='best')    # 添加图例
plt.show()

2.2.6 分解预测法预测啤酒的销售量

分解预测法的步骤：

1、计算季节指数：以其平均数等于100%为条件而构成的反映季节变动的值，表示某一月份或季度的数值占全年平均数值的大小。如果现象的发展没有季节变动，则各期的季节指数应等于100%。季节变动的程度是根据各季节指数与其平均数（100%）的偏差程度来测定。季节指数计算步骤如下：
- （1）计算移动平均值（季节数据采用4项移动平均，月份数据采用12项移动平均），并将其结果进行 “中心化” 处理（即将移动平均的结果再进行一次二项移动平均）。
- （2）计算移动平均的比值（也称为季节比率）：将序列的各项观测值除以相应的中心化移动平均值。然后再计算出各比值的季度（或月份）平均值，即季节指数。
- （3）季节指数调整：各季节指数的平均数应等于1或100%，若根据上面计算的季节比率的平均值不等于1时，则需要进行调整，具体方法是将上面计算得出的每个季节比率除以它们的总平均值。
2、确定并分离季节成分：分离季节成分，即将原时间序列除以相应的季节指数。季节因素分离后的序列反映了在没有季节因素影响的情况下时间序列的变化形态： $\frac{Y}{S}=\frac{T \times S \times I}{S}=T \times I$ 。
3、建立线性预测模型进行预测：
- （1）根据分离季节性因素的序列确认线性趋势方程。
- （2）根据趋势方程进行预测，该预测值不含季节性因素，即为没有季节因素影响情况下的预测值。
4、计算出最后的预测值：将回归预测值乘以相应的季节指数。

案例：

（1）计算移动平均和季节比率

year	season	销售量	4项移动平均	中心化移动平均	季节比率
2005	Q1	25
2005	Q2	32	30
2005	Q3	37	31.25	30.625	1.208163265
2005	Q4	26	32.75	32	0.8125
2006	Q1	30	34	33.375	0.898876404
2006	Q2	38	35	34.5	1.101449275
2006	Q3	42	34.75	34.875	1.204301075
2006	Q4	30	35	34.875	0.860215054
2007	Q1	29	37	36	0.805555556
2007	Q2	39	38.25	37.625	1.03654485
2007	Q3	50	38.5	38.375	1.302931596
2007	Q4	35	38.5	38.5	0.909090909
2008	Q1	30	38.75	38.625	0.776699029
2008	Q2	39	39.25	39	1
2008	Q3	51	39	39.125	1.303514377
2008	Q4	37	39.75	39.375	0.93968254
2009	Q1	29	40.75	40.25	0.720496894
2009	Q2	42	41	40.875	1.027522936
2009	Q3	55	41.5	41.25	1.333333333
2009	Q4	38	41.75	41.625	0.912912913
2010	Q1	31	41.5	41.625	0.744744745
2010	Q2	43	42.25	41.875	1.026865672
2010	Q3	54	46	44.125	1.223796034
2010	Q4	41	47.5	46.75	0.877005348
2011	Q1
2011	Q2
2011	Q3
2011	Q4

（2）季节指数调整

year/season	Q1	Q2	Q3	Q4	均值
2005	1.208163265	0.8125
2006	0.898876404	1.101449275	1.204301075	0.860215054
2007	0.805555556	1.03654485	1.302931596	0.909090909
2008	0.776699029	1	1.303514377	0.93968254
2009	0.720496894	1.027522936	1.333333333	0.912912913
2010	0.744744745	1.026865672	1.223796034	0.877005348
平均值	0.789274526	1.038476547	1.26267328	0.885234461	0.993914703
季节指数	0.794106902	1.044834676	1.270404066	0.890654357

（3）分离季节成分，建立线性预测模型进行预测

year	season	销售量	4项移动平均	中心化移动平均	季节比率	季节指数	分离季节成分	time
2005	Q1	25				0.794106902	31.48190746	1
2005	Q2	32	30			1.044834676	30.62685489	2
2005	Q3	37	31.25	30.625	1.208163265	1.270404066	29.12459193	3
2005	Q4	26	32.75	32	0.8125	0.890654357	29.19202024	4
2006	Q1	30	34	33.375	0.898876404	0.794106902	37.77828896	5
2006	Q2	38	35	34.5	1.101449275	1.044834676	36.36939019	6
2006	Q3	42	34.75	34.875	1.204301075	1.270404066	33.06034759	7
2006	Q4	30	35	34.875	0.860215054	0.890654357	33.68310027	8
2007	Q1	29	37	36	0.805555556	0.794106902	36.51901266	9
2007	Q2	39	38.25	37.625	1.03654485	1.044834676	37.3264794	10
2007	Q3	50	38.5	38.375	1.302931596	1.270404066	39.35755666	11
2007	Q4	35	38.5	38.5	0.909090909	0.890654357	39.29695032	12
2008	Q1	30	38.75	38.625	0.776699029	0.794106902	37.77828896	13
2008	Q2	39	39.25	39	1	1.044834676	37.3264794	14
2008	Q3	51	39	39.125	1.303514377	1.270404066	40.14470779	15
2008	Q4	37	39.75	39.375	0.93968254	0.890654357	41.54249034	16
2009	Q1	29	40.75	40.25	0.720496894	0.794106902	36.51901266	17
2009	Q2	42	41	40.875	1.027522936	1.044834676	40.19774705	18
2009	Q3	55	41.5	41.25	1.333333333	1.270404066	43.29331232	19
2009	Q4	38	41.75	41.625	0.912912913	0.890654357	42.66526034	20
2010	Q1	31	41.5	41.625	0.744744745	0.794106902	39.03756526	21
2010	Q2	43	42.25	41.875	1.026865672	1.044834676	41.15483626	22
2010	Q3	54	46	44.125	1.223796034	1.270404066	42.50616119	23
2010	Q4	41	47.5	46.75	0.877005348	0.890654357	46.03357037	24
2011	Q1					0.794106902		25
2011	Q2					1.044834676		26
2011	Q3					1.270404066		27
2011	Q4					0.890654357		28

线性趋势模型建立：

import pandas as pd
import statsmodels.api as sm

dt = pd.DataFrame(data={
    'time':list(range(1,25)),
    '分离季节成分':[31.48190746,30.62685489,29.12459193,29.19202024,37.77828896,36.36939019,33.06034759,33.68310027,36.51901266,37.3264794,39.35755666,39.29695032,37.77828896,37.3264794,40.14470779,41.54249034,36.51901266,40.19774705,43.29331232,42.66526034,39.03756526,41.15483626,42.50616119,46.03357037]
})

X = sm.add_constant(data=dt['time'].values)  # 添加常数列
y = dt['分离季节成分'].values

# 用最小二乘法估计分离季节成分后的线性趋势方程
model = sm.OLS(endog=y,exog=X)
result = model.fit()
print(result.summary())
'''
                            OLS Regression Results                            
==============================================================================
Dep. Variable:                      y   R-squared:                       0.767
Model:                            OLS   Adj. R-squared:                  0.756
Method:                 Least Squares   F-statistic:                     72.22
Date:                Sun, 19 Jun 2022   Prob (F-statistic):           2.13e-08
Time:                        12:08:25   Log-Likelihood:                -52.328
No. Observations:                  24   AIC:                             108.7
Df Residuals:                      22   BIC:                             111.0
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const         30.5780      0.942     32.449      0.000      28.624      32.532
x1             0.5605      0.066      8.498      0.000       0.424       0.697
==============================================================================
Omnibus:                        0.733   Durbin-Watson:                   1.698
Prob(Omnibus):                  0.693   Jarque-Bera (JB):                0.695
Skew:                          -0.089   Prob(JB):                        0.707
Kurtosis:                       2.186   Cond. No.                         29.6
==============================================================================
Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
'''

从最小二乘法回归结果可以看到，模型拟合的调整R方不是很高，但模型F检验和参数的t检验在显著性水平 $\alpha$ 为0.05的情况下，均通过检验，因此我们确定分离季节成分后的序列的线性趋势方程为 $\hat{Y_t} = 30.5780 + 0.5605t$ 。

（4）根据线性趋势方程进行预测，并计算最后的预测值

year	season	销售量	4项移动平均	中心化移动平均	季节比率	季节指数	分离季节成分	time	线性趋势预测	最后预测值	误差
2005	Q1	25				0.794106902	31.48190746	1	31.1385	24.72729776	0.272702238
2005	Q2	32	30			1.044834676	30.62685489	2	31.699	33.12021439	-1.120214385
2005	Q3	37	31.25	30.625	1.208163265	1.270404066	29.12459193	3	32.2595	40.98259996	-3.982599964
2005	Q4	26	32.75	32	0.8125	0.890654357	29.19202024	4	32.82	29.23127598	-3.231275983
2006	Q1	30	34	33.375	0.898876404	0.794106902	37.77828896	5	33.3805	26.50768544	3.492314564
2006	Q2	38	35	34.5	1.101449275	1.044834676	36.36939019	6	33.941	35.46273373	2.537266272
2006	Q3	42	34.75	34.875	1.204301075	1.270404066	33.06034759	7	34.5015	43.83084588	-1.83084588
2006	Q4	30	35	34.875	0.860215054	0.890654357	33.68310027	8	35.062	31.22812305	-1.22812305
2007	Q1	29	37	36	0.805555556	0.794106902	36.51901266	9	35.6225	28.28807311	0.71192689
2007	Q2	39	38.25	37.625	1.03654485	1.044834676	37.3264794	10	36.183	37.80525307	1.194746929
2007	Q3	50	38.5	38.375	1.302931596	1.270404066	39.35755666	11	36.7435	46.6790918	3.320908205
2007	Q4	35	38.5	38.5	0.909090909	0.890654357	39.29695032	12	37.304	33.22497012	1.775029883
2008	Q1	30	38.75	38.625	0.776699029	0.794106902	37.77828896	13	37.8645	30.06846078	-0.068460784
2008	Q2	39	39.25	39	1	1.044834676	37.3264794	14	38.425	40.14777241	-1.147772414
2008	Q3	51	39	39.125	1.303514377	1.270404066	40.14470779	15	38.9855	49.52733771	1.472662289
2008	Q4	37	39.75	39.375	0.93968254	0.890654357	41.54249034	16	39.546	35.22181718	1.778182815
2009	Q1	29	40.75	40.25	0.720496894	0.794106902	36.51901266	17	40.1065	31.84884846	-2.848848458
2009	Q2	42	41	40.875	1.027522936	1.044834676	40.19774705	18	40.667	42.49029176	-0.490291757
2009	Q3	55	41.5	41.25	1.333333333	1.270404066	43.29331232	19	41.2275	52.37558363	2.624416373
2009	Q4	38	41.75	41.625	0.912912913	0.890654357	42.66526034	20	41.788	37.21866425	0.781335748
2010	Q1	31	41.5	41.625	0.744744745	0.794106902	39.03756526	21	42.3485	33.62923613	-2.629236132
2010	Q2	43	42.25	41.875	1.026865672	1.044834676	41.15483626	22	42.909	44.8328111	-1.8328111
2010	Q3	54	46	44.125	1.223796034	1.270404066	42.50616119	23	43.4695	55.22382954	-1.223829543
2010	Q4	41	47.5	46.75	0.877005348	0.890654357	46.03357037	24	44.03	39.21551132	1.78448868
2011	Q1					0.794106902		25	44.5905	35.40962381
2011	Q2					1.044834676		26	45.151	47.17533044
2011	Q3					1.270404066		27	45.7115	58.07207546
2011	Q4					0.890654357		28	46.272	41.21235839

tips：以上大部分知识点主要来自书籍《CDA数据分析实务》的总结，同时也借鉴了文章《如何使用Python构建指数平滑模型:Simple Exponential Smoothing, Holt, and Holt-Winters》http://t.zoukankan.com/harrylyx-p-11852149.html。

你可能感兴趣的:(数据分析与挖掘,回归,python,数据分析,数据挖掘)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
python中的深拷贝与浅拷贝 anshejd70787 python
深拷贝和浅拷贝浅拷贝的时候，修改原来的对象，浅拷贝的对象不会发生改变。1、对象的赋值对象的赋值实际上是对象之间的引用：当创建一个对象，然后将这个对象赋值给另外一个变量的时候，python并没有拷贝这个对象，而只是拷贝了这个对象的引用。当对对象做赋值或者是参数传递或者作为返回值的时候，总是传递原始对象的引用，而不是一个副本。如下所示：>>>aList=["kel","abc",123]>>>bLis
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h