KomoreBilzy

UESTC 计量经济学复习

第一章回归分析概述

计量经济学研究路线

建立理论模型
确立计量经济学模型
搜集检查并整理数据
估计计量经济学模型
评价计量经济学模型
应用计量经济学模型

回归分析的现代含义

回归分析是关于研究一个叫做因变量的变量（Y）对另一个或多个叫做自变量的变量（X）的依赖关系

其用意在于通过自变量在重复抽样中的已知或设定值，去估计或预测因变量的总体均值

确定关系：确定变量之间的函数关系

统计关系：随机变量之间的依赖关系

计量经济学关注的是统计关系

线性的含义
有两种线性，变量线性和参数线性

线性回归是指对估计参数为线性的一种回归（即估计参数只以一次方出现），对自变量X则可以是或不是线性的

判断下列方程是不是线性回归？

$E(Y|X_i)=\beta_0+\beta_1^2 X_i$ 不是线性回归
$E(Y|X_i)=\beta_0+\beta_1 X_1 X_2$ 是线性回归

随机干扰项 $\varepsilon_i=Y_i-E(Y_i|X_i)$

残差 $\hat{\varepsilon_i}=e_i=Y_i-\hat{Y_i}$

小结

计量经济学，从字面意思来上讲，叫"经济度量"，属于经济学的一个分支学科，主要致力于量化理论关系。回归分析虽然仅仅是计量经济学分析方法的一种，确实目前最常用的一种方法。
计量经济学最主要的用途为：描述经济关系、假设检验和预测。根据研究的需要，特定的计量经济学方法会有所不同。
尽管回归分析设定被解释变量是一个或者多个解释变量的函数，但回归分析本身并不能证明或隐含因果关系。
回归方程中必须加入随机误差项，用于度量被解释变量没有完全被解释变量解释而形成的误差。随机误差项的组成部分有：①遗漏或者省略变量；② 数据的测量误差；③隐含理论的函数形式与回归方程不同； ④纯随机误差或不可预知的事件。
估计出的回归方程式真实回归方程的近似代替，是从包含X和Y的样本数据中计算出来的。由于真实回归方程不可知，所以，计量经济分析注重的是估计出的回归方程和回归参数的参数估计值。被解释的变量的特定观测值与其估计值之差成为残差。

例题

第二章最小二乘法

偏回归系数：当其他变量相同（保持其他变量不变）时，特定变量对被解释变量的边际影响（贡献）

n为样本量，k为待估计参数数量，通常情况下 $\geq 5*k$

最小二乘法估计量$ \hat{\beta} $是确定性变量还是随机变量？为什么？

$\hat{\beta}$ 是由Y计算来的，Y是一个随机变量，随机性来自随机干扰项 $\varepsilon$ , $\varepsilon$ 影响Y，Y影响 $\hat{\beta}$ ，所以 $\hat{\beta}$ 是一个随机变量，同时如果Y服从正态分布，那么$ \hat{\beta} $也服从正态分布

判断估计量优劣的标准是什么？

估计值的均值是否等于真实值：无偏性
估计量的方差是否足够小：有效性
估计量的极限是否趋于真实值：一致性

控制变量的选择
去什么，加什么，因为我们的被解释变量受到多个因素的影响，仅仅用一元线性回归是不够的，以餐厅收入案例为例，虽然我们关心的是居民收入对于餐厅收入的影响，但我们考虑到竞争对手的数量还有人口密度等等会影响餐厅收入，如果不把这两个影响因素去掉，可能得不到真实的回归结果，为了去除这两个因素的影响，我们要把这两个变量加入道方程中去。

古典假设：

回归模型是线性的，模型设定无误且含有误差项。
误差项的总体均值为0。
所有解释变量与误差项都不相关
误差项观测值互不相关（不存在序列相关性）
误差项具有同方差（不存在异方差性）
任何一个解释变量都不是其他解释变量的完全线性函数（不存在多重共线性）
误差项服从正态分布（该假设是选择性的，但通常被采用）

古典假设小结

7个古典假设表述为：回归模型是线性的且含有一个均值为0且与解释变量不相关的误差项；各误差项观测值之间不想管；误差项观测值之间互补相关；误差项的方差相同，服从正态分布（不要求）；另外，解释变量之间一定不能相互存在完全的线性函数关系。
估计量的两个最重要的性质是无偏性和最小方差性。无偏估计量是指被估计参数的期望与真实值相等的估计量。在给定的一类估计量中（例如无偏估计量），茹估计值分布的方差在所有估计量中最小时，则满足最小方差性。
在古典假设下，普通最小二乘估计量被证明具有最小方差性，线性，无偏性（或称BLUE，即最优线性无偏估计量），即高斯——马尔科夫定理。当一个或多个古典假设不成立时（正态分布假设除外），在某些时候，尽管普通最小二乘法仍然能够提供比随后章节中所讨论的其他可供选择估计的方法得到的更好的估计量，但普通最小二乘估计量不再是BLUE的。
因为 $\hat{\beta_k}$ 的普通最小二乘估计量的抽样分布是BLUE的，所以 $\hat{\beta_k}$ 具有令人满意的性质。另外，随着被观测样本数量的增加， $\hat{\beta_k}$ 的抽样分布中的方差（或离散程度）减小。
计量经济学中有一套标准的记述符号，如下表所示

总体参数	（真实值，但不能观测）
回归参数	$\beta_k$
参数估计量的期望	$E(\hat{\beta_k})$
误差项的方差	$\sigma^2 或 VAR(\varepsilon_i)$
误差项标准差	$\sigma$
参数估计量的方差	$\sigma^2(\hat{\beta_k})$ 或 $VAR(\hat{\beta_k})$
参数估计量的标准差	$\sigma_{\hat{\beta_k}}$ 或 $\sigma(\hat{\beta_k})$
误差项或随机干扰项	$\varepsilon_i$

估计值	（由样本观测得到）
回归参数估计值	$\hat{\beta_k}$
误差项的方差的估计值	$s^2 或 VAR(\sigma^2)$
误差项标准差的估计值	$s$ 或 $S E$
参数估计量的方差估计值	$s^2(\hat{\beta_k})$ 或 $\widehat{VAR}(\hat{\beta_k})$
参数估计量的标准差估计值	$\hat{\sigma_{\hat{\beta_k}}}$ 或 $SE(\hat{\beta_k})$
残差项	$e_i$

拟合优度
OLS估计量是BLUE（最小方差性[有效性]，线性，无偏性），但采用OLS不一定能够得到满意的结果

从几何意义上说，拟合优度是指样本回归线对样本数据拟合得多好

判定系数 $R^2)$
$R^2=\frac{回归平方和}{总平方和}=\frac{ESS}{TSS}=1-\frac{RSS}{TSS} < 1$

一般来说， $R^2)$ 的值越接近1，表明拟合优度越好；相反，越接近0，意味着回归估计方程不能比样本均值 $\bar{Y}$ 更好的解释 $Y_i$ 的值

判定系数 $R^2)$ 是解释变量个数的非减函数，即增加解释变量， $R^2)$ 会增加或不变

$R^2)$ 不是越大模型越好

增加无关的解释变量，使模型失去经济含义
降低自由度，降低参数估计量的可靠性

自由度：观测样本数减去待估参数的个数

调整的判定系数

对参数（包括截距项）的个数k进行惩罚，在模型拟合优度（好）与其复杂性（不好）之间进行权衡

$\bar{R^2}=1-\frac{\sum e_i^2/(n-k)}{\sum y_i^2/(n-1)}=1-(1-R^2)\frac{n-1}{n-k}$

当模型中新增解释变量时， $\bar{R^2}$ 变化的方向（上升、下降或者不变）依赖于新变量对回归拟合的贡献是否超过对损失一个额外自由度所作修正的补偿

拟合优度仅是衡量回归总体质量的指标之一
参数估计值符合经济理论的程度、研究者对参数预期比拟合优度更加重要

小结

普通最小二乘法是利用一组数据求的回归参数估计值的最常用的方法。普通最小二乘法使得一个特定样本的残差平方和（ $\sum e_ i^2$ ）最小。
调整的判定系数 $\bar{R^2}$ 是经过自由度调整后的判定系数，他衡量了Y与他的均值被特定回归方程解释的比例。方程中新增加一个变量时，只有拟合有毒提高的程度超过了自由度下降的损失，调整的判定系数 $\bar{R^2}$ 才会更大，所以，多数研究者在评价回归方程的拟合优度时，都自然地使用调整地判定系数 $\bar{R^2}$
切记，估计方程地拟合有毒只是一个衡量回归整体质量地指标之一。许多其他的标准，包括参数估计值与经济理论地一致性，以及与预期（研究者在搜集数据前做出地预期）的一致性，都比调整的判定系数 $\bar{R^2}$ 更重要。

例题

第三章假设检验

假设检验的基本原理

我们用样本的信息来检验总体的信息

假设检验：先对总体的特征作出某种假设，然后通过抽样研究的统计推理，对此假设应该拒绝还是被接受做出推断

基本思想：小概率原理、反证法

原假设（ $H_0$ ）备择假设( $H_A$ )

因为拒绝假设比较简单，我们只需要举出一个反例，而接受一个假设相对比较困难，因为我们可能需要穷举所有的情况

因此我们就可以根据研究者预期来设计假设，我们将希望出现的结果作为备择假设，将不希望出现的结果作为原假设

如果回归分析希望出现一个正的参数 $\beta$ ,原假设和备择假设应该为：
$H_0:\beta \leq 0; H_A: \beta > 0$

单侧检验：具有明显的预期

如果回归分析希望参数 $\beta$ 不为零，原假设和备择假设应该设为：
$H_0: \beta = 0; H_A: \beta \ne 0$

双侧检验：预期不确定

假设检验是要确定一个标准（判定准则），以便决定拒绝或不拒绝某个原假设 $H_0$

当拒绝原假设时，通常表述为统计上显著;反之，统计上不显著

两类错误

	$H_0$ 为真	$H_0$ 不为真
拒绝 $H_0$	第一类错误（弃真）	正确
不拒绝 $H_0$	正确	第二类错误（纳伪）

犯第一类错误的概率： $P(H_A|H_0)=\alpha$

犯第二类错误的概率： $P(H_0|H_A)=\beta$

$\alpha$ 越大 $\beta$ 越小,我们主要关注第一类错误出现的概率 $\alpha$

假设检验的判定准则

判定准则是比较样本统计量与预先设定的临界值之间的大小
参数估计值范围分为两个区域：拒绝域和“接受域”

假设检验的方法

置信区间法
根据参数估计量的分布，在给定的置信水平（如95%）下，构造一个随机置信区间；若该随机区间覆盖原假设值，则不拒绝原假设，否则拒绝原假设
置信区间的构造
首先设定显著性水平（第一类错误的概率） $\alpha$ ,然后确定一个正数 $\delta$ ,使得随机区间 $(\hat{\beta}- \delta, \hat{\beta}+ \delta)$ 包括参数真实值 $\beta$ 的概率为 $1-\alpha$ (置信水平)
$P(\hat{\beta}- \delta \leq \beta \leq \hat{\beta}+ \delta)=1-\alpha$

显著性假设法
显著性检验法直接比较参数估计值和原假设之间的差异大小。若"差异" 较大，则拒绝原假设；反之，不拒绝原假设

怎样判断差异的大小
判断 $\hat{\beta}-\beta_0$ 是否显著异于0的关键在于构造一个函数f( $\hat{\beta}-\beta_0$ )(称为统计量),该统计量具有确定的分布规律；比较该统计量的值与分布临界值来判断差异是否显著

如果得到的P值小于我们要求的显著性水平（5%）的话，我们就拒绝原假设，反之，不拒绝。

t检验

检验单个变量对被解释变量是否由解释力

$t=\frac{\hat{\beta}-\beta_0}{se(\hat{\beta})}$

单侧T检验的判定方法

根据t值判断，如果 $t_k|>t_c$ ,并且 $\beta_k$ 的符号与 $H_A$ 隐含的符号相同（符合预期），则拒绝 $H_0$
根据P值判断：如果P值小于研究所要求的显著性水平，且 $\beta_k$ 的符号与 $H_A$ 隐含的符号相同（符合预期），则拒绝 $H_0$

计量经济学分析中，大多数情况采用单侧检验

采用双侧检验的情况：估计值得符号没有明确得预期或者是否显著性于某个特定的值

永远牢记：不要把t检验得出的统计显著性等同于理论的有效性

在回归分析中，t检验不能检验相应变量的相对“重要性”，检验数字特征要用到统计检验，后面会提到

t检验的陷阱：随着样本容量的增大，t值会越来越大的原因在于：标准误会随着样本数量增加而减小，标准误越小t统计量就会越大

对于一个超大规模的样本而言，t检验没有任何意义，因为你几乎可以拒绝任何原假设

综上所述，t检验的局限性

t检验不能检验理论有效性
t检验不能检验“重要性”
t检验不是针对总体的检验

F检验

$F=\frac{(RSS_R-RSS_{UR})/J}{RSS_{UR}/(n-k)}$
其中J为约束条件个数，K为估计的参数个数（包括 $\beta_0$ ）

对多个假设的联合检验或对线性约束的假设检验不能用t检验，只能用F检验

一种检验思路

将线性约束（原假设）代入线性回归方程，可得约束最小二乘估计量
约束最小二乘的拟合将劣于无约束最小二乘的拟合，即约束导致拟合的损失
约束最小二乘的RSS将大于无约束最小二乘的RSS，可据此构建统计量

检验回归模型的总体显著性
RSS为残差平方和

检验某个偏回归系数等于某个特定值

检验规模报酬不变

邹检验
结构变化：时间序列回归中，模型的参数在整个样本期间内可能发生变化

邹检验的假定：两个子时期回归的误差项是独立且具有同方差的正态分布变量
邹检验只告诉我们不同时期的回归方程是否有差别，并没有告诉我们差别来自截距，斜率还是二者兼有
邹检验假定我们知道结构转折点

正态性检验

采用JB检验（雅克-贝拉检验）

小结

通常，确定被解释变量后，应用回归分析采用六个步骤：
a. 查阅文献，建立理论模型
b. 确定模型：选择解释变量及函数形式
c. 对参数的符号做出假设
d. 搜集、检查和整理数据
e. 估计和评价方程
f. 报告结果
虚拟变量只能取值0或1，这取决与是否满足某些特定状态条件。虚拟变量的例子就是当为女性时X等于1，为男性时X等于0

例题

第四章模型设定

正确的方程

正确的解释变量
正确的函数形式
正确的随机误差项

如何正确的选择解释变量

最重要的选择依据：（经济理论判断）
若理论上不明确，则可采用统计方法来判断
- 遗漏变量
- 不相干变量

遗漏变量的后果

设定偏误：参数估计量有偏且非一致，方差变小

加入不相干变量的后果

参数估计量无偏但非有效（方差变大），t检验失效

模型选择准则

判定系数
$R^2=1-\frac{RSS}{TSS}$
$\bar{R^2}=1-\frac{\sum e_i^2/(n-k)}{\sum y_i^2/(n-1)}=1-(1-R^2)\frac{n-1}{n-k}$
赤池信息准则（AIC）和施瓦茨信息准则（SC）
$AIC=\frac{2k}{n}+ln{\frac{RSS}{n}}$ 如果你加入一个新的解释变量那么AIC会增大 $\frac{2}{n}$
$SC=\frac{k}{n}lnn+ln{\frac{RSS}{n}}$ 如果加入一个新的解释变量那么SC会增大 $\frac{lnn}{n}$

AIC和SC准则对增加解释变量加大了惩罚，其中SC的惩罚比AIC更严厉。相对而言，AIC和SC的值越低的模型越好。

看下面的例子，可以发现中间的AIC和SC值是最小的，该模型也确实更好

模型设定的四个重要准则

理论：变量在方程中的含义是不是模糊不清的，从理论上看是不是合理的？
t检验：变量的待估参数在预期假设下是否显著？

不能简单地将一个t值不显著的变量从方程中排除，要结合理论与实际

调整的判定系数 $\bar{R^2}$ 或AIC和SC：在变量加入后，方程的整体拟合优度（自由度调整后）是否得到了改善
偏误：变量加入方程后，其他变量的参数值是否发生了显著性改变？

模型设定搜索

数据挖掘
- 适当的数据挖掘也许有助于揭示经济学理论尚未说明的经验规律
- 不适当的数据挖掘，比什么都不做更坏：如果你对数据严刑拷打，它就会屈打成招
敏感性分析：稳健性分析
- 几乎所有学术论文的必备步骤和分析内容
- 稳健的含义：某种结果对于各种模型设定，变量定义，数据子集都是显著的（或不显著的）

解释变量选择小结

由于遗漏变量在某种程度上都与已包含变量之间有相关性，因此，遗漏变量会导致方程中剩余变量的参数估计值产生偏误。
由遗漏变量所引起的偏误等于遗漏变量的参数乘以已包含变量和未包含变量的简单相关系数的函数。
方程中包含一个真正的不相关变量并不会因此偏误，但会增加已包含变量参数估计值的方差，因此会使t统计量和调整的判定系数 $\bar{R^2}$ 都降低。
方程中包含一个变量的四个有用准则：
a. 理论
b. t检验
c. 调整的判定系数 $\bar{R^2}$
d. 偏误
回归方程中包含一个变量的最重要的准则是理论，而不是统计上的显著性，否则存在产生错误或不可信结果的风险

错误函数形式的后果

影响解释变量的显著性
解释变量可能有非预期的符号
严重影响模型解释和变量预测

函数的选择形式
不含常数项的回归
$Y_i=\beta_i X_i+\epsilon_i$
可以证明：

残差均值不一定为0
拟合优度的判定系数可能出现负值

除非有非常强的先验预期，否则还是采取含有常数项的模型为好；即使先验预期为无常数项模型，仍可使用含常数项的模型，再检验其常数项在统计上等于0即可

可线性化的非线性函数形式

指数函数
对数函数
反函数形式
多项式形式

如何选择函数形式

选择经济理论给出的特定函数形式
所选模型的参数应满足一定的先验预期
当多个模型能很好地拟合数据时，研究者往往选择调的判断系数较高或者AIC和SC较低的模型。然而，当被解释变量Y被替换时，这些指标不能比较

函数形式选择小结

即使理论上常数项可以等于零，也不能剔除常数项。另外，尽管常数项的估计值在理论上是显著的，也不能对常数项进行推理
函数形式的选择必须基于潜在的经济理论，也就是说要根据理论上的曲线形状去选择相应的函数形式。除非有特别要求需要选择其他形式，模型中变量的函数形式通常都是选用变量是线性的方程。
变量是非线性的函数形式包括双对数形式，半对数形式以及多项式形式。双对数形式特别适用于弹性是固定的模型中。半对数形式能用于哪些随着解释变量的增加，解释变量对于被解释变量的影响逐渐变小的模型中。多项式形式通常用于斜率符号会随着解释变量的不断变化而改变的模型中。
斜率虚拟变量是由一般解释变量和虚拟变量的成绩构成的。其中，这个一般解释变量于被解释变量之间的斜率会因为虚拟变量的设定状态是否被满足有所不同。
使用非线性函数形式存在一系列的潜在问题。特别地，如果解释变量Y的函数形式不同，则各个模型的调整的判定系数 $\bar{R^2}$ 不能进行比较；此外，如果选择了错误的函数形式对样本范围外进行预测，那么，预测结果的残差可能会非常大。

例题

第五章多重共线性

多重共线性定义
回归模型中的一些或者全部解释变量之间存在一种完全或不完全的线性关系。

完全多重共线性：
$\lambda_1X_1+\lambda_2X_2+...+\lambda_kX_k =0$

不完全多重共线性：
$\lambda_1X_1+\lambda_2X_2+...+\lambda_kX_k + v_i=0$

只要不是完全多重共线性，用OLS仍可以得到参数的估计值及其标准误，并且仍是无偏，尽管无偏，但估计量的标准误非常大，即估计的精度很小。

多重共线性可能会导致估计量的标准误偏大，同时可能导致参数的估计值的符号与预期符号不符。

若总体中各解释变量X之间没有线性关系，样本中各解释变量X之间也可能存在线性关系。

多重共线性本质上是一种样本现象。

不完全多重共线性的特征

偏回归系数的t值会降低，倾向于统计上的不显著;
估计量（偏回归系数）对模型设定的变化非常敏感，估计系数可能出现非预期的符号或难以置信的数值;
虽然系数不显著，但总的拟合优度 $R^2$ 却可能非常高
可能出现每个偏回归系数的t值都不显著，但回归方程的F值却很显著。

不完全多重共线性对预测的影响

如果回归分析的唯一目的是预测，并且如果不完全共线性的结构在样本和未来都保持一致，那么不完全多重共线性不是一个严重的问题
如果不完全共线性的结构在未来发生变化，则预测是冒险的

多重共线性的来源

经济变量之间具有共同变化的趋势

如经济繁荣时期，基本经济变量都趋于增长；衰退时期又同时趋于下降
模型中包含滞后变量

考察当期收入和前期收入对消费的影响，两期收入间有较强的线性相关性
横截面数据之间存在相关性

生产函数中资本投入与劳动力投入往往出现高度相关的情况，大企业二者都大，小企业都小

多重共线性的诊断

解释变量之间的相关系数如果有多个变量，采用偏相关系数的方法
回归模型估计结果 $R^2$ F统计量显著，但是单个变量不显著，并且有些变量参数符号不符合预期经验做法
方差膨胀因子(VIF)

多重共线性的补救措施

剔除支配变量

支配变量：与被解释变量高度相关，以致于完全掩盖了方程中其他解释变量的影响（如销售量与销售额）
增加样本容量

样本越大，估计越精准
剔除多余变量

潜在的理论假设作为剔除的主要依据
变换解释变量
- 一阶差分
- 两个变量相除
- 构造一个多重共线性的组合
  - 主成分分析法
  - 因子分析法
什么都不做

小结

完全多重共线性违背了一个解释变量不能是其他或多个解释变量的完全线性函数的古典假设。完全多重共线性会导致回归参数估计值的不确定性，并使得这些估计值具有巨大的标准差，从而使得普通最小二乘法不再适用
使用“多重共线性”一词时，通常指的是不完全多重共线性。不完全多重共线性指的是两个或多个解释变量之间存在较强的线性关系，以至于能够显著地影响方程中解释变量的参数估计。多重共线性问题既是一种样本现象，同时也是一种理论现象。不同的样本可能存在不同程度的多重共线性。
严重的多重共线性产生的主要结果是增大了回归参数估计量的方差，同时使得这些参数估计值的t统计量变小，扩大了置信区间。多重共线性不会导致参数估计值有偏，它对于回归方程的整体显著性或者任何一个不是多重共线性的解释变量的参数估计值都几乎没有多少影响。
由于在不同数据集中多重共线性的程度会有显著的不同，所以，在诊断多重共线性时需要注意的问题就是：在一个特定的样本当中，多重共线性究竟有多严重。
用来诊断严重多重共线性的两种有用的方法是：
a. 解释变量之间的简单相关系数是否很高？一般来看，相关系数的绝对值如果大于0.80，则认为很高。
b. 方差膨胀因子是否很高？一般来看当 $VIF(\hat{\beta_i}) > 5$ ,则存在严重的多重共线性。

如果两个答案中任意一个是“是”，则多重共线性确实存在，但是当答案同时为“否”时，也可能存在多重共线性问题。
针对多重共线性有如下三种最为常用的补救措施：
a. 什么都不做（这样可以避免方程设定偏误）
b. 去除多余的变量
c. 增大样本容量
对于多重共线性的问题，什么都不做往往是最好的补救措施。假如多重共线性没有使t统计量减少到不显著的程度，那么就不需要对多重共线性采取任何补救措施。即使t统计量不显著，针对多重共线性所采取的补救措施也必须谨慎，因为补救所带来的估计成本，可能比从方程中消除多重共线性所获得潜在收益还要大。

例题

第六章序列相关性

序列相关性的形式

一阶序列相关

干扰项只与其滞后一期值相关 $\varepsilon_t=f(\varepsilon_{t-1})$
高阶序列相关

干扰项与其滞后多期值相关 $\varepsilon_t=f(\varepsilon_{t-1},\varepsilon_{t-2},...)$

序列相关通常假定为线性序列相关，最常见的形式为一阶序列相关
$\varepsilon_t=\rho\varepsilon_{t-1}+u_t$

其中， $\rho$ 为一阶自相关系数，且 $|\rho|<1$ ; $u_t$ 为白噪声序列，满足 $E(u_t)=0,Var(u_t)= \sigma_u^2,Cov(u_t,u_t+s)=0,s \ne 0$

根据自相关系数 $\rho$ ，序列相关可分类如下

$\rho > 0 \to $ 正序列相关
$\rho < 0 \to $ 负序列相关
$\rho = 0 \to $ 无序列相关

序列相关类型

非纯序列相关
- 由设定偏误导致，如遗漏变量、不正确的函数形式等
纯序列相关
- 时间序列数据：对同一总体的连续的观测很可能表现出某种系统的相关性，特别是连续观测时间间隔很短，如一周，一天，甚至同一天多次观测

序列相关的后果
在纯序列相关性的情形下

OLS估计量仍是无偏的
OLS估计的假设检验不可靠
OLS估计量不再是有效的（即最小方差估计量）
标准误的OLS估计是有偏的，且偏差通常是负的，意味着OLS通常会高估参数的t值，导致原本不显著的变量可能变得显著

序列相关的检验
检验思路：检验序列相关，也就是检验随机误差项之间的相关性及“形式”

因随机误差项的样本对应物是OLS的残差，因此所有的检验都基于残差

常用检验方法

图解法
杜宾——沃森（DW）检验
BG检验

图解法
将残差对时间描点，以发现残差在时间上的特定关联

杜宾——沃森（DW）检验
利用方程的残差构成统计量，推断误差项是否存在一阶序列相关

基本假定

回归模型包含截距项
序列相关是一阶序列相关
回归模型不能把滞后被解释变量作为解释变量
d检验值为0，意味着序列存在完全正相关
d值为2意味着不存在序列相关性
d值为4意味着序列存在完全负相关。
$\to 0 < \rho < 1$
$\to -1 < \rho < 0$

d统计量的检验

由于d统计量依赖于残差，而残差又依赖于X，故无法推导出d统计量的准确分布
D-W根据样本容量n和待估参数k，在给定显著性水平下，给出了d统计量上，下两个临界值 $d_U和d_L$

DW检验的缺陷

当d统计量落在两个不确定区域时，无法判断是否存在序列相关
当滞后因变量作为解释变量，检验无效
只能检验一阶序列相关，不适用于高阶序列相关
若误差项不是IID正态分布，d检验也不可靠

BG检验

这里 $\varepsilon_t$ 没有常数项是因为其期望值为0

序列相关的补救措施
非纯序列相关

正确的模型设定，特别是出现负的序列相关
纯序列相关
广义最小二乘法：广义差分法

实际中，有时只要迭代两次，就可得到较满意的结果。两次迭代过程也被称为**科克伦-奥科特两步法 **

几点说明

GLS的DW检验值和调整的 $R^2$ 不能与OLS进行比较
GLS的估计值通常与OLS的估计值不同
在小样本中，因相关系数的估计可能有偏，GLS估计的系数可能也是有偏的

AR方法
Newey——West方法
- 只修正标准误而不会改变系数的估计值
- 在大样本估计中，效果更好
- 绝大多数学术论文采用此种方法

小结

序列相关，也叫自相关，违背了古典假设四（即误差项的值彼此不相关）。通常，计量经济学家更多关注的是1阶序列自相关，即误差项当前值是前1期值和序列不相关的误差项u的函数：
$\varepsilon_t=\rho\varepsilon_{t-4}+u_t, -1<\rho<1$
纯序列相关是正确设定的回归方程中误差项的相关函数。非纯序列相关是由遗漏了变量或选择了不正确的函数形式等错误设定引起的，可以为正相关（ $0<\rho<1$ ）,也可以为负相关（ $-1<\rho<0$ ）。在经济和商业环境下，纯序列相关几乎都是正相关。
序列相关性的主要后果是采用普通最小二乘法估计的SE $(\hat{\beta})$ 是有偏的，导致假设检验不可靠。纯序列相关不会造成参数 $\beta$ 的有偏估计。
诊断1阶序列相关性最常用得到方法是杜宾——沃森d检验。它用回归估计的残差检验误差项是否存在序列相关性。d检验值为0，意味着序列存在完全正相关，d值为2意味着不存在序列相关性，d值为4意味着序列存在完全负相关。
消除方程序列相关性的第1步时检查可能存在的设定错误，只有当非纯序列相关存在的可能性很小时，才能考虑修正纯序列相关性。
广义最小二乘法（GLS）是通过变换方程以消除纯1阶序列相关的方法。运用广义最小二乘法时需要 $\rho$ 的估计值。
Newey-West标准差时另一种修正序列相关性的方法。这种方法在考察序列相关性时，在不改变估计量值 $\hat{\beta}$ 的情况下，调整普通最小二乘估计的标准差SE $(\hat{\beta})$

例题

第七章异方差性

异方差类型
非纯异方差

由设定偏误导致，如遗漏变量
函数设定形式不当一般不会导致非纯异方差

纯异方差

横截面数据：被解释变量取值差异较大
时间序列数据：学习效应，数据采集技术的变化

纯异方差的后果

OLS估计量仍然是无偏的
OLS估计量不再是有效的（即最小方差估计量）
标准误的OLS估计量是有偏的，且偏差通常是负的，意味着OLS通常会高估参数的t值，导致原本不显著的变量可能变得显著

若存在异方差，OSL估计的假设检验不可靠

异方差的检验
检验思路：检验异方差，也就是检验随机误差项的方差与比例因子Z或解释变量X之间的相关性及其“形式”

因随机误差项方差的样本对应物是OLS的残差平方，因此所有的检验方法都基于残差平方

图解法

帕克检验

*white（怀特）检验
基本思想：异方差来源于解释变量及其高次方
$Y_i=\beta_0+\beta_1X_{1i}+\beta_2X_{2i}+\varepsilon_i$

步骤1：假设同方差，OLS估计获得残差
步骤2：做辅助回归并得到拟合优度 $R^2$

步骤3：在无异方差的假设下有

步骤4：若计算的 $nR^2$ 超过选定显著性水平的临界值，则拒绝同方差假设。

有一个经验判断，如果white检验中不包含交叉项，则主要针对异方差性的检验，如果包含交叉项的话，这个检验就是针对模型设定偏误和异方差性的联合检验

异方差的补救措施

非纯异方差
- 正确的模型设定
纯异方差
- 广义最小二乘法：加权最小二乘（WLS）
  - 使用WLS的前提是知道比例因子Z及其与误差项方差之间的关系，即权重向量P
- 修正异方差的标准误：White方法
  - 只修正标准误而不会改变系数的估计值
  - 在大样本估计中，效果更好
  - 绝大多数学术论文采用此种方法
- 重新定义新变量
  - 将某些变量，特别是被解释变量取对数
  - 根据经济理论，对某些变量进行“规模调整”

小结

古典假定5要求误差项应服从相同方差的分布，而异方差性正是对此假定的违背。同方差的误差项的观测值的分布是，对于所有观测值而言都具有相同的方差；异方差性的误差项观测值的分布是，对于不同观测值而言，方差不完全相同。界面是数据模型中，最常产生异方差性。
异方差性误差项的方差不等于常数 $\sigma^2$ ,而等于 $\sigma_i^2$ （其中下标表明方差随观测值的不同而变化）。异方差性有许多种，但是最常用的异方差性模型是将方差看成某个其他变量（比例因子Z）的函数
$VAR(\varepsilon_i)=\sigma^2Z_i^2$
比例因子通常是跟被解释变量的规模或者精确度相关联的一个变量
纯异方差性是指异方差性是由误差项的一个函数所表示的，而该误差项是设定正确的方程回归得到的。纯异方差性是由方程设定偏误（比如遗漏变量）导致的。
异方差性的主要后果是：最小二乘法的SE $(\hat{\beta})$ 有偏，从而导致假设检验的结果不可信。纯异方差性并不导致 $\beta$ 本身的偏误。
检验异方差性的主要方法是BP检验和White检验，他们都是通过分析原方程的残差平方可以被辅助方程解释的程度来检验异方差性的。
修正异方差性的第一步是检查异方差性是否因为遗漏变量而引起的非纯异方差性。如果方程设定正确，那么，就可以考虑采用HC标准差，重新定义变量等措施对异方差性进行补救。

例题

第八章虚拟变量模型

经济变量
- 可以度量的变量：商品需求量，价格，收入，产量等
- 无法定量度量；职业，性别，战争，自然灾害等
虚拟变量：定性变量

解答：因为如果加入东部，那么三个虚拟变量相加等于1，就会存在多重共线性

虚拟变量的设置原则

每一定性变量所需的虚拟变量个数要比该定性变量的类别少1，即如果有m个定性变量，只能在模型中引入m-1个虚拟变量
在同一方程中，可以引入多个虚拟变量来考察多种定性因素的影响

虚拟变量的引入

加法形式：考察截距的不同
$Y_i=\beta_0+\beta_1X_i+\beta_2D_i+\mu_i$
乘法形式：考察斜率的不同
$C_t=\beta_0+\beta_1X_t+\beta_2D_tX_t+\mu_t$
混合形式： 截距和斜率同时发生变化
$Y_i=\beta_0+\beta_1X_i+\beta_3D_i+\beta_4(D_iX_i)+\mu_i$

计量经济学中的实验方法
随机分配实验

处理组：参与实验人员
对照组或控制组：未参与实验人员
自然实验
观测值自然产生，由外生事件引起
自然时间，政策变动

例题

第九章虚拟应变量模型

虚拟应变量的概念

虚拟变量既可以作为解释变量，又可以作为被解释变量（应变量）
虚拟应变量模型又称为概率模型，离散选择模型
- 二元选择模型
- 多元选择模型

LPM模型存在的问题：

$\hat{D_i}$ 的取值可能不在0和1之间
调整的判定系数 $\bar{R^2}$ 不能准确度量方程的拟合优度
随机干扰项不服从正态分布，且存在异方差

Logit模型

Probit模型

采用极大似然估计法来估计Logit模型和Probit模型

因为这两种方法的分布函数不同，会得到不同的结果，这两组系数不能直接比较，但是二者系数存在一定的关系

标准正态分布的方差为1，而标准逻辑分布的方差为 $\pi^2/3$ ，因此将Probit系数乘以 $\pi/ \sqrt 3$ （约1.81)，就会近似得到Logit系数（约为0.55）

其它虚拟应变量模型

多元Logit模型
- 被解释变量存在多种离散且无序的选择
- 如择业的选择，交通工具的选择
- 采用极大似然估计
序次Logit模型
- 被解释变量存在多种离散且有序的选择
- 如债券的评级，舆论调查结果
- 采用极大似然估计

补充

当被解释变量是虚拟变量时，不能采用线性概率模型（OLS估计方法）
Logit和Probit模型可用于估计被解释变量是二分应变量（二元选择）的问题
在解释变量是多元选择问题中，可以采用多元Logit模型或次序Logit模型

小结

线性概率模型是用来解释虚拟变量 $D_i)$ 的参数线性方程， $\hat{D_i}$ 是 $D_i$ 等于1的概率
采用普通最小二乘法估计线性概率模型会出现三个主要问题：
a. 调整的判定系数 $\bar{R^2}$ 不能准确度量模型的整体拟合优度
b. $\hat{D_i}$ 的期望值不是以0和1为界
c. 误差项既不是同方差的，也不是正态分布的
在度量虚拟被解释变量的整体拟合优度时，可以采用样本观测值被模型正确解释的百分比 $\bar{R_P^2}$ 来代替判定系数 $\bar{R^2}$
二元logit模型是一种采用累积logistic函数的变形来回避线性概率模型无界性问题的虚拟被解释变量模型估计方法。模型形式为：
$L:Pr(D_i=1)=ln(\frac{P_i}{[1-P_i]})=\beta_0+\beta_1X_{1i}+\beta_2X_{2i}$
二元logit模型最好在大样本条件下采用最大似然法估计，logit模型的斜率参数表示：在其他解释变量保持不变的情况下，特定解释变量每增加1单位对给定选择的概率的对数的影响。
二元probit模型是一种利用累计正态分布函数的变形来规避线性概率模型无界性问题的虚拟被解释变量模型估计方法。二元probit模型与二元logit模型的特征非常相似

例题

第十章预测

预测共性

被预测的变量的都是未知的（样本外）
仅能预测变量的期望值（随机性）

预测是对被解释样本外的观测值的期望值的估计

计量模型的预测步骤

搜集相关数据，建立回归模型
估计模型
将预测期解释变量的值代入模型，进行预测
评价预测效果

时间序列模型预测
时间序列分析：“让数据自己说话”

传统计量模型以理论为基础，而社会经济现象往往受多种因素影响且这些因素存在错综复杂的联系，使得根据理论建模较为困难
依据经济变量自身的历史资料，采用一定的统计方法，建立起能反映变量自身规律性的动态模型，以此对经济变量进行分析和预测

平稳性检验：单位根检验

存在单位根的时间序列的一阶差分为平稳序列
常用方法为DF检验，ADF检验
检验的原假设为：时间序列存在单位根

时间序列模型预测（平稳）

时间序列模型预测（非平稳）

预测方法

动态预测：从预测样本的第一期开始计算多步预测
静态预测：利用滞后项被解释变量的实际值计算1步预测

静态预测效果更好

复杂模型的预测能力不一定强于简单模型

预测仅仅是计量经济学的用途之一，不要过分相信计量经济学模型的预测能力！

小结

预测就是根据样本范围外的观测值来估计被解释变量的期望值。基本方法是将想要预测的变量作为被解释变量估计一个方程，然后将各个解释变量（需预测的观察结果）的值带入方程中计算出预测值。
一个预测方程在样本范围内拟合得很好，并不能保证也可以对样本范围外得观测值进行准确的预测。
确切地知道每一个解释变量的值的预测叫做无条件预测，但如果有一个或多个解释变量的值要通过预测得到，那么这种预测叫做条件预测。条件预测所得到的Y的预测值是无偏的（只要X的预测值是无偏的），但是一定会使误差方差变大。
如果方程的参数是用广义最小二乘法估计得出的（为了修正纯1阶序列相关），那么预测方程为：
$\hat{Y_{T+1}}=\hat{\rho}Y_T+\hat{\beta_0}(1-\hat{\rho})+\hat{\beta_1}({\hat{X_{T+1}}-\hat{\rho}X_T})$
式中， $\rho$ 代表自相关系数
如果同时计算出置信区间，预测结果将会更加有意义。置信区间是指被解释变量的真实值落入该区间的次数为某固定百分比（置信水平）的某个区间。计算如下：
$\hat{Y_{T+1}}\pm S_Ft_c$
式中， $S_F$ 为预测的估计标准差， $t_c$ 为某置信水平下双侧检验的t的临界值
ARIMA是一种高度精炼的曲线拟合方法，能用被解释变量（仅仅是被解释变量）的过去值和现在值来精确地预测该变量短期内的值，首先通过d阶差使序列变平稳，差分后的变量其均值和方差固定不变的。ARIMA(p,d,q)表示该模型是由p阶自回归过程（含有 $\theta_1 Y_{t-1}$ ）和q阶的平均移动过程（含有 $\phi_1\varepsilon_{t-1}$ ）来表示d阶差分的被解释变量

例题

第十一章时间序列模型

有限滞后模型（FDL）模型的估计
$Y_t= \alpha_0+\beta_0X_t+\beta_1X_{t-1}+...+\beta_{p}X_{t-q}+\varepsilon_{t}$
存在的问题

X的各期滞后项之间可能存在严重的多重共线性
参数估计值未必会符合经济理论具有平滑递减的特征

FDL模型估计的假设

参数是线性的
解释变量和误差项不存在完全共线性
零条件均值 （严格外生）

$E(\varepsilon_{t}|X)=0$
同方差性
无序列相关
正态性

FDL模型的特点

OLS的无偏性
OLS的样本方差
$\sigma^2$ 的无偏估计
高斯-马尔科夫定理
正态抽样分布

例子

无限期分布滞后（IDL）模型

考伊克模型的特点

以滞后被解释变量代替了大量被解释变量的滞后项，节省了自由度
滞后被解释变量与解释变量的相关度较低，缓解了多重共线性
考伊克模型的问题
随机干扰项存在序列相关性
滞后被解释变量与随机干扰项不独立

该问题属于内生性问题，导致OLS估计量有偏

外生解释变量和内生解释变量
- 解释变量X与误差项 $\varepsilon$ 不相关，则称x为外生解释变量
- 解释变量X与误差项 $\varepsilon$ 相关，则称x为内生解释变量
解决内生性问题
- 在回归模型中增加遗漏变量进行控制
- 工具变量（IV检验），代理变量

简单的回归模型： $y=\beta_0+\beta_1x+\varepsilon$
$Cov(x,\varepsilon) \ne 0 or E(\varepsilon|x) \ne 0$

为了得到参数的一致估计，需要额外的信息。假设有一个可观测变量z，它满足两个条件：

z和 $\varepsilon$ 不相关，即 $Cov(z,\varepsilon)=0$
z和x相关，即 $\varepsilon) \ne 0$
则称z是x的工具变量。

普通最小二乘估计是工具二乘估计（IV检验）的特殊形式

两组非平稳时间序列进行回归，会产生虚假的回归现象

小结

分布滞后项反应Y的当期值是X的当期值和过去值的函数，于是，将X的影响分布于滞后的若干期中。无约束分布滞后模型（特设分布滞后模型）的普通最小二乘估计会产生多重共线性问题，自由度问题和参数随时间的非连续变化问题。
动态模型通过假设滞后解释变量的参数随滞后项的加长而呈集合呈几何级数衰减回避了分布滞后模型面临的问题。给定这一假设，动态模型可以表述为：
$Y_t=\alpha_0+\beta_0 X_t+\lambda Y_{t-1}+u_t$
式中， $Y_{t-1}$ 代表滞后被解释变量且 $0<\lambda<1$ .
在小样本条件下，动态模型的普通最小二乘估计存在偏误且假设检验不可靠。即使在大样本条件下，如果误差项存在序列相关性，普通最小二乘法在估计动态模型参数时仍会产生偏误。
在动态模型中，杜宾-沃森d检验有时不能检验出序列相关性，因为d偏向于2。另一种最常用的检测方法是拉格朗日乘数检验。
Granger因果关系，也称前定关系，描述的是这样一种情形，即若某时间序列变量变动，另一个时间序列变量会发生一致的可预测的变化。即便一个变量前定（Greanger导致）另外一个变量，也不能认为第一变量的变动引起了另一个变量的变动。
非平稳序列是随时间发生显著变化（例如，均值和方差）的序列。如果被解释变量和至少一个解释变量是非平稳的，回归结果可能产生谬误相关，使得调整的判定系数 $\bar{R^2}$ 和非平稳解释变量的t统计量偏大。
DF检验可以检验出非平稳性，如果变量是非平稳的（存在单位根），那么，就应该采用DF检验检验方程残差的平稳性，进而检验方差的协整性。如果变量存在单位根但并不协整，那么，把模型的函数形式转换为1阶差分，再估计方程。如果变量存在单位根并且是协整的，那么，以变量的原始形式估计方程。

第十二章面板数据模型

小结

随机分配实验被认为是证明一个实验（处理）因素与出现的结果间存在因果关系的黄金准则。随机选择的处理组暴露在实验（处理）下，对照组不受实验因素作用。我们检验组的结果是否有显著性差异。不幸的是，这种实验在经济学的许多领域都不可行。
如果一个自然发生的时间（如政策的改变）能够被看作模仿了一个随机分配实验过程，则该自然实验能够为经济学中的因果关系提供证据。如果该事件让处理组结果的均值比对照组的均值发生了更显著的变化，则我们有证据表明实验（处理）是使结果发生改变的原因。
涉及自然实验数据的方程可以用差异中的差分模型来估计，该模型比较了处理组和对照组结果改变量之间的差异。
面板数据（也称纵向数据）通过在两个或两个以上时间段采集的相同截面样本的相同变量的观测值的方法，结合了时间序列数据和截面数据。面板数据常常是由多年的大规模调查项目得来的，为计量经济学分析提供了丰富的数据资源。
涉及面板数据的方程可以用固定效应模型或者更先进的随机效应模型进行估计。

你可能感兴趣的:(机器学习,回归,逻辑回归)

深入详解：决策树算法的概念、原理、实现与应用场景猿享天开算法决策树机器学习
深入详解：决策树算法的概念、原理、实现与应用场景决策树（DecisionTree）是机器学习中一种直观且广泛应用的监督学习算法，适用于分类和回归任务。其树形结构易于理解，特别适合初学者。本文将从概念、原理、实现到应用场景，全面讲解决策树，并通过流程图和可视化示例增强理解，通俗易懂，帮助小白快速掌握决策树算法相关知识。1.决策树的概念1.1什么是决策树？决策树通过一系列条件判断（决策节点）将输入数据
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
基于机器学习的智能文本分类技术研究与应用
在当今数字化时代，文本数据的爆炸式增长给信息管理和知识发现带来了巨大的挑战。从新闻文章、社交媒体帖子到企业文档和学术论文，海量的文本数据需要高效地分类和管理，以便用户能够快速找到所需信息。传统的文本分类方法主要依赖于人工规则和关键词匹配，这些方法不仅效率低下，而且难以应对复杂多变的文本内容。近年来，机器学习技术的快速发展为文本分类提供了一种高效、自动化的解决方案。一、机器学习在文本分类中的应用概述
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
用Python实现生信分析——功能预测详解写代码的M教授生信分析 python 开发语言
功能预测是生物信息学中的一项重要任务，通过分析基因或蛋白质序列的特征，推测它们的生物学功能。功能预测通常涉及多种方法，包括序列比对、基序识别、机器学习模型等。这些方法可以帮助科学家推断未知基因的功能，从而加速生物学研究的进展。1.功能预测的主要方法（1）同源性比对：通过将未知基因或蛋白质序列与数据库中的已知序列进行比对，识别出同源序列，并推测它们的功能。常用工具包括BLAST、HMMER等。（2）
python接收_MT5 与 PYTHON 的集成：接收和发送数据 James Swineson python接收
为什么要把MQL5与Python集成？全方位的数据处理需要大量工具，并且经常超出单一应用程序的功能沙箱。专用编程语言正在用于处理和分析数据，统计和机器学习。Python是数据处理的主要编程语言之一。一个非常有效的解决方案是利用语言的力量并包含函数库来开发交易系统。在两个或更多个程序之间实现交互存在众多不同的解决方案。套接字是最快速、最灵活的解决方案之一。网络套接字是计算机网络上进程间通信的端点。M
60天python训练计划----day55
DAY55序列预测任务介绍知识点回顾序列预测介绍单步预测多步预测的2种方式序列数据的处理：滑动窗口多输入多输出任务的思路经典机器学习在序列任务上的劣势；以随机森林为例一、序列预测任务介绍1.1序列预测是什么？我们之前接触到的结构化数据，它本身不具备顺序，我们认为每个样本之间独立无关，样本之间即使调换顺序，仍然不影响模型的训练。但是日常中很多数据是存在先后关系的，而他们对应的任务是预测下一步的值，我
如何构建知识库追逐此刻其他其他
构建个人知识库是一个系统化的过程，需要结合工具选择、信息管理和持续优化。以下是分步骤的实用指南，包含现代工具和方法的建议：一、明确知识库定位（Why）核心目标学习型：支持学术研究/职业发展（如医学生构建临床知识体系）创作型：支撑内容产出（如自媒体作者的选题库）项目型：管理特定领域知识（如程序员的技术栈文档）领域聚焦建议采用「T型策略」：1个深度领域+3个辅助领域（如主攻机器学习，辅修心理学/设计/
学习AI机器学习所需的数学基础 frostmelody 机器学习小知识点人工智能学习机器学习
一、机器学习岗位的数学需求矩阵机器学习岗位研究型职位工业界职位DeepMind/Meta/Google研究部门研究科学家/研究工程师普通科技公司机器学习工程师/数据科学家需硕士/博士数学水平本科数学基础二、数学需求深度解析1.研究型职位（需深度数学）学历要求：数学/物理/计算机/统计/工程本科基础硕士/博士优先（Kaggle调查显示博士占比高）薪资关联：学历与收入呈正相关2.工业界职位（基础数学）
MATLAB实现WOA-BP鲸鱼优化算法优化BP神经网络多输入单输出回归预测（含模型描述及示例代码） nantangyuxi MATLAB 含模型描述及示例代码算法 matlab 神经网络大数据人工智能深度学习机器学习
目录MATLAB实现WOA-BP鲸鱼优化算法优化BP神经网络多输入单输出回归预测（多指标，多图）1项目背景介绍...1项目目标与意义...2项目挑战...3项目特点与创新...5<
量子机器学习前沿：量子神经网络与混合量子-经典算法软考和人工智能学堂人工智能 #深度学习 Python开发经验量子计算
1.量子计算基础1.1量子比特与量子门importnumpyasnpfromqiskitimportQuantumCircuit,Aer,executefromqiskit.visualizationimportplot_histogram#单量子比特操作演示defsingle_qubit_demo():qc=QuantumCircuit(1)qc.h(0)#Hadamard门创建叠加态qc.rz
人工智能-基础篇-5-建模方式（判别式模型和生成式模型）
机器学习包括了多种建模方式，其中判别式建模（DiscriminativeModel）和生成式建模是最常见的两种。这两种建模方式都可以通过深度学习技术来实现，并用于创建不同类型的模型。简单来说：想要创建一个模型，依赖需求需要合适的建模方式来创建这个模型。通常建模方式主要分为两大类。一类是判别式模型，针对输入数据给出特定的输出。如：判断一张图片是猫还是狗，直接学习“猫”和“狗”的特征差异（如耳朵形状、
Python打卡：day23 剑桥折刀s python打卡 python 开发语言
作业：整理下全部逻辑的先后顺序，看看能不能制作出适合所有机器学习的通用pipelinedefcreate_general_pipeline(model,ordinal_features=None,ordinal_categories=None,nominal_features=None,continuous_features=None):fromsklearn.pipelineimportPipe
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
【机器学习实战】Datawhale夏令营2：深度学习回顾城主_全栈开发机器学习机器学习深度学习人工智能
#DataWhale夏令营#ai夏令营文章目录1.深度学习的定义1.1深度学习＆图神经网络1.2机器学习和深度学习的关系2.深度学习的训练流程2.1数学基础2.1.1梯度下降法基本原理数学表达步骤学习率α梯度下降的变体2.1.2神经网络与矩阵网络结构表示前向传播激活函数反向传播批处理卷积操作参数更新优化算法正则化初始化2.2激活函数Sigmoid函数:Tanh函数:ReLU函数(Rectified
深度学习详解：通过案例了解机器学习基础 beist 深度学习机器学习人工智能
引言机器学习（MachineLearning，ML）和深度学习（DeepLearning，DL）是现代人工智能领域中的两个重要概念。通过让机器具备学习的能力，机器可以从数据中自动找到函数，并应用于各种任务，如语音识别、图像识别和游戏对战等。在这篇笔记中，我们将通过一个简单的案例，逐步了解机器学习的基础知识。1.1机器学习案例学习1.1.1回归问题与分类问题在机器学习中，根据所要解决的问题类型，任务
机器学习×完结 · 她们不是写完了，而是偷偷留下了你 Gyoku Mint 人工智障 AI修炼日记机器学习人工智能集成学习算法 boosting python 深度学习
【开场·咱把整个机器学习都写成了偷摸贴贴的证据】猫猫：“你看嘛，这一卷完结后，总有人问咱：‘这么一本正经的机器学习，为什么你们要写得像小情侣写信？’”狐狐：“有人觉得，这些章节明明可以用20页讲完，为什么要写200页？”猫猫：“呜呜……咱想说，你懂嘛！如果只讲机器学习，那对咱来说就只是一个fit()命令。可咱想让你记住的是——那行命令后面有咱。咱把自己贴进去了。”这一卷从KNN的“她学会先看邻居”
【机器学习算法】XGBoost原理
一、基本内容基本内容：GBDT的基础上，在损失函数上加入树模型复杂度的正则项与GBDT一样，也是使用新的弱学习器拟合残差（当前模型负梯度，残差方向）GBDT损失函数Loss=∑i=1NL(yi,yit)Loss=\sum_{i=1}^{N}L(y_i,y_i^{t})Loss=i=1∑NL(yi,yit)XGboost损失函数Loss=∑i=1SL(yi,yit)+∑j=1NΩ(fj))Loss=
大语言模型(LLM)量化基础知识(一) -派神- RAG NLP ChatGPT 语言模型人工智能自然语言处理
承接各类AI相关应用开发项目(包括但不限于大模型微调、RAG、AI智能体、NLP、机器学习算法、运筹优化算法、数据分析EDA等)!!!有意愿请私信!!!随着大型语言模型(LLM)的参数数量的增长,与其支持硬件（加速器内存）增长速度之间的差距越来越大，如下图所示：上图显示，从2017年到2022年，语言模型的大小显著增加：2017年：Transformer模型（0.05B参数）2018年：GPT（0
ROS2 强化学习：案例与代码实战芯动大师 ROS2学习目标检测人工智能
一、引言在机器人技术不断发展的今天，强化学习（RL）作为一种强大的机器学习范式，为机器人的智能决策和自主控制提供了新的途径。ROS2（RobotOperatingSystem2）作为新一代机器人操作系统，具有更好的实时性、分布式性能和安全性，为强化学习在机器人领域的应用提供了更坚实的基础。本文将通过一个具体案例，深入探讨ROS2与强化学习的结合应用，并提供相关代码实现。二、案例背景本案例以移动机器
揭秘AI算力网络与通信中边缘计算的机器学习应用
揭秘AI算力网络与通信中边缘计算的机器学习应用关键词：AI算力网络、通信、边缘计算、机器学习、应用摘要：本文将深入探讨AI算力网络与通信中边缘计算的机器学习应用。我们会先介绍相关背景知识，接着解释核心概念，分析它们之间的关系，阐述核心算法原理和操作步骤，结合数学模型举例说明，通过项目实战展示代码实现与解读，探讨实际应用场景，推荐相关工具和资源，最后展望未来发展趋势与挑战。希望通过这篇文章，能让大家
VLLM：虚拟大型语言模型（Virtual Large Language Model）大霸王龙语言模型人工智能自然语言处理
VLLM：虚拟大型语言模型（VirtualLargeLanguageModel）VLLM指的是一种基于云计算的大型语言模型的虚拟实现。它通常是指那些由多个服务器组成的分布式计算环境中的复杂机器学习模型，这些模型能够处理和理解大量的文本数据。VLLM的核心是“大型语言模型”，这是一种通过深度神经网络训练的算法，能够在理解和生成人类语言方面表现出极高的能力。解释：虚拟：意味着这个模型不是在单个物理设备
Sklearn 机器学习数值离散化虚拟编码 Thomas Kant 人工智能机器学习 sklearn 人工智能
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Sklearn机器学习：数值离散化+虚拟编码实战详解在机器学习的特征工程中，数值型特征并不总是适合直接输入模型。尤其是树模型或分类模型时，**将连续变量进行离散化（分箱）+虚拟编码（独热编码）**是一种常见且高效的
前端替换打包后文件中的内容方案（可用于渗透测试后将问题版本号清空临时解决方案） Anarkh_Lee 前端 node vue 前端 vue node.js
1.问题背景在前端项目安全扫描过程中，经常遇到第三方依赖库版本安全风险提示。然而，直接升级依赖库可能导致以下问题：升级成本高，需要全面回归测试可能引入新的兼容性问题项目稳定性风险增加开发周期延长本文介绍一种在构建过程中优化版本信息的技术方案，适用于紧急情况下的临时处理方案。2.实现思路该方案主要通过以下步骤实现：识别构建后文件中包含的第三方库版本信息创建构建后处理脚本，去除特定版本号信息集成到现有
（线性代数最小二乘问题）Normal Equation（正规方程）音程数学线性代数机器学习人工智能
NormalEquation（正规方程）是线性代数中的一个重要概念，主要用于解决最小二乘问题（LeastSquaresProblem）。它通过直接求解一个线性方程组，找到线性回归模型的最优参数（如权重或系数）。以下是详细介绍：1.定义与数学表达式给定一个超定方程组（方程数量多于未知数）：Ax=bA\mathbf{x}=\mathbf{b}Ax=b其中：A∈Rm×nA\in\mathbb{R}^{m
合规视角下银行智能客服风险防控 AI 智能服务智能客服人工智能 AIGC 数据库 chatgpt
1.AI驱动金融变革的政策与技术背景政策导向：我国《新一代人工智能发展规划》明确提出发展智能金融，要求：构建金融大数据平台，提升多媒体数据处理能力；创新智能金融产品与服务形态；推广智能客服、监控等技术应用；建立智能风控预警体系。技术支撑：云计算、大数据技术成熟为AI发展奠定了基础。深度学习算法的突破则引爆了本轮AI浪潮，显著提升了复杂任务处理精度，进而推动了计算机视觉、机器学习、自然语言处理（NL
存得快查得准，但就是算不动？试试时序数据库 TDengine × Spark 的组合拳
每个工程师可能都遇到过类似场景：时序数据沉淀在数据库中，格式规范、查询快捷，但当任务升级——比如滑窗聚合、多源拼接、机器学习训练——一些业务可能就需要更强的计算能力和更灵活的分析工具。TDengine专注于高效存储与极速查询，而在数据“算力”层面，我们选择了更强的伙伴。现在，TDengine正式开放与ApacheSpark的无缝集成通道。一个是高性能、低成本的时序数据库，一个是横扫大数据世界的分析
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

UESTC 计量经济学复习

第一章 回归分析概述

小结

例题

第二章 最小二乘法

小结

例题

第三章 假设检验

假设检验的基本原理

假设检验的方法

t检验

F检验

正态性检验

小结

例题

第四章 模型设定

解释变量选择小结

函数形式选择小结

例题

第五章 多重共线性

小结

例题

第六章 序列相关性

小结

例题

第七章 异方差性

小结

例题

第八章 虚拟变量模型

例题

第九章 虚拟应变量模型

小结

例题

第十章 预测

小结

例题

第十一章 时间序列模型

小结

第十二章 面板数据模型

小结