Stata 基本回归分析

普通最小二乘估计方法( Ordinary Least Square ,简记为OLS) ,是单一方程线性回归模型最常用、最基本的估计方法。

1.小样本的普通最小二乘法分析
OLS 的基本思想就是通过让残差e 的平方和最小,从而使得模型的估计成为可能。

实验原理
image.png
#打开数据文件、观测数据特征
sysuse usaauto,clear
edit #关注一下原始数据及其统计特征
describe #数据的统计特征
regres s price mpg weight foreign #price 作为因变量, mpg、weigbt 、foreign 作为自变量建立线性回归模型,运用OLS 方法进行回归分析。
#基本回归分析之后,还要对模型的整体和系数进行检验,以求证其是否符合经济理论或现实情况的要求。
#(1)线性检验
# (2)非线性检验
test weight foreign# (也可以输入test (weight=0)(foreign=0) 
#模型的预测
predict yhat , xb #线性预测拟合值,生成的变量名称为yhat 
predi ct e , residual #残差序列的预测值,生成的变量名称为e。
list #显示,每个观测值信息的最后出现了新变量yhat.
实验原假设为weight=foreign=0. 而实际的检验结果是小概率事件发生的可能性为0 . 所 以拒绝原假设. weight 和foreign 的系数均显著不为零。
image.png

2.大样本的普通最小二乘分析

image.png

1.模型建立


image.png
#2.使用小样本理论进行回归
regress lntc lnq lnpl lnpk lnpr
image.png

3.使用大样本理论进行回归
大样本OLS 经常采用稳健标准差估计(robust ) 。稳健标准差是指其标准差对于模型中可能存在的异方差自相关问题不敏感,基于稳健标准差计算的稳健t 统计量仍然渐近服从t 分布。在Stata 中利用robust 选项可以得到异方差稳健估计量。

regress lntc lnq lnpl lnpk lnpr , robust

image.png

4.结果对比

从这两个结果可以看到:稳健标准差与普通标准差估计的系数相同,但标准差和t 值存在一定的差别。

在现实社会的各种数据中,很少有数据能够满足小样本理论的严格假设,所以当样本数据足够大时,我们最好采用稳健标准差进行估计和检验,这样得到的结果将会更加准确。

3. 约束回归

image.png

1.约束的定义、列出和取消

image.png

若要删掉某个或几个己定义的约束,则可使用以下语句:
constraint drop [numlistl_all]

cnsreg mpg price weight d~spl gear ratio foreign length, c(1-5)
 #mpg 是被解释变量的名称, price weight displ gear ratio foreign length 为各个解释变量的名称, c(1-5)表示在1-5 个约束之下进行回归。
image.png

非线性最小二乘

如果将自变量与因变量的关系设为线性关系加一个误差项,那么我们就设定了一个线性模型。同样地,如果将自变量与因变量的关系设定为非线性关系加上一个误差工页,我们就得到了非线性模型。这里介绍的是没有办法转化为线性回归的回归模型。
对于非线性模型,可以通过非线性最小二乘CNonlinear Least Square, NLS) 来求出模型估计量。与普通最小二乘法类似,非线性最小二乘法也是要选择估计量盲,使得残差平方和最小。通常情况下,非线性最小二乘没有解析解,故一般使用数值方法求解。


image.png

image.png
image.png
image.png
image.png
image.png

你可能感兴趣的:(Stata 基本回归分析)