计量经济学 学习笔记-1 一元线性回归

  • 主要名词 和解释

拟合优度

也就是可决系数 R2
y(i) = Yi - Y-
=e(i)  是样本离差。
 有三个y
 Y-   均值
 Yi^  第i个样板的回归预测值
 Yi   第i个样本的真实值

总体平方和total sum of squares

    Y 均值 与 Y 预测值 的总平方和

残差平方和Residual sum of squares

    Y 预测值 与 Y 样本值 的平方和(回归方程不能解释部分)^

回归平方和explained sum of squares

    Y 预测值 与 样本值 的平方和 (回归方程能解释部分)

可决系数

    回归平方和 / y的总离差

显著性检验

 例如 对x前面因子进行检验。
 一元线性回归方程中 beta1 服从 正态分布
 beta1^ ~N(beta1 ,lo^2/sigma(xi^2))
 lo^2 = sigma(ei^2/(n-2))

t = (beta1^ - beta)/sqrt(lo2/sigma xi2)服从 ~t(n-2)
计量经济学中 主要是针对变量的参数真值是否为0来做显著性检测的。
–(1)对总体提出假设
H0: beta1 = 0 , H1 : beta!= 0
–(2)以原假设H0 构造t统计量,并由样本计算其值,
t = beta1^/ Sbeta1^
–(3)给定显著性水平alpha,查t分布表,使得临界值ta/2(n-2)
–(4) 比较判断
若 |t| > ta/2(n-2) 则拒绝H0,接受H1;
若 |t| <= ta/2(n-2) 则拒绝H1,接受H0;

缩小置信区间

    增大样本容量 t分布中 n越大,临界值越小。
    提高模型的拟合优度。残差平方和越小越好。

关于 给定样本外的解释变量的观测值X0,

可以得到被解释变量的预测值Y0,可以以此作为其条件均值,E(Y\X=X0),或者个别值Y0的一个近似估计。原因:
1、参数估计量不确定。
2、随机项的影响。

估计参数的confidence band

总体回归模型中加入一个随机变量
Y0 = beta0 + beta1X0 + u
Y0^ 是 Y0的无偏估计。
最后可以得到关于预测值95%的置信区间。 (有人为统计 与机器学习的区别,,机器学习更加关注应用,从宏观层面判断所有样本的整体表现,如准确率,召回率。但是 统计学习更加关注学习分类过程中过的原理本身,比如,预测的Y值是否合理,不合理,应该加上一个置信区间,这是属于统计机器学习的范畴。)
这里我们会有相当于机器学习后面的新的概念,总体回归函数的置信带,个体的置信带。

置信区间的性质

1、样本容量越大,预测精度越高,反之预测精度越低。
2、样本容量一定的时候,在X均值处,置信带宽最小,预测精度越大。
                    远离X均值处,置信带宽越宽,预测可信度下降。 

线性回归常用术语:
点估计、预测值,预测区间,相对误差。

矩方法是工具变量法和广义矩方法的基础

矩方法 : E(X‘u) = 0
工具变量法:如果某个变量与随机项相关,如果可以找到一个工具变量,仍可以构成矩条件。instrumental variables
广义矩方法:generalized moments methods

你可能感兴趣的:(quantitative,inverstiments)