第7章 多元回归中的假设检验和置信区间

一、单个系数的假设检验和置信区间

    由大数定律知,,而的平方根即为的标准误差

    单个系数假设:t统计量


二、联合假设的检验

    联合假设:F统计量


三、涉及多个系数的单个约束的检验

    方法1:直接检验约束

    方法2:回归变换


四、多个系数的置信集

    两个或多个系数的95%置信集(95% confidence set)是指在95%的随机抽取样本中包含这些系数总体真值的集合。因此,置信集是单个系数的置信区间到两个或多个系数的推广。


五、多元回归的模型设定

    如果决定的遗漏因素至少和其中一个回归变量相关,则多元回归系数的OLS估计量存在遗漏变量偏差,这意味着给定时的条件期望值非零。

    理论上讲,如果能获得遗漏变量的数据,则解决遗漏变量偏差的方法是把遗漏变量加入到回归中。但在实际应用中决定是否要加入某个变量可能是非常困难的,是需要进行判断的。

    我们解决遗漏变量偏差难题的方法分为两部分。

    第一步,基于专业判断、经济理论和数据收集的方法,选择核心或基础的回归变量集合。有时称基于该回归变量基础集合的回归为基础设定形式(base specification)。它应该包括最感兴趣的变量以及专业判断和经济理论得到的控制变量;但专业判断和经济理论很少是起决定作用的,而且我们通常也较难获得经济理论建议的变量数据。

    第二步,列出候选的备选设定形式(alternative specification),即备选的回归变量集。如果感兴趣的系数估计值在所有备选设定形式中大小差不多,则提供证据表明了由基础设定形式得到的估计值是可靠的。


    或调整接近1意味着在样本中,回归变量能很好地预测因变量的值;而其接近0意味着不能。这使得这些统计量成为衡量回归预测能力的有用概括统计量,然而我们还能容易地从中领会到更多的东西。

    当使用这些统计量时要以防落入四个可能的陷阱:

    (1)回归中包含的变量在统计上是否显著;

    (2)回归变量是否为因变量变动的真实原因;

    (3)是否存在遗漏变量偏差;

    (4)是否选择了最合适的回归变量集。

你可能感兴趣的:(第7章 多元回归中的假设检验和置信区间)