第五章---简单统计推断:总体参数的估计

  • 统计推断
    从数据得到关于总体参数的一些结论的过程叫做统计推断

5.1用估计量估计总体参数

  • 统计量
    样本的(不包含未知总体参数的)函数为统计量,而用于估计的统计量称为估计量

  • 点估计(point estimation)
    点估计,也就是用估计量的实现值来近似相应的总体参数。

  • 区间估计(interval estimation)
    它是包括估计量在内(有时是以估计量为中心)的一个区间,该区间被认为很可能包含总统参数。

5.2 点估计

  • 无偏估计量

所谓的无偏性就是:虽然每个样本产生的估计量的取值不一定等于参数,但当抽取大量样本时,那些样本产生的估计量的均值会接近真正要估计的假定分布的参数。严格说来,如果估计量的数学期望等于欲估计的总体参数,则该估计量称为该参数的无偏估计量。

随机样本产生的样本均值、样本标准差和Bernoulli试验的成功比例都是无偏估计。

  • 最小方差无偏估计量
    即方差最小的估计量,作为最小方差无偏估计的描述性例子:

假定(n >2)为来自一个总体的独立随机样本,这些观测值互相独立,那么,对于总体均值的无偏估计就有很多,比如下面的统计量都是无偏估计,他们的期望都是。

但是,他们的标准差不同,第一个是,第二个是,第三个是,最后一个是,显然 的标准差最小。

5.3 区间估计

  • 置信区间

举例说明置信区间的概念:

为了估计某候选人在选民中的支持率(即总体比值p),调查机构的民意测验可能会说,该候选人的“支持率为75%,误差是±3%,置信度是95%”。这种说法意味着下面三点:

1,样本中的支持率为75%,这是用样本比例作为对总体比例的点估计。
2,估计范围为75%±3%,即区间估计。
3,如果用类似的方式,重复抽取大量(样本量相同的)样本时,产生的大量类似区间中会有些覆盖真正的p,而有些不会,但这些区间中大约有95%会覆盖真正的总体比例。

这样得到的区间被称为总体比例p的置信度为95%的置信区间。置信度、样本量与区间之间的关系:
1,样本量相同时,置信度的增加导致区间变长;
2,置信度相同时,样本量的增加导致区间变短。

  • 关于置信区间的注意点

不要认为由一个样本数据得到的总体参数的一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。置信度95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。

你可能感兴趣的:(第五章---简单统计推断:总体参数的估计)