推断性统计学(一,二)

推断性统计学(一,二)

我之前在上概率论与数理统计这门课的时候,关于推断性统计有很多知识都没有仔细地去看,因此过了一年就忘记了。因此在我马上学习深度学习之际,想对它重新复习一下。所以在Udacity上我选了这门课。
,这一系列的博客就是按照Udacity的《推断性统计学》来写的。
首先Udacity上的这门推断性统计是接着描述性统计课来的。所以它的第一章是在总结描述性统计的内容。但是笔者根本没有看见这段话!因此在一开始学习的时候是懵逼的——为什么直接从第7章开始了?为什么一开始上来就这么多问题?在学了一段时间后,才渐渐从懵逼中缓和。

知识点

点估计与区间估计

点估计(point estimation)是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。

区间估计(interval estimation)是参数估计的一种形式。通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。

以上解释来源于百度百科。

  • 点估计的最常见的应用就是矩估计,例如利用抽样均值来估计总体均值。
  • 区间估计的最常见应用则是置信区间,这在假设检验中经常使用。

接下来我们要说的Z假设检验就利用了区间估计。

标准误差

标准误差(Standard Error) δs 是对误差的一种估计,其公式为:

δs=δnδn

标准误差的意义在于反应了利用 x 估计 μ 的偏差程度,从数学上也很容易得到其意义的推导,只需要将 x 视为随机变量,带入方差公式即可。

Z score

Z score就是常说的Z检验统计量,它的公式为:

z=xμδsμδsn

Z socre服从标准正态分布,因此 p(|z|<ξ) 的概率可以很容易借助查表的方式得到,方便检验。

Z检验

Z score 检验(Z Test)一般用于大样本的均值差异性检验,利用 Z score 服从标准正态分布这一特性来推断样本的均值与某分布总体是否存在显著差异。

步骤:

  1. 建立原假设:样本均值 x 与总体均值 μ 无显著差异。
  2. 计算 Z score 及其置信区间。
  3. 根据 Z score 是否落在置信区间内来判断原假设是否成立,若 Z score 在置信区间内则接受原假设,否则拒绝原假设。

其中置信区间的选择要根据具体问题合理构建,常用的有两个置信区间:

  • (-1.96,1.96),置信度为0.95
  • (-2.33,2.33),置信度为0.98

小练习

计算标准误差

已知总体均值为1.4432,总体方差为1.2322,请问从该总体中随机抽取规模为16的样本,其均值的期望是多少?标准误差为多少?

计算Z检验

接着上问已知现有一样本,规模为16,均值为1.7384。请问该样本是否服从上问的总体分布?

参考资料

http://baike.baidu.com/item/%E7%82%B9%E4%BC%B0%E8%AE%A1
http://baike.baidu.com/item/%E5%8C%BA%E9%97%B4%E4%BC%B0%E8%AE%A1
http://wiki.mbalib.com/wiki/Z%E6%A3%80%E9%AA%8C
https://cn.udacity.com/course/intro-to-inferential-statistics–ud201

你可能感兴趣的:(统计学)