统计|假设检验中的P值(pvalue)如何看/怎样理解

本博文源于《商务统计》,之前在做matlab编程和spss统计分析中,对p值的理解就是懵懵懂懂,无法确定出真正含义。今天就以新生儿的例子来观看p值是如何看的,并且了解假设检验的5个步骤。

例子:新生儿

统计|假设检验中的P值(pvalue)如何看/怎样理解_第1张图片

假设检验的一般步骤

  • 建立假设
  • 抽样分布
  • 寻找临界值
  • 计算检验统计量
  • 决策进行结论

建立实验假设

联合国卫生部说标准新生男女标配为108:100就是0.519的样子,也就是100名新生儿中,52个为男的。这是一个单侧假设检验的问题。确定原假设和备择假设,:

H 0 : π = 0.519 H 1 : π > 0.519 α = 0.05 男 婴 比 例 p = 575 1040 = 0.5529 H_0:\pi = 0.519\\ H_1:\pi\gt0.519\\ \alpha=0.05\\ 男婴比例 p= \frac {575}{1040}=0.5529 H0:π=0.519H1:π>0.519α=0.05p=1040575=0.5529
p值就是样本中男婴出现的比例,我们的单侧检验也是围绕它进行下去的。

确立抽样分布

根据中心极限定理来看,只要样本>30就是服从正态分布,1040>30所以这是一个典型的大样本实验。因此服从正态分布

寻找临界值

临界值就是p值,刚才在建立假设检验中已经计算了。0.5529

检验统计量

统计量就是0.5529对应的z统计量,也是一个公式
z = p − π π ( 1 − π ) n z = 0.5529 − 0.519 0.519 × 0.481 1040 = 2.188 z=\frac{p-\pi}{\sqrt{\frac{\pi\left(1-\pi\right)}{n}}}\\ z=\frac{0.5529-0.519}{\sqrt{\frac{0.519\times0.481}{1040}}}=2.188 z=nπ(1π) pπz=10400.519×0.481 0.55290.519=2.188
因此统计量就是个2.188。带入正态分布中,查询正态分布表0.05对应的是1.645,
1.645 < 2.88 1.645<2.88 1.645<2.88
因此在正态分布的右侧,P=0.0144
0.0144 < 0.05 0.0144<0.05 0.0144<0.05

决策进行结论

0.0144的概率发生了,也就是小概率的事情,竟然发生了,所以拒绝原建设。新生比例不正常。

总结

P值是在假设检验中常见的统计量,本质上是一个概率值,我们总是拿0.05和0.025去与它作比较,如果小了,说明可以拒绝,大了说明本应该可以发生。在统计学中是一个常见的概念。

你可能感兴趣的:(线代概率,统计学,数据分析,机器学习)