显著性水平和p值的理解

统计分析的核心是以随机样本推断整体;

以H0代表原假设,H1代表它的相反面;

p值是指假设H0为真的情况下,能够抽取到当前样本的概率,

p值可以描述为:

假设总体均值为10,我们抽取到的样本均值为6的概率;

假设总体是100个,如果根据样本计算出的
p值等于0.05,也就是说:
假设原假设成立,我们抽取到的样本必须是来自于这5个,才有可能发生
“抽取到的样本均值是6”的情况,这显然概率很低,所以原假设就不成立了。

如果p=0.02,
也就是说:
假设原假设成立,我们抽取到的样本必须是来自于这2个,才有可能发生
“抽取到的样本均值是6”的情况,这显然概率很低,所以原假设就不成立了。

但是每个人认为“不太可能发生”的标准都不一样:
有的人认为从100个当中抽中指定5个不太可能或者概率很低,就将这个标准定为0.05,0.05即为显著性水平;
有的人认为从100个当中抽中指定1个才是不太可能或者概率很低(这些人认为抽到指的5个仍有很大概率发生),就将显著性水平定为0.01。

引申:

假设是根据样本情况定的,比如
如果样本的均值为6,备择假设必须是:总体均值小于10;
如果样本的均值为11,备择假设必须是:总体均值大于10;

你可能感兴趣的:(统计学,java)