假设检验的过程

假设检验的核心思想是小概率事件在一次实验中不可能发生,假设检验就是利用小概率事件的发生进行反正。学习假设检验,有几个概念不能跳过,原假设、p值

1.原假设

  假设检验的基本过程如下:

1)做出一个假设H0,以及它的备择假设H1,注意,H0一般实验组和对照组无差异

2)在H0成立的情况下,根据置信度构造一个小概率事件。(显著性水平一般设为5%,即在H0成立的情况下,发生的可能性,这也就是我们说的小概率事件)

显著性水平\alpha和P值是假设检验中关键的两个概念,显著性水平\alpha是认为定义的用于判断是否是小概率事件的阈值,低于该阈值,则认为是小概率事件,也是可以接受判断发生错误的概率。

显著性水平\alpha,是当原假设H0为真时,可以容忍的第一类错误(本来正确的判断为不正确的错误,之所以\alpha选择第一类错误进行计算标准,是因为我们觉得第一类错误更严重,比方说上了个实验,本来没效果,判断为有效果,相对于有效果,判断为没效果,对业务影响更大)发生的概率,是认为定义的小概率事件发生的最大概率值。

假设检验的过程_第1张图片

2.统计功效

第二类错误也应该避免,因为如果第二类错误发生的概率过高,会导致错失发展机会,因此,为了控制第二类错误,引入功效概念,即当H0不成立时,做出拒绝H0的结论正确的概率=1-第二类错误发生的概率\beta,功效越高,发生第二类错误的概率越小。

综上,P值是小概率事件实际发生的概率,P值<\alpha,证明小概率事件发生,拒绝H0,接受H1,认为策略有效;否则,不能拒绝H0,但不代表接受H1, 我们需要进一步看功效,若功效>80%(一般情况下),证明犯第二类错误的概率很低,说明策略大概率是无效的,若功效<80%,说明有效判断为无效的概率比较大,但是也可能是真没效果,可以通过增加样本量n的方法继续观察。

假设检验的过程_第2张图片

3.p值和统计功效的计算

在正态分布时,P值与t值(在下面公式中,假设了两个组别的方差是一样的)有对应关系,求p值可以转化为求检验统计量t值。在现成的t检验,输出的结果包括P值,置信区间,两个样本的均值。

t = \frac{\bar{x_{1}}-\bar{x_{2}}}{s_{1}/\sqrt{n_{1}}} 

通过构造t分布(是一个概率密度曲线,与正态分布很像,5%的显著性水平,对于t值>=1.96或t值<=-1.96, 双边的),计算在实际发生的概率,得到p值。

set.seed(123)
group1 <- rnorm(100, mean = 50, sd = 10)
group2 <- rnorm(100, mean = 50, sd = 10)

# 使用t.test()函数进行两样本t检验
t.test(group1, group2, alternative = "two.sided")

得到结果

	Welch Two Sample t-test

data:  group1 and group2
t = 1.4886, df = 197.35, p-value = 0.1382
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.6428618  4.6019159
sample estimates:
mean of x mean of y 
 50.90406  48.92453 

统计功效:t = \frac{\bar{x_{1}}-\bar{x_{2}}-u}{s_{1}/\sqrt{n_{1}}},这里的u指的是我们认为两组数据真实的差值为u

\bigtriangleup t=\bar{x_{1}}-\bar{x_{2}}

公式变为t(\Delta t)= \frac{\Delta t-u}{s_{1}/\sqrt{n_{1}}}

当u=0.05时,计算1-P(-0.11<\Delta t<0.11))

你可能感兴趣的:(概率论)