利用python进行单边T检验

可以利用 python 中的 scipy.stats.ttest_ind 做关于两组数据的双边 t 检验,结果比较简单。但是做 大于或者小于的单边检测的时候需要做一些处理,才能得到正确的结果。

from scipy import stats
import numpy as np

A = np.array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
B = np.array([ 0, 2, 5, 6, 8, 10, 13, 14, 17, 20])

很显然,A的均值为4.5,B的均值为9.5. 为了检测这种差异是否显著,我们做个单边的 t 检验,证实这种差异的显著性。

这里备择假设应该为我们想要证明的假设,即 B>A. 所以,原假设和备择假设分别设为:

H0: A \geq B, H1: A < B

现在我们调用 scipy.stats.ttest_ind(x, y) 函数,这个函数默认我们想验证 x.mean()-y.mean() 这个假设。为了在计算的过程中得到正数,我们 调用 stats.ttest_ind(B,A),这里设置方差不相等。

stats.ttest_ind(B,A,equal_var= False)

# 程序运行结果
Ttest_indResult(statistic=2.204452592164665, pvalue=0.04653783266614884)

根据 scipy.stats.ttest_ind(x, y) 文档的解释,这是双边检验的结果。为了得到单边检验的结果,需要将 计算出来的 pvalue 除于2 取单边的结果(这里取阈值为0.05)。

p/2 < alpha(0.05)

所以这里我们可以拒绝原假设,即接受备择假设,A < B

作为验证,我们还可以根据自由度和置信区间(95%)查找 t 值验证结果是否正确。

df = samplesize1 + samplesize2 - 2 = 10 + 10 -2 = 18

通过在 t 分布 表上查找,得到

tcrit(df=18, confidencelevel = 95\%) = 1.734

这里 t > tcrit, 还是拒绝原假设。

本文 参考了 https://stackoverflow.com/questions/15984221/how-to-perform-two-sample-one-tailed-t-test-with-numpy-scipy。

 

你可能感兴趣的:(Python,数据处理)