可以利用 python 中的 scipy.stats.ttest_ind 做关于两组数据的双边 t 检验,结果比较简单。但是做 大于或者小于的单边检测的时候需要做一些处理,才能得到正确的结果。
from scipy import stats
import numpy as np
A = np.array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
B = np.array([ 0, 2, 5, 6, 8, 10, 13, 14, 17, 20])
很显然,A的均值为4.5,B的均值为9.5. 为了检测这种差异是否显著,我们做个单边的 t 检验,证实这种差异的显著性。
这里备择假设应该为我们想要证明的假设,即 B>A. 所以,原假设和备择假设分别设为:
现在我们调用 scipy.stats.ttest_ind(x, y) 函数,这个函数默认我们想验证 x.mean()-y.mean() 这个假设。为了在计算的过程中得到正数,我们 调用 stats.ttest_ind(B,A),这里设置方差不相等。
stats.ttest_ind(B,A,equal_var= False)
# 程序运行结果
Ttest_indResult(statistic=2.204452592164665, pvalue=0.04653783266614884)
根据 scipy.stats.ttest_ind(x, y) 文档的解释,这是双边检验的结果。为了得到单边检验的结果,需要将 计算出来的 pvalue 除于2 取单边的结果(这里取阈值为0.05)。
所以这里我们可以拒绝原假设,即接受备择假设,A < B。
作为验证,我们还可以根据自由度和置信区间(95%)查找 t 值验证结果是否正确。
通过在 t 分布 表上查找,得到
这里 t > tcrit, 还是拒绝原假设。
本文 参考了 https://stackoverflow.com/questions/15984221/how-to-perform-two-sample-one-tailed-t-test-with-numpy-scipy。