pandas非常简便的t-test以及其他test

帮助文档在这里

非常简单,这些scipy的方法能够非常鲁棒地直接应用于dataframe的列中,只要你索引好了就行了吼。

示例代码如下:

from scipy.stats import ttest_ind

cat1 = my_data[my_data['Category']=='cat1']

cat2 = my_data[my_data['Category']=='cat2']

ttest_ind(cat1['values'], cat2['values'])

>>> (1.4927289925706944, 0.16970867501294376)

非常方便哈,如果我只有一组数据,并且要和x(x是一个值)比较的话,直接ttest_1samp(dataframe['column'], x)就行啦。

你可能感兴趣的:(pandas非常简便的t-test以及其他test)