Source: http://www.r-bloggers.com/parametric-method-for-the-study-of-the-correlation-the-pearson-r-test/
假如你想要研究两个数据集之间是否有相关性。我们需要计算Pearson product-moment correlation coefficient,这是一个在两个变量X和Y之间的相关性(线性关系)的度量;那么我们计算研究Pearson coefficient R.显著性的t-test的值。当数据符合Gaussian分布时,我们能够使用这个检验。
用于度量IQ的一个新的检验针对于10个志愿者。你想看看在新实验检验和经典检验之间是否有相关性,以便于用新的检验替代老的检验:
Old test: 15, 21, 25, 26, 30, 30, 22, 29, 19, 16 New test: 55, 56, 89, 67, 84, 89, 99, 62, 83, 88
R软件提供了很容易调用的一个函数,直接给出Pearson系数和t统计检验的值,来检测系数的显著性:
a = c(15, 21, 25, 26, 30, 30, 22, 29, 19, 16) b = c(55, 56, 89, 67, 84, 89, 99, 62, 83, 88) cor.test(a, b) Pearson's product-moment correlation data: a and b t = 0.4772, df = 8, p-value = 0.646 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: -0.5174766 0.7205107 sample estimates: cor 0.166349
Pearson系数的值为恶0.166:这是一个非常低的值,显示了变量之间很弱的相关性。进一步,p-value大于0.05,因此我们接受null hypothesis H0,即相关系数为0,而Pearson系数显著。
因此我们能说两个试验结果之间没有相关性。