R语言与非参数检验之两独立样本中位数检验

学习笔记
学习书目:《统计学:从数据到结论》–吴喜之;


比较两总体中位数的Wilcoxon秩和检验

我们之前比较两总体均值时,都要假定感兴趣的总体是近似正态分布。然而,在许多情况,这种正态总体的假定是不可靠的。

能否在总体分布不知道的时候有办法检验两个总体的中位数是否相等呢?

我们在这里,介绍一种常用的Wilcoxon秩和检验,该检验唯一需要的假定就是两个总体的分布有类似的形状。Wilcoxon秩和检验的原理很简单:假定第一个样本有m个观测值,第二个有了n个观测值,把两个样本混合之后将这m+n个观测值按照大小次序排序,然后记下每个观测值在混合排序下面的秩,之后分别把两个样本所得到的秩相加,记第1个样本观测值的秩的和为 W x W_x Wx,而第2个样本观测值的秩的和为 W y W_y Wy,这两个值可以互相推算,称为Wilcoxon统计量,该统计量的分布和两个总体分布无关,我们可以由此得到 p p p值。直观上看,如果 W x W_x Wx W y W_y Wy之间有一个显著的大(显著的小),则可以选择拒绝零假设。

R语言实现

我们现在有两个样本数据,样本x的样本量为18,样本y的样本量为22,现在我们假定这两个样本的总体分布有类似的形状:

> (a <- new_data[1:18])
 [1] 74.3 79.5 75.0 73.5 78.8 75.6 73.5 75.0 68.8 75.0 78.8 72.0 78.0 78.8 74.3 64.3 70.4
[18] 72.0
> (b <- new_data[19:40])
 [1] 75.8 75.8 80.5 72.0 65.0 80.3 80.5 72.0 74.3 69.7 69.7 74.3 71.2 74.3 71.2 71.2 69.7
[18] 73.5 73.5 72.0 68.0 73.5

通过计算,我们得知样本x的中位数为 m x = 74.65 m_x=74.65 mx=74.65,样本y的中位数为 m y = 72.75 m_y=72.75 my=72.75

现在,我做出以下假设:
H 0 : m x = m y H 1 : m x > m y H_0:m_x=m_y \\H_1:m_x >m_y H0:mx=myH1:mx>my

Wilcoxon秩和检验:

> wilcox.test(a, b, alternative = "greater")

	Wilcoxon rank sum test with continuity correction

data:  a and b
W = 245, p-value = 0.1023
alternative hypothesis: true location shift is greater than 0

由结果可知, p = 0.1023 p=0.1023 p=0.1023,大于0.05的显著性水平,没有充分证据拒绝原假设,即,没有理由拒绝样本x所对应的总体样本y所对应的总体中位数相等。

你可能感兴趣的:(R语言,统计学)