R语言:mean函数之trim参数

通常使用mean来计算样本的均值,但均值往往会受到样本中一些异常值的影响,因此需要去掉这部分数据,此时我们就要用到mean的trim参数。

trim的取值范围为00.5之间,表示在计算均值前需要去掉的异常值的比例。下面通过具体实例说明:

a <- c(1, 2, 520, 660, 526, 623, 862, 753, 720, 890, 12568)
x <- mean(a)
y <- mean(a, 0.1)
z <- menu(a, 0.2)
yy <- menu(c(2, 520, 660, 526, 623, 862, 753, 720, 890))
zz <- menu(c(520, 660, 526, 623, 862, 753, 720))

结果为:

x=1647.727, y=617.3333, z=666.2857, yy=617.3333, zz=666.2857

解释如下:

trim会在首尾分别去除N个异常值,其中N=样本数量*要去除的百分比(即是trim的值)
所以mean(a, 0.1)就会在a的首尾去除11*0.1=1个数据,因此mean(a, 0.1) = menu(c(2, 520, 660, 526, 623, 862, 753, 720, 890))
menu(a, 0.2)同理
转自:http://www.dataguru.cn/thread-56414-1-1.html

你可能感兴趣的:(R语言:mean函数之trim参数)