SPSS数据分析前,异常值处理

转载来源:

http://bbs.pinggu.org/thread-1542766-1-1.html

h请教一个问题:在一组测量数据中(有几百个)剔除异常值,是采用(平均值±3倍标准差)的方法,为什么在进行异常值剔除后的数据中进行检验,还是有异常值存在呢?是不是需要再进行多次的这样的操作呢,直至达到不再有异常值存在?

楼主这个异常值处理方法是平均值±3倍标准差,那其实平均值±2.9倍左右标准差在你剔除前面的平均值±3倍标准差数据后再做异常值检验时就可能成为新的异常值,在这种情况下我不建议纯粹的以平均值±3倍标准差来剔除异常值。因为还可能存在很多数据标准差在平均值±(2.8-3.0)倍标准差之间,这些也可能是异常值呢。那么在这种情况下应该怎么办呢?我个人的经验是如果要做回归,可以考虑做分位数回归,这个就不要考虑异常值的影响,可以直接做。还有就是可考虑使用缩尾或者截尾处理,或者对数据进行变换(如偏正态分布数据用取对数处理)。总之,异常值处理要慎重,还需结合专业知识具体判断。 

你可能感兴趣的:(SPSS数据分析前,异常值处理)