使用R进行方差分析

R是一个免费的统计计算工具,轻便好用,网址是 http://www.r-project.org/,可以在windows, linux,mac系统下安装

ANOVA是方差分析的简称,用于两个及两个以上样本均数差别的显著性检验. 主要结果为一个p值,p值越大说明组间差异越小,

p值越小说明组间差异越明显

这里举个例子,备忘

第一步,在excel里输入两列数据,左边数字代表User编号,一共91组数据,7个用户各有13个数组,右侧X代表用户测试时产生的坐标。

User X
1 4
1 26
1 19
1 3
1 13
1 25
1 13
1 8
1 6
1 2
1 2
1 0
1 5
2 7
2 19
2 6
2 9
2 7
2 22
2 2
2 9
2 4
2 2
2 1
2 11
2 15
3 7
3 6
3 2
3 11
3 0
3 10
3 1
3 28
3 11
3 20
3 8
3 4
3 29
4 5
4 11
4 7
4 2
4 10
4 28
4 12
4 2
4 12
4 7
4 6
4 20
4 7
5 3
5 3
5 4
5 22
5 5
5 19
5 14
5 17
5 14
5 10
5 23
5 25
5 2
6 9
6 17
6 11
6 29
6 12
6 17
6 15
6 15
6 29
6 11
6 20
6 2
6 0
7 1
7 3
7 1
7 2
7 4
7 3
7 13
7 29
7 5
7 4
7 5
7 8
7 10
第二步,在excel里将文件另存为csv,命名为bl.csv

第三步,查看csv文件,确认各项之间以逗号,分隔

User,X
1,4
1,26
1,19
1,3

第四步,打开R,,读取csv数据文件,进行单因素方差分析

>x<-read.csv("d:/ANOVA/bl.csv")

>attach(x)

>mya<-aov(X~as,factor(User))

>summary(mya)

      Df Sum Sq Mean Sq F value Pr(>F)
as.factor(User)  6    473   78.84   1.184  0.323
Residuals       84   5596   66.62  
如果结果发现差异很明显,即p值很小,再进行TuekyHSD进行两两分析
> TukeyHSD(mya)

   diff        lwr       upr     p adj
2-1 -0.9230769 -10.594178  8.748025 0.9999503
3-1  0.8461538  -8.824948 10.517255 0.9999703
4-1  0.2307692  -9.440332  9.901871 1.0000000
5-1  2.6923077  -6.978794 12.363409 0.9798055
6-1  4.6923077  -4.978794 14.363409 0.7639886
7-1 -2.9230769 -12.594178  6.748025 0.9695065
3-2  1.7692308  -7.901871 11.440332 0.9978811
4-2  1.1538462  -8.517255 10.824948 0.9998164
5-2  3.6153846  -6.055717 13.286486 0.9172449
6-2  5.6153846  -4.055717 15.286486 0.5822558
7-2 -2.0000000 -11.671101  7.671101 0.9958220
4-3 -0.6153846 -10.286486  9.055717 0.9999955
5-3  1.8461538  -7.824948 11.517255 0.9973139
6-3  3.8461538  -5.824948 13.517255 0.8917328
7-3 -3.7692308 -13.440332  5.901871 0.9007048
5-4  2.4615385  -7.209563 12.132640 0.9872799
6-4  4.4615385  -5.209563 14.132640 0.8037084
7-4 -3.1538462 -12.824948  6.517255 0.9559006
6-5  2.0000000  -7.671101 11.671101 0.9958220
7-5 -5.6153846 -15.286486  4.055717 0.5822558
7-6 -7.6153846 -17.286486  2.055717 0.2206000


你可能感兴趣的:(数据分析)