表型数据:描述性统计 —— R 'psych'

表型数据的描述性统计,是对表型数据进行的基础分析,包括最大值、最小是、均值、方差、极差等。通过SPSS、Excel或者R都可以完成,R与其他两种方法对比,只需要简单的命令就可以完成全部分析,这里主要介绍R包'psych'。


1.准备工作:

1.1 R包安装

> install.packages('psych')

1.2 数据格式

这里的数据格式为常用的长数据,即第一行为表头,每一列为性状观测值的名称,如株高、茎粗、分枝数、千粒重等。

我这里的数据分别为:株系,时间,重复,年份,之后为每个性状的测量值。


2.统计:

调用R包:

> library('psych')

读取宽数据:

> raw_data <- read.table("phe.txt", header = T, check.names = F, sep = "\t")

我需要每个时间点单独统计,提取时间:

> T1 <- subset(raw_data, Time == 'T1')

统计,这里第五列开始为我需要的表型性状:

> T1_data_desc <- describe(T1[,5:ncol(T1)])

查看结果:

> head(T1_data_desc)
   vars   n  mean    sd median trimmed   mad min    max  range skew kurtosis   se
TL    1 728 21.24 13.59  19.30   20.00 13.43   0 100.17 100.17 1.04     1.97 0.50
PA    2 728  1.80  1.11   1.63    1.69  1.02   0   7.17   7.17 0.98     1.27 0.04
SA    3 728  5.65  3.48   5.11    5.32  3.22   0  22.52  22.52 0.98     1.27 0.13

结果中包含每个性状在T1时间点的平均值,标准差,最小值,最大值,偏度,峰度等我们需要的所有描述性统计结果。

3.结果输出:

将上一步的描述性统计结果输出:

> write.csv(T1_data_desc, file = "T1_data_desc.csv", quote = F)

引用转载请注明出处,如有错误敬请指出。

你可能感兴趣的:(表型数据:描述性统计 —— R 'psych')