怎么对一组SNP 数据进行统计(频率、哈温平衡检验)

怎么对一组SNP 数据进行统计(频率、哈温平衡检验)

示例数据

1. 载入SNPassoc

我们要用里面的函数进行计算。

library(SNPassoc)

2. 载入数据

data(SNPs)

查看SNPs的数据

SNPs[1:10,1:9]
id casco sex blood.pre protein snp10001 snp10002 snp10003 snp10004
1 1 Female 13.7 75640.52 TT CC GG GG
2 1 Female 12.7 28688.22 TT AC GG GG
3 1 Female 12.9 17279.59 TT CC GG GG
4 1 Male 14.6 27253.99 CT CC GG GG
5 1 Female 13.4 38066.57 TT AC GG GG
6 1 Female 11.3 9872.46 TT CC GG GG
7 1 Female 11.9 11132.90 TT AC GG GG
8 1 Male 12.4 29973.43 TT AC GG GG
9 1 Male 14.5 31114.29 CT CC GG GG
10 1 Female 12.2 41768.55 TT AC GG GG

3. 如果我们想对SNP10001进行哈温检验

使用SNPassocsummary函数, 会返回该SNP的汇总信息,里面包括哈温检验。

mysnp <- snp(SNPs$snp10001,sep="")
summary(mysnp)
Genotypes: 
    frequency percentage
T/T        92  58.598726
C/T        53  33.757962
C/C        12   7.643312

Alleles: 
  frequency percentage
T       237   75.47771
C        77   24.52229

HWE (p value): 0.2816392 

可以看到,snp10001,T的频率是0.754,C的频率是0.245. 该位点的哈温平衡测试p值为0.28,说明该位点符合哈温平衡。

欢迎关注我的公众号:育种数据分析之放飞自我

怎么对一组SNP 数据进行统计(频率、哈温平衡检验)_第1张图片

你可能感兴趣的:(markdown,SNP)