2018-11-02 GWAS实战(五)plink 进阶之数据过滤一条命令

之前讲了太多的很细的数据分析和过滤,在实战中,一般可以把命令写在一起。

2018-11-02 GWAS实战(五)plink 进阶之数据过滤一条命令_第1张图片
total

这张图片对比了数据summary和数据过滤的命令之间的差异。

对于我们自然群体,没有家系结构,所以主要是
--mind N 删个体(基于缺失率)
--geno N 删snp(基于缺失率)
--maf N 删snp (基于最小等位基因频率)
--hwe N 删snp (基于A和a不符合哈德温伯格平衡)
--LD(这个一般不做双基因互作的话不考虑,详见我上一篇)

plink --bfile core_v0.7 --mind 0.1 --maf 0.05 --geno 0.1 --hwe 0.01 --make-bed --out clean

这样可以生成过滤好的文件,进行下一步分析

生成的新文件

2018-11-02 GWAS实战(五)plink 进阶之数据过滤一条命令_第2张图片
clean

你可能感兴趣的:(2018-11-02 GWAS实战(五)plink 进阶之数据过滤一条命令)