GWAS -4 VCF格式文件转为Plink文件

1 VCF格式文件为Plink文件

image.png

参考:https://cloud.tencent.com/developer/article/1556166

2 plink转vcf

plink1.9版本支持转化为VCFv4.2格式

plink2.0版本支持转化为VCFv4.3格式

两个版本用到的命令不一样

对于plink1.9版本,转化为vcf文件的命令行为:

plink --bfile binary_fileset --recode vcf-iid --out new_vcf

生成的vcf为4.2版本

对于plink2.0版本,转化为vcf文件的命令行为:

plink --bfile binary_fileset --export vcf --out new_vcf

生成的vcf为4.3版本

参考:https://www.cnblogs.com/chenwenyan/p/8574237.html

3 plink转vcf


3.1 plink --bfile test_1 --recode vcf --out test_vcf  ###这样就把plink(二进制)文件转换成vcf格式了

3.2  plink --file  test_1  --recode vcf --out test_vcf   ### 直接map ped文件转为vcf格式

链接:https://www.jianshu.com/p/8b4e7b3b7f5e

4 PLNIK 的多种文件格式转换

vcf 转为 ped/map

使用vcftools

vcftools --vcf snp.vcf --plink --out snp

使用plink

plink --vcf snp.vcf --recode --out snp
ped和map文件是Plink的基本格式。

ped文件包含以下几列:

第一列:Family ID。

第二列:Individual ID。自然群体这列和Family ID是一样的。

第三列:Paternal ID。未提供信息的话这列为0。

第四列:Maternal ID。未提供信息的话这列为0。

第五列:Sex。未提供信息的话这列为0。

第六列:Phenotype。一般来说,直接拿vcf转换的话这列为-9,也就是缺失。

第七列开始就是个体在每个标记位点的基因型。

map文件包含以下几列:

第一列:染色体编号。

第二列:SNP编号。

第三列:遗传距离。未提供信息的话这列为0。

第四列:物理位置。

ped/map 与 tped/tfam 格式互换

ped/map转换为tped/tfam

plink --file snp --recode --transpose --out snp_test

tped/tfam转换为ped/map

plink --tfile snp_test --recode --out snp
ped/map 与 bed/bim/fam互换

ped/map转换为bed/bim/fam

plink --file snp --make-bed --out snp_test

bed/bim/fam转换为ped/map

plink --bfile snp_test --recode --out snp
tped/tfam 与 bed/bim/fam互换

tped/tfam转换为bed/bim/fam

plink --tfile snp --make-bed --out snp_test

bed/bim/fam转换为tped/tfam

plink --bfile snp_test --recode --transpose --out snp
bed/bim/fam 转为 vcf

bed/bim/fam 转为 vcf

plink --bfile snp --export vcf --out snp_test
常用的Plink格式转换就是这些,大家可以根据自己实际需要相互转换。

染色体的设置

因为PLINK默认的设置是人的染色体, 所以动物中,我们应该设置
--chr-set 19 # 猪
已有的选择:
--cow
--dog
--horse
--mouse
--rice
--sheep
参考:https://zhuanlan.zhihu.com/p/109071456

你可能感兴趣的:(GWAS -4 VCF格式文件转为Plink文件)