VCF 生成 plink 输入文件(ped和map)

使用工具 vcftools

vcftools --vcf SNP_merge.vcf --plink --out SNP

map文件 有四列,分别为

  • 第一列:染色体编号为数字, 未知为0
  • 第二列:SNP名称为字符或数字, 如果不重要, 可以从1编号, 注意要和ped文件SNP列一一对应
  • 第三列:染色体的摩尔根距离(未知用0表示)
  • 第四列:SNP物理坐标

ped 文件 数据没有行头, 空格或者tab隔开的文件。必须要有六列, 包括系谱信息, 表型信息。

Family ID ('FID')
Within-family ID ('IID'; cannot be '0')
Within-family ID of father ('0' if father isn't in dataset)
Within-family ID of mother ('0' if mother isn't in dataset)
Sex code ('1' = male, '2' = female, '0' = unknown)
Phenotype value ('1' = control, '2' = case, '-9'/'0'/non-numeric = missing data if case/control)

  • 第一列: Family ID # 如果没有, 可以用个体ID代替
  • 第二列: Individual ID # 个体ID编号
  • 第三列: Paternal ID # 父本编号
  • 第四列: Maternal ID # 母本编号
  • 第五列: Sex (1=male; 2=female; other=unknown) # 性别, 如果未知, 用0表示
  • 第六列: Phenotype # 表型数据, 如果未知, 用0表示
  • 第七列以后: 为SNP分型数据, 可以是AT CG或11 12, 或者A T C G或1 1 2 2
SNP.map

SNP.ped

你可能感兴趣的:(VCF 生成 plink 输入文件(ped和map))