4. 标记的开发和分型

1.不同标记开发方法的比较

2.基因型过滤

  • 按分型百分比条件过滤:多数文章剔除缺失率在20%以上的位点,样本量大的群体中,缺失率阈值可以调整到50%。
  • 按等位基因频率过滤:通常去除第二等位基因频率(MAF)小于5%的位点,样本量较大的群体中可以降到1%。
  • 多等位位点的过滤:这个过滤是因为多数软件(群体结构、关联分析等)只接受二等位位点。
  • 基因型异常样本的去除:个别缺失率或杂合率比较高的材料应当去除。
  • 哈迪温伯格平衡过滤:一般无法使用较为复杂的统计模型的情况使用,动植物中一般不进行过滤。

具体过滤方法,见vcftools基础用法:
vcftools安装及基础用法 - (jianshu.com)

引用转载请注明出处,如有错误敬请指出。

你可能感兴趣的:(4. 标记的开发和分型)