简化基因组分析注意事项

简化基因组的方法一定要问清楚

建库前无论公司说的是RAD-seq,还是说的是GBS,都不要太当真,因为这两个名词定义越来越不清了,你只要问清楚,他们建库是检测哪个部分:

1)对单酶切位点邻近片段测序,如最初的RAD-seq
2)对酶切位点两翼片段测序,如Genoytping-by-Sequencing

具体看我写的这篇文章: 简化基因组的测序方法

关于建库的选择:

如果没有参考基因组: 使用RAD-seq双端测序,或者亲本50x以上进行组装,然后是GBS
如果有参考基因组: 使用GBS,这个很便宜。

分析时一定不能去重复

  1. 比对之后的预处理,不能去重,可以标记重复,当然这一步可以省去
  2. 如果上一步标记了重复,那么在使用GATK HaplotypeCaller时, 3.x版本参数需要增加-drf DuplicateRead4.x版本则是-DF NotDuplicateReadFilter。 其实-drf-DF都是--disable-read-filter的缩写。

具体原因见https://gatkforums.broadinstitute.org/gatk/discussion/6124

你可能感兴趣的:(简化基因组分析注意事项)