WGBS vs RRBS

How does bisulfite sequencing (WGBS/RRBS) work?

DNA甲基化分析是NGS技术中越来越广泛的一项应用。原因很简单:DNA甲基化是表观遗传修饰的主要机制之一,对基因表达和细胞活性有根本的影响。这是研究细胞发育、转录沉默和发现新的生物标志物的一个有趣的方面。

为什么使用亚硫酸氢盐测序法?

基于NGS的DNA甲基化分析的目的是研究基因组DNA,发现基因组中单个胞嘧啶或整个区域是否甲基化,因为启动子或gene body甲基化会影响基因表达。典型地,在哺乳动物中,DNA甲基化只出现在CpG二核苷酸上,其甲基化率为70 - 85%,而CpG岛则主要是未甲基化的C以保持活性。顺便提一下:在人类中,大约70%的启动子含有一个CpG岛。

目前有几种研究DNA甲基化的方法,但很少能像亚硫酸氢盐测序(也称为Bisulfite-Seq,BS-Seq或Methyl-Seq)一样提供更好的甲基化状态分辨率。这种方法的关键idea是将高通量DNA测序的能力与亚硫酸氢钠处理DNA相结合。当暴露于亚硫酸氢盐中,未甲基化的胞嘧啶(C)转化为尿嘧啶(U),而甲基化的胞嘧啶(包括甲基化的和羟甲基化的)保持不变(图1)。bisulfite处理的DNA测序后,获得的测序reads可以使用专门的比对软件将其比对到原始参考基因组上(图2)(将未甲基化的胞核嘧啶进行转化)。然后,这种比对可以用类似于从NGS数据中检测DNA变异的方式在单核苷酸水平上识别甲基化状态。因此,重要的是要记住亚硫酸氢盐测序不能区分5-甲基胞嘧啶(5mC)和5-羟甲基胞嘧啶(5hmC),即使它们的功能已经被发现是不同的。

图1
图2

Bisulfite 测序protocols: Large-scale versus small-scale

最简单的方法是做全基因组亚硫酸氢盐测序(WGBS)。但是,你需要足够的read深度来准确的判断甲基化状态。当你要进行的测序是基于一个大基因组(小鼠或人)时,这可能导致测序的成本过高。

作为一种可选方法,你可以把检测DNA甲基化的重点放在基因组的一个特定子集上,从而减少实验的数据量和随后的成本。

一种流行的方法是Reduced Representation Bisulfite Sequencing (RRBS)。RRBS的基本思想是获得基因组的“简化表示(reduced representation)”,重点放在CpG岛上。这包括在裂解阶段添加限制性内切酶来消化DNA。通常,使用的MspI酶是甲基化不敏感的。它在5 ' -C^CGG-3 '位点剪切,由于基因组除启动子/CpG岛外,CpGs大量缺失,“简化表示”主要是只捕获这些启动子区域以供进一步分析。消化反应对两端都有CpG的DNA片段和大小不一的片段进行富集。然后填充片段末端并连接adapters。之后选择片段的大小,进行亚硫酸氢盐转换,并进行测序。

为什么RRBS不可以进行deduplication(去重)?

与切割同一位点的限制性内切酶有关。上面提到了,对于RRBS,你的序列总是从MspI限制性酶切位点开始,那么当你从那里对片段进行测序时,会得到重复的序列,因为它们总是由那些剪切位点开始的。如果你做了去重,你会把大量有用的reads都删掉了。但是,如果你做的是WGBS(全基因组甲基化测序),你的基因组是在随机的地方被剪切的,那么你就不会得到所有的reads都是相同的开头,除非他们是PCR duplicates。

参考:
1.https://www.ecseq.com/support/epigenetics/how-does-bisulfite-sequencing-wgbs-rrbs-work
2.https://github.com/RobertsLab/resources/issues/669
3.http://www.bioinformatics.babraham.ac.uk/training/Methylation_Course/BS-Seq%20theory%20and%20QC%20lecture.pdf

你可能感兴趣的:(WGBS vs RRBS)