本文首发于微信公众号“基因部落”,欢迎关注,获取更多干货。
技术介绍
几十年来,重亚硫酸盐转化已成为甲基化测序的行业金标准,该技术可以检测DNA水平上被修饰的C(胞嘧啶):5-甲基胞嘧啶(5mC)和5-羟甲基胞嘧啶(5hmC)。然而,这项技术有诸多一直没法克服的缺点:刺激(harsh)的化学反应使得大部分DNA发生降解,由此,测序后序列复杂性大大降低(complexity),该技术是将未甲基化的C转换为T,然而,未甲基化的C占人类基因组的95%左右,重亚硫酸盐转化建库后,碱基就会极度不平衡,因此,对后续二代测序质量也有很大影响,不得不谨慎考虑如何混库才能保证下机数据质量。
本文介绍了一种新的甲基化检测技术TAPS(TET-assisted pyridine borane sequencing),该技术摆脱了重亚硫酸盐转化,则是反其道而行之,直接将甲基化的C转化为T,进行测序。该技术结合酶学和化学反应完成C到T的转化,首先通过TET1氧化酶将5mC和5hmC氧化成5caC(5-羧基胞嘧啶),然后在还原剂吡啶硼烷(Pyridine borane)的作用下,转变成DHU(二氢尿嘧啶),DHU可以作为PCR模板,被能识别U的DNA聚合酶识别,因此,通过PCR过程,最后生成了C转化为T的PCR产物。
TAPS技术优势:1. 对DNA无破坏性,丢失的DNA减少,测序数据的复杂性或覆盖度就会提高。转化之后,可以保留10kb的DNA片段,对三代测序也会有很好的应用。2. 由于是将甲基化的C转变为T,因此对DNA序列的碱基平衡影响极小,下机数据质量提高,数据比对率明显提高。3. TAPS技术的成本比传统的重亚硫酸盐转化方法要低很多。
技术路线
生物专业很是百搭,生物与物理,生物与数学,生物与计算机,生物与化学,都能碰撞出精彩的火花。TAPS技术在成型的过程中也主要是在解决化学反应的问题。先来看几个化学式:
吡啶硼烷(Pyridine borane)能将5fC(5-甲酰胞嘧啶)和5caC(5-羧基胞嘧啶)转化为DHU,未被甲基化的C,5mC(5-甲基胞嘧啶)和5hmC(5-羟甲基胞嘧啶)则不被转化,但是5fC和5caC在基因组中含量极少,而5mC和5hmC的含量却是5fC和5caC的10到100倍。这也是大部分甲基化检测位点是5mC和5hmC的原因,因此引入了TET1氧化酶。
TET1氧化酶能将5mC和5hmC氧化成5caC,而5caC能够被吡啶硼烷还原为DHU,这样,就可以通过间接地方法将5mC和5hmC转化为T,并进行测序了。基于以上原理,作者又做了进一步延伸。可以有针对性的只检测5mC或5hmC,通过两种block方法,分别将5mC和5hmC block掉。作者用β-葡糖基转移酶(β-glucosyltransferase)标记5hmC,使得吡啶硼烷还原5gmC,而作者直接用化学氧化剂高钌酸钾(KRuO4)只将5hmC氧化为5fC,流程图如下:
BOX1:
2018年10月8日,同样发表在Nature Biotechnology上的,Bisulfite free的甲基化检测技术,ACE Seq(APOBEC-coupled epigenetic sequencing),同样也是运用酶学的方法对甲基化的C进行检测。本文中同样引入了β-葡糖基转移酶(β-glucosyltransferase)保护5hmC,进而通过脱氨酶进行脱氨反应,使未甲基化的C和5mC转换为U。由于本技术仅能检测5hmC,而且5hmC在体内的含量并未占有很大比例,因此,最终得到的信息有限。
与重亚硫酸盐转化法的比较
1. 转化效率
作者得到了两种TET1,一种来自那氏虫属Naegleria,NgTET1,另一种来自属的TET1,mTET1,通过实验验证,mTET1的转化效率稍好一些。
作者用含有5个mCpG,长222bp的序列进行了转化效率的预估。选取内切酶TaqI的识别序列(TCGA)作为目标序列,其中C进行甲基化修饰,流程如下图。
作者进一步检测了TET1对mESC基因组DNA的转化效率,在E14 mESC中5mC占98.5%,5hmC占1.5%,5fC和5caC极其微量。实验结果显示,TET1氧化反应以后,96%的C被氧化为5caC,3%的C被氧化为5fC,吡啶硼烷处理后,大于99%的被修饰的C转变为DHU。
2. PCR效率及偏好性
DNA聚合酶以DHU作为底物,是否会影响PCR的效率呢?作者利用自合成的两端序列,退火延伸后,一条链上有一个5mC,其互补链上有5hmC,选用多种DNA聚合酶进行了PCR和Sanger 测序验证,除不能识别U的DNA聚合酶,如KAPA HiFi polymerase, NEB Q5 polymerase,Phusion polymerase之外,其余的多个聚合酶都能顺利的进行PCR。
作者进一步通过qPCR验证了DHU的扩增效率,从数值上看,与T和C并没有明显的差异。
3. DNA破坏程度
重亚硫酸盐最致命的弱点是对DNA有极大的损伤,>90%的DNA会发生降解,变成单链(ssDNA)。本文通过针对不同大小的DNA片段分别进行TAPS以及Bisulfite 处理,从电泳图上看出,TAPS技术对DNA并没有明显的损伤,而Bisulfite处理导致显著的DNA降解。
基于此,作者验证了不同长度对C-T的转化效率的影响。同样选取内切酶TaqI的识别序列(TCGA)作为目标序列,从胶图预估,转化效率接近100%。
Bisulfite 转化后,DNA变为单链,文库构建也有一定难度。TET1和吡啶硼烷转化后,DNA仍保持双链,可直接进行PCR。
4. 数据质量
Bisulfite转化使得碱基严重失衡,进而导致测序数据质量明显下降。TAPS技术并没有导致明显的GC含量发生变化,因此,测序数据质量有明显的提升。
在TAPS 和 WGBS(whole-genome bisulfite sequencing) 的对比试验设计中,以E14 mESC基因组DNA为材料,加入了全部甲基化的Lambda DNA评估假阴性率(甲基化的C未得到转化),加入了没有甲基化的2kb的扩增子评估假阳性率(未甲基化的C被转化为T),加入了自合成的同时包含5mC和5hmC的序列,两侧为随机碱基(N5mCNNand N5hmCNN),评估5mC和5hmC在不同序列中的转化效率。
结果显示,5mC的转化效率为96.5%(Lambda DNA)和97.3%(spike-ins),因此,假阴性率为3.5%和2.7%。5hmC的转化效率为89.1%,CpG unit转化效率高于非CpG。假阳性率为0.23%。
TAPS的覆盖度比WGBS高,检出的CpG位点也高于WGBS。此外,上述对比测序的DNA起始量也有所不同,TAPS起始量为100ng,WGBS起始量为200ng。
TAPS还适用于更低的起始量,1ng,因此,对检测cell free DNA 的甲基化是非常好的选择。由于TAPS兼容低起始量和长读长,TAPS在单细胞领域和三代测序领域也会有很好的应用。
文中说TAPS可以取代WGBS,这个结论是否能够成为现实,还需要后续更多技术上和参数上的对比。或许在不久的将来,Bisulfite 转化会退出历史舞台,而DNA甲基化测序有了新的环境和技术,肿瘤早筛,基因检测等领域也会得到更好的发展。
参考资料:
https://doi.org/10.1038/s41587-019-0041-2
https://doi.org/10.1038/nbt.4204