甲基化倍性问题新思路

问题的由来

DNA methylation has diferent methylation patterns in alleles,对于等位基因来说,对于二倍体生物来说,一套染色体组来自于父亲,而另一套来自于母亲。在传统的甲基化分析中,我们往往利用的是单倍型参考基因组来检测甲基化位点,这样的话对于特殊的等位基因区段是无法区分在同源染色体中具体是哪一条染色体的哪一个位点发生甲基化了。

倍性问题

今天分享的文献是今年才发表的《MethHaplo: combining allele‑specifc DNA
methylation and SNPs for haplotype region
identifcation》
该软件利用SNP多态性,甲基化位点的多态性辅助以Hi-C数据一起构建出不同的单倍型的甲基化图谱,整合三套数据组装的单倍型将会更长。



首先,左图是只利用SNP多态性组装单倍型,这样显然对于一些比较大的gap是无法很好的组装的,SNP多态性往往是利用SNP矩阵来推断单倍型的:



比方说,reads经过mapping后在第1,2,5个位点出有变异,那么可以组合成很多中单倍型组合:

由此我们可以计算每个碱基向下一个类型碱基转移的概率,通过马尔科夫链得到最优的单倍型:

右图是融合了SNP多态性,甲基化位点的多态性辅助以Hi-C数据进行组装,当出现大的gap时,利用Hi-C互作的数据(在一条染色体中互作频率较高)来辅助组装,这样得到的单倍型片段比较长,有利于分型(下图)。


你可能感兴趣的:(甲基化倍性问题新思路)