咬文嚼字之mapping&alignment

写在前面的废话

有时候我在读文献时,明明前面用的是alignment,但是接下来又使用了mapping。起初,我认为二者意思相同,后来发现没那么简单。无奈之下只能自己搜集资料思考二者的区别……


心情复杂

太长不看系列

  • alignment:讲究细节,需要知道比对的具体情况
  • mapping:只看整体,不关注比对的具体情况

废话超多系列

alignment vs. mapping

alignment与mapping之间的区别

当我们要比对(align)一个read时,我们不仅要知道它在基因组中可能出现的位置,而且还要知道对应位置的确切碱基。举一个例子,一个read seq1很有可能来源于1号染色体,其坐标位置从123到140。seq1read中的前7个碱基与参考基因组精确比对上,接着有3个碱基的插入,接着剩余的碱基read seq1和参考基因组比对上。

上面的例子中,我们知道这个reads比对的具体信息(具体位置,是否错配,有无indel等),此时我们对这种比对情况称之为alignment。

而当我们匹配(mapping)一个read时,我们仅仅需要知道read它来自哪里,而不关心read和reference之间的确切比对。

比如科研工作者的脱发现象。当我说我秃了,你不用关心我掉了多少头发,还剩多少头发,你只需要知道我秃了这一情况就可以了

挺秃然的

早先,比对(alignment)和匹配(mapping)经常会被误用。但是像Kallisto和Salmon之类的工具改变了这一情况,因为他们将reads assign到基因、功能以及其他的什么东西上,而不需要知道其中确切的比对信息。这样做的方式有两个优点:

  • 更快
  • 我们通常不关心比对,这在一些应用/工具中是一个很大的优势

Kallisto:一个用于single cell & bulk RNA-seq数据的转录本定量工具
Salmon:与Kallisto类似的一个工具

不同种类的alignment

既然讲到了alignment,那我们就继续看看alignment带上不同的形容词,都有什么不同的含义。

  • pairwise alignment:两个序列之间的比对
  • Multiple sequence alignment:两个及以上序列之间的比对
  • Short read aligners:就是寻常说的pairwise

alignment quality vs. mapping quality

我们都知道比对之后,会有比对的质量,那么mapping和alignment的质量有什么不同呢?作为一个认真努力的科研工作者,那我必须深挖一下这个问题。


image.png
  • alignment quality:是指reads比对到参考基因组上的匹配质量
  • mapping quality:是reads正确匹配到基因组位置的置信度(可能性)

比如,将一个read比对到基因组上,这个read在该基因组上的若干个位置都有很完美的比对。此时alignment quality是很高的,而mapping quality是比较低的。

depth vs. coverage

既然都讲到了比对,那么测序深度和覆盖度就不得不提一下了。

  • depth(测序深度):通常是指整个基因组。(测序的reads数 * reads 的长度)/单倍体基因组的长度
  • coverage(覆盖度):通常是指某个具体位点的深度。比如:测序过程中,某一个区域(比如,某个基因,某一个碱基位置等)所覆盖的reads数

coverage取决于具体的比对算法。比如:有的算法会在这里刚好匹配,有的认为在这里存在错配,有的则插入一个gap……

正如上面所述,二者应该是有区别的。但是大部分文献都会将其混用,如果没有前后文的对照,你很有可能会误解作者的意思。

那么该怎么办呢?怎么办呢?通常有三个方法:

  1. 利用前后文语境,猜测此处的含义
  2. 看到coverage首先把它当作覆盖度,看到depth首先把它当作测序深度

此外,需要注意的一点是,depth/coverage经常会和其他词语联合使用,这个时候就需要靠经验总结了。我知道你们肯定懒得总结,所以我在这里给出了自己总结的的一些小tips

  • breadth of coverage(覆盖范围):在给定测序深度的情况下,基因组碱基得覆盖百分比
  • Depth of coverage:等同于coverage
  • Sequence depth:等同于depth
image.png
Reference
  • Sequencing depth and coverage: key considerations in genomic analyses
  • https://www.biostars.org/p/6571/
  • https://bitesizebio.com/34461/ngs-depth-coverage-deep-sequencing/

你可能感兴趣的:(咬文嚼字之mapping&alignment)