解读Genome Browser FAQ

https://genome.ucsc.edu/FAQ/FAQgenes.html#ensRefseq 

其实在做比对的时候,会有不少的reference.那么这些Ref有什么区别呢。是不是都通用呢。其实,有可能用得不恰当,会对你的数据结果产生误差。好在今天机巧下去ucsc下载了一下鸡的基因组gff。然后发现了有3个那么多。
本来嘛,大小差不多我也就当作没看到了,但是这次差得那么多,就没办法了。要去盘它。



这三个东西的差异何在呢?(下面还涉及到有GENCODE)
RefSeq transcripts比Ensembl/GENCODE transcripts小得多,RefSeq transcripts有自己的独立于基因组组装的序列,所以某些特定人群的变异可能在RefSeq中,并且完全不存在于参考基因组序列中。
RefSeq gene transcripts he UCSC Genes/GENCODE不一样,它可以和基因组不一样。因此,可以把它当作是novel或者不常见的突变基因来看待。
而UCSC比对的优势在于,它比其他的数据库更新得更频繁,而且是可用以前的数据库(GRCh37/hg19),但也因如此,它不够稳定,也不是官方的标准。


GENCODE又包括Basic和comprehensive两个集合。大部分人使用basic就足够了。


CCDS(The Consensus Coding Sequence Project)是基于RefSeq和Ensembl/GENCODE共同注释的,非
常保守,所以不想想着用来对比UTR区域和非编码转录本了。


下面是几个转录本tracks的比较。以2019-3 hg38为例


你可能感兴趣的:(解读Genome Browser FAQ)