转自:https://mp.weixin.qq.com/s?__biz=MzAwMzY4MTYxNw==&mid=2655752921&idx=1&sn=159f79dde58d2145c59307e23a06b97a&scene=0#wechat_redirect
有朋友在后台留言让介绍下UCSC Genome Browser,其实小张很早就想介绍了,无奈这个数据功能太强大,就像NCBI一样,收录的信息太多了,不是一两次能说清楚的,大家用NCBI用的最多的还是pubmed、Blast等少数几个功能,
其他大部分工具用的还是比较少,比如GEO:
而UCSC就是一个类似于NCBI的航母,收录的各种各样的战斗装备:
今天我们挑UCSC Genome Browser拿出来讲,顾名思义,基因组浏览器,是根据基因组的位置、基因ID等信息进行浏览。我们从UCSC主页面(http://genome.ucsc.edu/)进去后,点击Genome Brower就可以了:
在打开的页面中,我们看到显示窗口是我们看结果的地方,最下面除了Mapping and Sequencing(比对和序列)外,还有以下几部分功能框:
每部分功能框又包括几个数据源,比如在Genes and Gene Predictions中,就包括:GENCODE、RefSeq Genes等20个数据源,每个数据源显示结果可以包括hide、dense、squish、pack和full这五个不同的显示水平,按照前后顺序full是全部显示,hide为隐藏,即越靠下显示结果越多。
每个数据源都可以单击查看说明,比如RefSeq Genes的说明:
下面我们通过一个例子看上面几部分的意思,首先我们检索一条lncRNA malat1:
当然,这里也可以根据染色体位置检索,在检索框直接输入位置:chr11:65,497,762-65,506,469,在窗口中出现malat1的基本信息:
这时我们的功能框只有以下几个数据源设置的不是hide显示模式:
所以在显示窗口中只显示了mRNA和基因的信息。下面我们通过调节功能框查看不同的结果,
Mapping and Sequencing:比对和序列信息,比如GC含量(五个碱基内GC的比例),我们把GC含量调整为full显示,然后单击右上角refresh:
我们看到红框内新出现的结果,我们知道GC含量是设计引物时一个重要考虑因素。
Genes and Genes Prediction:这里我们把功能框的UCSC Alt Events(显示基因中可变剪接等可以导致产生不同转录本的事件)设置为full显示模式:
比如altPromoter的意思是有多个转录起始位置,cassetteExon意思是在某些转录本中出现的外显子。
Phenotype and literature:表型和文献,我们把OMIM Pheno Loci(孟德尔遗传病和基因位点)设置为full:
刷新后
mRNA and EST: 我们把Human mRNAs设置为pack显示,SIB Alt-Splicing(可变剪接方式)设置为full显示:
Expression: 表达。我们把GNF Atlas 2(通过Affymetrix芯片对79对人组织样本进行的表达检测)设置为full:
Regulation: 表达调控,我们单击ENCODE Regulation,在弹出的界面中选择:Transcription,H3K4Me1,H3K4Me3和H3K27Ac四种,然后提交
跟我们在文章里面看到的就有点像了,我们点击zoom out可以缩小显示:
Comparative Genomics:比较基因组学,比如我们需要看MALAT1在物种中的保守性如何,就可以设置Cons 20 mammals为full 模式:
当然 ,也可以选择物种显示:
Variation: 显示SNP以及indel等结构变异,设置Common SNPs(147)为full显示模式:
刷新:
Repeats:重复序列。这里我们设置repear Maskers为full模式,