图解:如何在NCBI上找到具体一个基因第N个外显子的序列,以EML4基因为例

一个基因包括外显子和内含子部分,有时候我们需要了解基因包含的具体外显子位置信息。确定的方法有很多种,比如NCBI、USUC和Blast等。这里我们用NCBI的方法找到一个基因的外显子序列。

首先打开NCBI网站,https://www.ncbi.nlm.nih.gov/,

1.png

选择“gene”数据框,搜索框内敲入基因名字“EML4”。


2.png

在“search results”页面会出现多个结果,我们选择后面括号注明是Homo sapiens的选项。


3.png

打开界面,可以看到EML4基因的summary信息。包括基因的全名,曾用名,基因名会随着版本的升级而变化,每个基因名对应一个GeneID,这个ID是唯一的。


4.png

往下面看,在基因的regions,transcripts and products界面内,可以看到这个基因的mrna和编码蛋白的编号.NM_开头的序列都是Mrna序列。记住这个Mrna的编号。

5.png

6.png

接下来介绍一个线上的软件,Splign,网址是https://www.ncbi.nlm.nih.gov/sutils/splign/splign.cgi?textpage=online&level=form

6.9.png

可以用Mrna或EST序列与所在的基因组序列比对,可以显示基因的结构。比对结果显示EML4有22个外显子,有对应的基因组比对的序列,明确外显子在Mrna序列上的区域。


7.png
8.png
9.png
10.png

你可能感兴趣的:(图解:如何在NCBI上找到具体一个基因第N个外显子的序列,以EML4基因为例)