BioMart在线转换ID

Emsenbl的BioMart工具: http://asia.ensembl.org/biomart/martview/db73e9d48b0fb03717654a65c72012c4

文章目录
0 数据输入格式与输出要求
1 选择人类基因数据库
(1)-> Emsenbl
(2)-> 点BioMart
(3)-> 点Dataset
(4)-> 选择输入的基因来自什么库
2 输入的ID列表
(1)-> 点Fliters(过滤器)
(2)-> 勾选Input ereferences ID list
(3)-> 选择输入的基因ID类别
(4) 文本框内输入Gene Name列表
3 输出的属性选项
(1)-> Attributes(属性)
(2)-> GENE -> Ensembl 选择输出格式
(3)-> External References
4 结果的输出及下载保存
(1)-> (网页左上角)点Results
(2)-> 下载格式选 XLS
(3)-> GO
下面开始BioMart的技术总结
附 Excel分列小技巧

数据输入格式与输出要求

首先,看一下我们的例子,我们的数据是人类的miRNA的Gene name,目的是转换得到 Gene ID、Transcript ID、miRBase ID。

1 选择人类基因数据库
(1)-> Emsenbl
  Emsenbl 网址:http://asia.ensembl.org/index.html

(2)-> 点BioMart
(3)-> 点Dataset
(4)-> 选择输入的基因来自什么库
人类基因选择:选择 Ensembl Genes 92和Human genes(GRCh38.p12)

2 输入的ID列表
(1)-> 点Fliters(过滤器)
(2)-> 勾选Input ereferences ID list
(3)-> 选择输入的基因ID类别
  我们的数据是miRNA的Gene Name,如图选Gene Name(s)

(4) 文本框内输入Gene Name列表

如果数据是Gene ID:ENSG12345678910这样的,选Gene stable ID(s)。以此类推。
  根据自己数据的类型,选择对应的ID格式。(注意看选项后括号里给出的例子,要和自己的数据完全对应上)

3 输出的属性选项
(1)-> Attributes(属性)
(2)-> GENE -> Ensembl 选择输出格式
  注意,所有要显示在结果里的输出格式都要选(包括我们输入的是Gene name格式,那么“Gene name”选择一样要选。否则,结果里不会显示输入的数据,只有一堆转换后的ID,无法输入输出一一对应)。
  所以,我们选择了Gene stable ID(输出)、Transcript stable ID(输出)、Gene name(输入)。

如果需要其他格式,比如ENTRREZID,选择External链接。

(3)-> External References
  同样还在Attributes下GENE里的子选项,下拉。在External References 中,其它的输出格式按需求选择。我们选择了miRBase ID(输出)。此处最多能选择3项。

4 结果的输出及下载保存
(1)-> (网页左上角)点Results
  得到结果,包括了我们的输入列Gene name,输出列 Gene stable ID、Transcript stable ID和miRBase ID。

(2)-> 下载格式选 XLS
(3)-> GO
  然后就可以下载到这个表格的xls版本啦。

下面开始BioMart的技术总结
流程就是以上这么个流程,步骤做一遍就清晰了。
关键是输入格式要选对,注意BioMart所给的ID例子,一定要完全对应,否则无法识别。
输出选项里,注意要把输入格式也选上,否则输入选项并不会显示在结果里。
例子里一共选了4个属性选项,所以得到4个输出列。合理运用BioMart,按需选择输入格式和输出格式,就能对多种RNA做多种ID转换了。

附 Excel分列小技巧
之前同学的同学问我怎么把带版本号的mRNA的Gene ID转换成mRNA的Gene name。
一开始他是在NCBI一个一个查,我觉得吧,可以是可以,没必要是真的没必要,这时BioMart就很好用啦。

他的原数据是这样的(第一列):

由于他的原始数据中mRNA Gene ID 是带小数的,而这个小数并不影响转换得到对应Gene name,直接把放入BioMart作为Gene stable ID又无法被识别。可以选择用excel的分列功能,批量将小数删去。(当然还有很多种删掉小数的方法,这里只是示范一种简单的方法,来让我们的数据和BioMart的要求对应上。)
操作如下:
用Excel打开数据 -> 全选我们的数据 -> 工具栏[数据] -> [分列] -> 选[分隔符号] -> [下一步]

-> 选[其它] -> 输入“.” -> [下一步] -> [完成]

结果如下图。

欢迎留言讨论与交流~
————————————————
版权声明:本文为CSDN博主「lotusng」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/lotusng/article/details/88399218

你可能感兴趣的:(BioMart在线转换ID)