在NCBI查找指定物种基因组信息

【原创】在NCBI查找指定物种基因组信息


生信分析中经常需要查找指定物种的基因组信息。如:基因组相关分析中需要借助已有基因组辅助基因组组装及基因预测;转录组同样查找已有基因组作为参考基因组;宏基因组/宏转录组同样需要查找基因组来剔除宿主数据,等等。。。

本文仅以目前最常用的综合性基因组数据库 NCBI 为例,演示下基本的物种基因组检索方法。

1、获取物种拉丁名

这个方法有很多,最常见的百度百科就基本可以满足绝大多数需求。
以 小菜蛾 为例:

“小菜蛾”百度百科结果

找到 “小菜蛾” 的拉丁名为:Plutella xylostella

2、NCBI检索基因组

检索数据库选择 Genome;搜索框输入物种拉丁名 “Plutella xylostella” 

点击 Search 后会跳转至 NCBI 推荐基因组,该基因组一般为组装结果较好或注释信息较全的基因组

同时也可以看到,这里显示本物种在NCBI中共收录有7个基因组信息

 “Plutella xylostella” NCBI检索结果

3、全部基因组浏览

如果想要查看NCBI上关于本物种更多的基因组信息,可点击上图中的 “list” 链接:

进一步跳转至  “Plutella xylostella”  全部基因组浏览页面:

“Plutella xylostella”  全部基因组浏览

比较重要的几列信息如下:

第 1 列:物种信息
第 3 列:亚种、菌株等编号
第 6 列:对应基因组Assembly编号,点击可直接跳转对应基因组信息页
第 7 列:基因组组装水平,一般选取 Chromosome 或 Complete Genome 水平基因组
第 8、9、12、14 列:基因组组装大小、GC含量、序列条数、更新时间等信息
第 13 列:基因组CDS预测结果,确实则表示该基因组未进行CDS预测,即缺失基因信息

在这里即可根据自身需求选择合适的基因组进行相关分析啦~

你可能感兴趣的:(在NCBI查找指定物种基因组信息)