植物基因组学-专属于小麦的测序数据库IWGSC

今天将为大家介绍小麦的特有的生物学网站,该数据库是由国际小麦基因组测序联盟(International Wheat Genome Sequencing Consortium, IWGSC)维护,是小麦非常重要的测序数据库。

IWGSC 2018年8月17日在Science杂志上公布了六倍体小麦的最新参考基因组[1]。包含14.5Gb参考基因组大小,涵盖107,891个高可信度的基因,此外还有161,537个低可信度的基因。原始测序数据存于NCBI的SRA数据库,登录号为SRP114784。

网址链接:Home - IWGSC


该网址的主要功能菜单,我们常用的是红色圆圈标注的tools和resources选项

一、六倍体小麦的参考基因组获取


选择tools>sequences>v1.0进行下载

进入该页面后,可以看到有主要以下四个功能菜单。


download, blast, browser, intermine

download 界面的参考基因组下载界面

可以看到有全部(all)染色体的基因序列,也有分染色体的基因序列。逐条下载即可

$ wget  https://urgi.versailles.inra.fr/download/iwgsc/IWGSC_RefSeq_Assemblies/v1.0/iwgsc_refseqv1.0_all_chromosomes.zip

二、blast选项

对于研究一个基因序列,最常见和首要的工作相比就是blast了,iwgsc同样也提供了该选项,在线网址操作,非常简单。

输入的序列为fasta序列,进行比对即可。还可以分染色体进行比对,这个非常实用!

三、基因组在线浏览器功能

根据选择染色体可以浏览正义链和反义链的基因序列,包括翻译后的蛋白质,这个功能非常实用,


可以截取指定区间的序列。例如,若要下载1D的1000-100000序列,在以下红方框中选择1D染色体,输入这个序列,点击Go,便可跳至目标区段,如下图。

四、intermine功能

主要包括search和analyse功能

在这里,输入基因ID就可以得到该基因的fasta序列和长度以及物理位置。

还可以批量注释,在analyse选项,输入多个基因,就可以得到多个基因的注释,这个是一个非常高效的工具

点击蓝色字体,就可以详细查看每个基因的注释

五、总结

IWGSC网址功能还有很多,本文只是简单介绍了一些常用的工具。希望各位小伙伴多研究这个网址,必定大有收获。

参考文献:

IWGSC. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science, 2018, 361(6403): eaar7191.

你可能感兴趣的:(植物基因组学-专属于小麦的测序数据库IWGSC)