小麦基因组测序研究进展

3/15          本期作者:大胖丫



       最近几年,麦类作物基因组学发展迅速,物理图谱的相继完成将大大加速麦类作物遗传学、比较基因组学以及进化等方面的研究,同时也将大大加速重要农艺性状基因的分离和鉴定。今天跟大家分享的这篇文章来自于 The Crop Journal杂志,题目是“Current advances in genome sequencing of common wheat and its ancestral species (10.1016/j.cj.2017.11.001)”,通讯作者为遗传发育所的凌宏清研究员。我们一起来学习一下麦类作物基因组的研究历史和进展以及我国科学家在这一领域所做出的重要贡献。

      早在2005年的时候,国际小麦基因组测序联盟(International Wheat Genome Sequencing Consortium, IWGSC)就已经启动了小麦基因组测序计划。来自捷克的Jaroslav Dolezel(http://www.ueb.cas.cz/en/users/dolezel)教授利用流式细胞仪分离技术,将普通小麦中国春(Chinese Spring)的21条染色体进行了分离(除3B之外,其余染色体均分为长臂和短臂),并构建了相应的BAC文库。后续物理图谱构建和BAC测序则由IWGSC的成员国分担,我们国家主要是负责7DL物理图谱构建(宋卫宁教授,西北农林科技大学)。到目前为止,基于BAC by BAC策略的所有中国春染色体/臂的物理图谱均已构建完毕(http://www.wheatgenome.org/Projects/IWGSC-Bread-Wheat-Projects),相关研究于2014年在Science发表(doi:10.1126/science.1251788)。

      英国利物浦大学Neil Hall领导的研究小组利用454焦磷酸测序技术,对中国春的基因组进行了全基因组测序。测序深度为5X,基因组组装大小为5.42Gb,并预测了9.4~9.6万个基因,大约有2/3的基因能够定位到A、B和D亚基因组上,相关研究于2012年在Nature发表(doi:10.1038/nature11650,这是小麦基因组的首次发表,也是大家早期用的比较多的小麦参考基因组)。

      2017年上半年,同样以英国为主的的研究小组利用精准大小的mate-pair文库和优化的组装算法,进一步提高了中国春基因组的组装质量和完整性,组装出来的基因组大约占完整中国春基因组的78%,相关研究结果发表在Genome Research上(doi:10.1101/gr.217117.116)。2017年底,美国约翰霍普金斯大学Steven L Salzberg领导的研究小组利用二代(Illunina)和三代测序(PacBio)技术,组装出来大约15Gb的物理图谱,约占中国春全基因组的90%,这是目前为止最完整的中国春参考图谱,相关研究结果发表在GigaScience上(doi:10.1093/gigascience/gix097)。同样,也是在2017年,IWGSC提前释放了中国春的参考基因组“IWGSC RefSeq v1.0”(https://wheat-urgi.versailles.inra.fr/Seq-Repository/Assemblies)。该版本的物理图谱在IWGSC分染色体组装结果的基础上,整合了“IWGSC WGA v0.4”的测序结果,也就是利用NRGene技术的组装结果,将scaffold的N50值提高到22.8Mb,这也是目前小麦染色体级别组装较好的版本,相关文章暂未发表。

      同样得益于NRGene的组装技术,野生二粒小麦的物理图谱也于2017年在Science发表(doi:10.1126/science.aan0032)。研究者利用Illumina测序平台和PCR free的建库方法,获得相对较长的二代测序数据(PE250),再利用NRGene的DenovoMAGIC2软件进行组装,并结合遗传图谱和Hi-C技术,最后得到了一个质量非常高的AB基因组物理图谱。

      我们国家在麦类作物基因组研究方面也做出了很多突出贡献。比如,小麦A基因组和D基因组供体材料基因组草图的完成。小麦A基因组来自于乌拉尔图小麦(Triticum urautu),2013年Nature上发表的基因组草图一共组装出了4.66Gb,约覆盖了整个基因组的94%,scaffold N50值为63.69Kb(doi:10.1038/nature11997);结合PicBio的三代测序技术、BioNano以及10X Genomics技术的第二版A基因组物理图也正在准备发表,组装效果有明显提升,覆盖度大约为98.4%。小麦D基因组来自于粗山羊草(Aegilops tauschii),早期在Nature上发表的第一版物理图谱一共组装出了4.23Gb的序列,scaffold N50值为57.59Kb(doi:10.1038/nature12028);同样得益于新技术的发展,2017年在Nature Plants上发表的第二版数据一共组装出了4.31Gb的数据,scaffold N50值为12.1Mb,整体提升了210倍(doi:10.1038/s41477-017-0067-8)。UC Davis的罗明成老师也于2017年底在Nautre上发表了小麦D基因组材料AL8/78的物理图谱(doi:10.1038/nature24486)。另外,像科农9204以及矮抗58等普通小麦材料的物理图谱构建也在进行中。


你可能感兴趣的:(小麦基因组测序研究进展)