Genome Research | 上海交大&农科院作科所徐建龙:基于三代测序数据的水稻泛基因组构建及分析
Long-read sequencing of 111 rice genomes reveals significantly larger pan-genomes
该研究通过引入一系列新方法处理长读长测序,构建了针对三代测序(TGS)数据的水稻泛基因组构建方法。与水稻参考基因组日本晴相比,新方法从105 个栽培稻(OS)构建的泛基因组包含 604 Mb 的新序列,比此前由~3000 个栽培稻品种二代测序数据(SGS)构建的泛基因组(~270Mb新序列)更全面。其中,重复序列是新序列的主要组成部分。加上6个野生稻(OR)品种,水稻泛基因组比现有参考基因组多879 Mb新序列和19,000个新基因。此外,该研究还为所有代表性水稻群体创建了9个高质量的参考基因组,包括 5 个无间隙参考基因组。
为了探究测序技术对泛基因组构建及分析的影响,该研究分别比较了75个水稻品种的二代和三代测序数据构建的泛基因组及其基因的存在和缺失结果(基因PAV)。
进一步对栽培稻的基因PAV与表型进行了关联分析,检测到14,471个显著的基因PAV和表型的关联。例如LOC_Os01g27930(一种反转录转座子蛋白)的缺失与籽粒长宽比增加相关,而它的存在也与籽粒宽度增加相关。
点评:水稻研究真的是太卷卷卷了!!!估计这篇文章也是受到了去年水稻泛基因组Cell文章的冲击。
Plant Com|中国农科院作科所韩龙植&北京大学何航:籼稻血缘渗入对粳稻遗传改良的贡献
Genomic insights on the contribution of introgressions from Xian/indica to the genetic improvement of Geng/japonica rice cultivars
粳稻基因组成分演变:816份不同时期代表性粳稻品种重测序+已发表的5500份水稻测序数据,1980年前、1980-1990年代、2000年后粳稻品种基因组中籼稻血缘分别占1.7%、3.3%和6.9%,粳稻育种改良过程中籼稻血缘比例逐渐提高;籼稻血缘的导入贡献了一些粳稻品种中缺乏的优异等位基因,从基因组层面反映了我国粳稻的改良历史。
籼稻血缘渗入对粳稻性状改良的贡献:来自3个不同籼稻亚群的血缘向粳稻品种中的渗入持续增加,籼稻血缘的渗入使粳稻的重要性状发生了显著变化,如稻瘟病抗性提高、每穗粒数增加、单株穗数减少、株型由多穗型向重穗大穗型转变。还发现与株型、产量和抗病虫性相关基因的等位基因由籼稻渗入到粳稻中。
调控水稻穗粒数新基因Gnd5为渗入的靶基因:利用全基因组关联分析,鉴定了一个调控水稻穗粒数的新基因Gnd5,该基因编码GRAS家族的转录因子,与野生型相比,Gnd5敲除突变体的穗粒数显著减少(图 2)。研究发现,与早期育成品种相比,Gnd5基因籼型优势单倍型Hap2频率在中、后期育成品种中不断提高,说明Gnd5基因是渗入的靶基因,对育种具有重要的应用价值。
3个代表性粳稻系谱中优势单倍型的利用模式:研究系谱中穗粒数相关基因单倍型的利用模式,发现多基因的优势单倍型聚合利用存在较强的系谱背景特异性。
点评:邓兴旺和何航老师前年才发表两系三系的渗入,现在又来籼稻渗入粳稻。
PBJ | 四川农大卢艳丽:预测植物蛋白质点突变功能效应的机器学习工具PPVED
PPVED: A machine learning tool for predicting the effect of single amino acid substitution on protein function in plants
利用UniProt/Swiss-Prot、NCBI/PubMed等数据库资源,整合了一个植物蛋白质点突变数据库,一共包含12,865个SAAS,并将其随机划分为基准数据集和独立数据集。基于基准数据集,从蛋白质序列、结构与功能等层面出发,广泛采集了1,215种表征SAAS的特征信息,使用自行设计的特征选择管道筛选出48种重要的特征。
基于这48种特征,分别应用随机森林、极端梯度提升、支持向量机以及前馈神经网络等算法,构建了15种机器学习模型。评估结果表明,以极端梯度提升算法构建的模型(命名为植物蛋白质变异效应检测器,Plant Protein Variation Effect Detector,PPVED)性能最优,在基准数据集上的预测准确度和曲线下面积分别为0.872和0.940,在独立数据集上分别为0.856和0.931。
从三种角度进一步验证了PPVED的预测能力。首先,比较了PPVED与6个广受欢迎的现有工具(基于人类SAAS数据而开发)的性能;其次,将PPVED预测应用于包含314个功能性SAAS和1,515个中性SAAS的数据集;最后,利用PPVED对拟南芥、玉米中的6个SAAS进行预测和实验验证。
为了方便用户使用PPVED,作者将PPVED部署成了在线Web服务(网站链接为http://www.ppved.org.cn)。
点评:这才是生物信息从业者的正确姿势,点赞学习。
Plant Com | 新加坡南洋理工大学综述:植物基因表达信息挖掘手段与方法
Exploiting plant transcriptomic databases: resources, tools, and approaches
本综述精选出了一些提供独特方法来研究基因功能的数据库,并为植物研究者们展示了如何从这些数据库中挖掘信息,从而服务于其正在着眼的研究。
点评:Plant Com今后要想和MP一样有影响力,不能总发综述灌水。