【无标题】

泛基因组(pangenome)

泛基因组是一个多基因组组合而成的综合性参考基因组,具备全面捕获各染色体位点上更广泛的可变性和多样性信息的能力。

2022年7月,人类泛基因组参考联盟(Human Pangenome Reference Consortium, HPRC)发布了人类泛基因组草图的预印本,该草图基于47位在人种族和地理多样性上广泛代表的个体,同时还纳入了数百个其他基因组的信息。此前,泛基因组已广泛应用于微生物和植物研究,如今也开始在脊椎动物研究中得到应用。

2023年4月18日发表于《nature》上的文章,标题为“Every base everywhere all at once: pangenomics comes of age”,该文对泛基因组的发展以及研究内容做了相关探讨。

【无标题】_第1张图片

01、覆盖多领域

泛基因组最早来源于微生物研究,在一项对8株无乳链球菌分离的基础上进行了基因组组装,在这个过程中每向该组装中加入一个新的基因组数据,便会在该组装中新增数十个新基因,因此研究人员们将该组装称为“泛基因组”。

在植物学研究领域,首次出了第一批真核生物的泛基因组。其中最早的基因组组装是2014年由中国农业科学院领导的研究小组进行,使用了7个大豆基因组。在测序技术和基因组组装等领域的创新驱动下,人类泛基因组领域已经取得了进展。全球研究人员组成的一个研究网络在2022年3月发布了首个真正完整的“端粒到端粒(T2T)”的基因组序列。

02、发展迅速

在最初的泛基因组构建中,DNA序列信息的收集主要采用了Illumina公司开发的“short-read”技术。尽管该技术非常准确,但读长只有大约100-200个核苷酸。虽然通过进一步组装到contig水平,可以揭示一些较小的变异(例如SNP和inDel),但是对于更大的变异类型则无法进行说明。因此,早期的泛基因组在处理短读长测序数据时,常常采用将各样本的contig映射到现有的参考基因组的方法。然而,这种方法容易生成以基因为中心的泛基因组,可能会忽略单个基因组中的复杂结构变异。这些结构变异在基因调控中可能起着重要作用,并可能携带与基因组演化相关的重要信息。

长读长测序技术的发展,使得可以构建更高质量的基因组,从而以无偏倚的方式比对这些基因组,从而描绘它们之间的位置关系以及差异所在。

03、突破进展

2022年7月,人类泛基因组参考联盟(HPRC)发布了人类泛基因组草图的预印本。虽然该项目选择了47个具有广泛代表性的人类基因组,但这些基因组并没有组装到T2T水平。HPRC的工作流程通常会生成数百个大型contig,其中会存在一些空隙,特别是在高度相似的重复基因阵列和粗糙重复的着丝粒区域(这些区域连接了携带基因的染色体臂)。但值得高兴的是,目前的工作流程已经实现了大部分的基因组的分析,其中名为Verkko的软件,可以极大的简化二倍体的组装,这将有助于实现“2024年时为第一代人类泛基因组组装350个基因组”的目标。

04、图形泛基因组

HPRC的科学家们表明,目前几乎可以做到用单个二倍体基因组样本就获得T2T水平的基因组,但随之而来产生了另一个问题:如何描绘泛基因组?图形泛基因组被认为是目前的最佳解决方案。

人类泛基因组工程的目标是获取全球范围内的人类基因组变异信息,并通过分析这些变异,以及采用创新的展现方式来挑战过去认为人类基因组相似度较高的假设。研究者们将对数百名人类个体进行高质量的基因组测序,并对其中包括单碱基变异、插入、缺失和倒位等遗传变异。图形化模型能够对遗传变异数据进行展示,不设置某种标准或默认的参考基因组。形似地铁线路图的图示使得研究者们能够在序列水平上比较群体中的遗传变异(图1)。

【无标题】_第2张图片

图1 泛基因组可视化

而对于非人类泛基因组的研究者来说,面临更为复杂的挑战。其中一个关键问题是植物相对于人类基因组更为复杂,因此传统的图形组装软件在植物基因组上效果不佳,可能需要更多的工具和方法。此外,人类参考基因组的几次迭代在临床中的采用速度较慢,许多实验室仍在使用较早的版本GRCh38。除此之外,不同领域的研究者可能对新的参考基因组格式持不同意见。因此,促进大家接纳图形泛基因组将是HPRC新的一年的首要任务。

05、未来展望

微生物泛基因组学目前属于领先位置,可以将微生物泛基因组与代谢组学特征结合起来,研究微生物的一些机制作用,如阐明抗菌药物的耐药机制。而植物泛基因组正在帮助研究人员找到一些从前被忽视的、赋予植物恶劣环境条件下生存优势的基因。泛基因组图谱在揭示隐匿变异上可能有同样强大的力量,这些变异隐藏于人类复杂的发育和病理状态背后。同时,可以将参考泛基因组与其他生物学信息相结合,从而更全面地审视染色体变异对细胞功能的影响。

参考文献

Eisenstein M. Every base everywhere all at once: pangenomics comes of age. Nature. 2023 Apr;616(7957):618-620. doi: 10.1038/d41586-023-01300-w. PMID: 37072518.

你可能感兴趣的:(测序,组学)