点击上方「蓝字」关注我们
论文信息
原文标题:Predictive biology: modelling, understanding and harnessing microbial complexity
发表期刊:Nature Reviews Microbiology
发表时间:2020.05.29
第一作者:Allison J. Lopatkin
通讯作者:James J. Collins
第一单位:MIT, Cambridge, MA, USA
原文链接:
https://doi.org/10.1038/s41579-020-0372-5
编译:张松 云南大学国际河流与生态安全研究院
摘要
预测生物学是合成生物学和系统生物学的下一个伟大篇章,特别是对微生物而言。曾经看起来不可行的任务正在越来越多地被实现,比如设计和实现复杂的合成遗传环路,执行复杂的感知和驱动功能,以及组装具有特定的、预先定义组分的多物种细菌群落。这些成就是通过整合生物学、物理学和工程学等多学科知识而实现的,从而对生物设计有了一个新兴的、定量的理解。随着多组学数据的持续扩增,它们将理论转化为实践的潜在应用仍然牢牢植根于支配生物系统的基本量化原理。本综述讨论了:
① 微生物预测生物学的关键研究领域;
② 与微生物固有的复杂性相关的挑战;
③ 定量方法在提升微生物学可预测性方面的重要性。
引言
在当前的大数据时代,预测分析已经彻底改变了我们的日常生活。预测生物学致力于基于已知输入数据的来预测相应的生物结果,该学科在大数据爆发的背景下应得以快速发展。然而,在过去的几十年里,生物学并不像我们所希望的那样容易进入到预测分析框架里。在最近20年里,现代实验技术应运而生,并能够将大量的生物数据呈现出来。然而,将这些数据转化为机制性或有意义的生物学知识仍然是一项艰巨的、劳动密集型的任务。最近的一项研究估计,致力于数据分析和整合的工作可能很快就会超过最初获得数据所需的工作量,这对从宏基因组数据中识别微生物群落动态,建立准确的细菌代谢动力学模型,或推断基因调控网络等任务构成了挑战。尽管机器学习和其它人工智能(AI)技术擅长分析和检测大数据中的趋势和规律,但它们在提供和完善生物学解释方面做得并不好,特别是因为这些关系往往是非线性的。要将这些丰富的数据转化为具体的生物学知识,需要进行相应详细的定量分析。
数学模型特别适合于解决这些需求,从而成为人工智能方法的根基。由于生物系统具有不断变化的性质,因此动力学模型与预测生物学关系尤为密切,这些模型是本综述的主要焦点。事实上,这些经典的系统生物学模型是查询、解释和参数化生物网络的最成熟的技术之一。此外,从生物学第一性原理推导出的minimal models可以作为大数据推断的网络结构的重要确认。因此,它们与几十年前一样,在今天仍然具有重要意义。因此,尽管深度学习等现代“黑匣子”工具很有吸引力,但我们不能忘记或忽视对潜在的生物系统进行数学建模的研究;相反,它应该被视为新兴技术的一种补充方法。因此,我们先从动力学系统建模的简要概述开始。然后,再从生物复杂性不断增加的背景下检查建模的有效性,从较低级别的细胞过程(例如转录)开始,并逐步发展到群落级别的生态和进化动力学。这种自下而上的建模方法突出了预测生物学目前存在的机遇和挑战;因此,我们讨论了数学模型阐明基本生物学设计原则的关键例子,并讨论了继续强调生物系统潜在动力学的迫切需要。最后,概要了生物建模中的一些挑战,并探索了深度学习等新技术如何与系统建模相结合,以实现预测生物学的全部潜力。
微生物动力学建模
经典的系统生物学模型已经被证明是一个基本的工具,我们可以用它来解释微生物的许多复杂性。这些方法通常使用微分方程通过模拟随时间变化的生物分子浓度来描述基因调控网络的动态。直观地说,这种方法直接将观察到的动态与特定的生化相互作用联系在一起。这样的网络模型可以用来生成所提出机制的可验测性假设,并识别最佳或可行的参数空间以实现所需的功能。尽管基因网络的数学表示可能足以精确地模拟观察到动态(如在遗传触发开关中),但在许多情况下,单独基因网络的拓扑结构本身不足以完全预测生物行为。这种脱节通常是由于网络组件之间不可预见的相互作用、细胞上增加的新陈代谢负担和生物变异性造成的。然而,越来越明显的是,细胞生长和细胞内生化网络之间的耦合给预测增加了复杂性和可变性。生物化学网络模型可以很容易地解决这个问题,通过在全细胞或种群水平上整合微生物生长动力学的反馈,可以很容易地解决这个问题。为此,同一项研究表明,由于生长抑制而导致的基因表达对代谢负荷的影响将非线性引入了转录因子动力学,并将这种反馈纳入他们的模型中,解释了观察到的双稳态。具体地说,代谢负荷和正反馈循环的结合足以重建观察到的双稳态:在低转录因子水平,最低的代谢负荷意味着细胞生长迅速,从而保持低荧光报告信号。相反,高水平的转录因子诱导了大量的代谢负担,从而减缓了细胞的生长和增殖;这防止了报告分子的稀释,从而保持了强烈的荧光信号。尽管群落动态最容易以相对增长率为特征,既方便又全面,但它们不可避免地掩盖了可能各自影响紧急功能的复杂层次。在动态建模的背景下,经常需要考虑生态(选择、竞争等)或进化(适应、水平基因转移等)交互作用,或者两者兼而有之,以精确地查看、量化并最终预测自然和工程系统的行为。理解这些潜在过程是如何缩放和相互影响的,对于开发更精确的动力学模型至关重要。事实上,在许多情况下,对群落水平的相互作用进行建模已被证明是有用的,包括预测细菌系统中突变出现、同源基因交换和生态分化的影响。
对不断增加的生物复杂性进行建模
微生物动力学,都受基本的内在因素(转录、翻译和代谢过程)和外在因素(环境、生态和进化)的影响(图 1)。这些因素及其相关过程本质上是相互依赖的,并且经常传播可变性和反馈,这些可变性和反馈可以决定信号通路、微生物、种群和群落层面的突发行为。下面将强调如何在模型复杂性的每个渐进步骤(从转录到群落级动态)定量地梳理各种复合因素,这提高了我们预测、理解和设计日益复杂的生物系统的基本能力。正如我们将看到的,在许多情况下,建模的目标是定量描述这些因素及其相关过程如何影响细胞适合性或微生物生长动力学。
图1. 生长动态的主要调控因子。
a | 影响增长动态的内在因素。从左至右显示了影响总体种群动态的内在过程:转录,翻译,新陈代谢和种群增长。第一行显示单个基因(蓝色)在所有四个过程中的遗传信息流。下面的行显示了转录水平的变化(以红色表示的第二个基因的表达来改变蓝色基因的表达)如何导致种群水平的差异。b |影响生长动力学的外在因素。以从良好的(蓝色)到较差的(红色)底物的变化为代表的环境条件可以不同地影响生长表型(左)。总体种群产量和单个物种的丰度受到混合群落中局部生态相互作用的影响,例如,由于第二个种群(黄色)(较高)的盛行率较高,一个种群(蓝色)受到抑制。相同的初始种群根据选择压力的不存在(顶部)或存在(底部)而表现出不同的进化动力学,此处以有利于特定遗传变异的抗生素(Abx)为代表(右)。
转录
在最基本的层面上,生物网络是建立在基因表达模式上的,认识到基因网络的每个单独组成部分本质上都限制在相同的细胞内资源库中,这一点很重要。因此,仅仅过度表达一个基因会降低其它基因的表达水平。这些隐藏的和经常被忽视的相互作用是由于对游离核糖体和RNA聚合酶的竞争而产生的,并导致全球增长率发生变化,这些变化归因于基因表达能力。数学模型已经被用来描述这些相互作用,并基于资源限制开发了基因表达的控制策略。为了调查基因表达对生长的影响,一项研究量化了各种不同合成结构的全局表达负担。这一分析表明,表达并不严格地与宿主的负担成反比,这种非线性在具有强核糖体结合位点(RBS)的结构中尤其明显,这表明RBS的强度可能是基因表达能力的基础。作为对这些观察的补充,对体内基因表达的模拟表明,特定的转录序列(例如,稀有密码子)只减少了具有强大RBS的设计的翻译。因此,作者使用他们的模型优化了正向设计,并验证了最大化表达效率的构建。环境因素对基因表达的影响也会限制微生物的生长。另一项研究测定了不同环境条件下1800个大肠杆菌启动子活性水平的变化,包括不同的碳源、温度和渗透胁迫。这一方法表明,一个恒定的全局比例因子可以唯一地描述每种情况下约70-90%的基因表达变化,而不考虑特定的启动子。换而言之,给定启动子在任何两种不同条件下的活性水平都是成正比的;而且,在绝大多数被测试的启动子中,这种比例的大小是保持不变的。不同潜在解释的机制模型定量地证明了全局资源分配策略最适合实验数据;该模型假设,在每种条件下,总启动子活性在特定条件和全局表达的基因之间分配,从而纳入了专门用于每个基因的资源的相对比例和不同条件下的生长速度差异。自此,综合的计算或实验研究利用了对资源分配的基本理解,更深入地探索了支配转录调控的特定于环境的规则,并确定了代谢有效的基因回路的设计原则。作者发现,负反馈基序可以控制相对的资源利用(从而在表达水平上进行权衡),提高了整体效率,并提出了一种细胞优先考虑多个能量密集型过程的机制。在一些实例中,加入基因表达能力对于精确模拟在基因重新编译的大肠杆菌中观察到的模式形成是必要的,这些结果为系统发育中尺度不变性的机制基础提供了基本的见解。
翻译
上面讨论的基因表达中固有的混杂相互作用通常在蛋白质水平上被进一步放大,在蛋白质水平上,合成和细胞增殖之间存在着内在的关系。蛋白质约占细胞干重的50%,蛋白质维持(如修复、周转等)是维持代谢的主要耗能成分。因此,与基因表达一样,翻译带来的新陈代谢负担也会影响细胞的适合性。事实上,一项研究使用核糖体图谱来量化蛋白质合成的绝对速率,并揭示了基本的细胞控制策略,通过这些策略,细胞可以优化蛋白质的生产,以最大限度地提高生长效率。作者通过计算研究了增加l-蛋氨酸生物合成的限制步骤甲硫氨酸的产量和收益是否会改善总体增长,而不考虑成本(由于对核糖体的竞争)。值得注意的是,该模型预测,与实验测量结果非常匹配的MetE参数会出现最佳生长,这表明细胞可以调整Met的产量,以最大限度地增加生物产量。事实上,作者通过实验证明,从基线开始,MetE产量的增加或减少都会降低增长率。除了与生产相关的成本外,表达蛋白质的好处可以直接通过它的分解代谢活性来衡量,只要它们可以单独测量。为了量化蛋白质活性的成本,一项研究建立了一个巧妙的实验框架,将乳糖的生产与降解分离;利用一个适合度的定量模型,作者表明,乳糖渗透酶活性的成本,而不是它的生产成本,特别说明了细胞负担的增加。沿着这些思路,另一项研究通过使用无细胞系统来估计翻译效率,然后将这些估计合并到增长负担模型中,以准确地预测有效的构建设计,从而类似地避免了混淆的生长效应。微生物学家特别感兴趣的是揭示细胞如何在不同的条件下实现强健的蛋白质动态平衡,以及这如何转化为整体的健康状况。从基础生物学和翻译的角度来看,对这些功能能力进行建模的能力都会产生影响:可靠地调节这些网络可以让我们对合成系统中的蛋白质表达进行更精细的控制,而促进错误折叠可能是一种替代策略。为此,对蛋白质组水平上的资源分配的定量分析和建模揭示了使有效增长最大化的各种控制策略。在动态变化或恶劣的环境条件下,这些原则对于预测或优化生长和其他表型特别有用。使用通量受限模型来预测代谢表型和干预策略;虽然这种模型主要依赖于基因组规模的框架,因此不在本综述的范围内,但仍然必须注意,当动力学速率和半最大常数等其它代谢参数难以实验估计时,这些简化的方法可能特别有用。上述研究表明,基于基本控制策略而不是基于特定的速率参数来建立模型,可以确保模型在广泛的生理设置中保持预测值。这些研究工作表明,我们利用本地细菌网络实现外部控制和工程设计的能力日益增强;随着我们对基本知识的理解不断进步,集成程度越来越高的模型可能会大量涌现。
代谢
代谢活动对生长(如生物量生产)和非生长维持功能(如应激反应、渗透调节等)都有影响,因此,描述代谢特异性效应很容易被生长动力学所混淆。事实上,细胞在单一基质上生长的经典Monod模型理想地描述了允许生长环境中的动力学,适用于广泛的理论和实验研究。然而,面对营养限制或其它抑制环境,在这些环境中,新陈代谢致力于生存而不是生长,通常需要额外的复杂性来解释种群行为;当细菌受到各种压力或快速变化的条件时,这一点尤其相关。
恒化器实验促进了这种维持代谢物的量化,并将这些内源性代谢率纳入生长模型,使我们能够梳理出代谢特异性依赖项。例如,虽然抗生素效力随着细菌生长速度呈线性增加,但我们开发并实验验证了一个数学模型,该模型表明,当生长和新陈代谢分离时,抗生素的致死性取决于治疗时的细菌代谢状态,而不是生长速度。我们的工作表明,最初药物-靶点相互作用后的代谢反应驱动了细菌对抗生素暴露的许多方面的反应,并揭示了一个代谢阈值,低于这个阈值,抗生素的致死性可以忽略不计。
将代谢通量分析与底物动力学相结合的研究已经为控制微生物生长的规律提供了强大的进化洞察力,并突出了混合计算模型的价值。这些发现和分析提供了对新陈代谢适应各种环境刺激的时间动力学和调节可塑性的洞察力。作者观察到,对于某些糖的组合,每个系统的激活是同时发生的,而不是顺序的。这不能用一个简化的模型来解释,该模型将适合度作为生长的函数进行优化,这表明多模态适合度可能是双重糖利用的基础。这些发现可以为未来在实验室或自然环境中控制微生物生长的策略提供依据,例如通过调节外源糖的组成来强制执行所需的预先确定的生长曲线。
深入了解代谢策略的调控机制,对于实现目标函数最优化的合成生物学和代谢工程应用(例如,有效利用有限的资源),以及理解特定环境与其同源微生物群落之间的相互作用具有重要意义。事实上,新陈代谢在定义和塑造自然环境(如肠道微生物)中微生物种群的相互作用网络中起着重要作用。
微生物群落水平动力学:生态与进化过程
到目前为止,我们主要是在单个微生物的背景下讨论生物复杂性。然而,正是这些个体细胞的集体效应及其潜在的动态决定了新出现的种群水平和群落水平的行为。一个典型的群体通常包含生化和遗传水平的异质性。这种变异性可以导致新出现的、多样化的生态和进化动态,包括竞争、免受压力保护、群落稳定、结构化环境中的合作、利他行为和水平基因转移等等。微生物生态学和进化的全部广度和深度超出了本综述的范围。因此,在本节中,我们讨论细菌种群和日益复杂的群落中的异质性,突出说明对这种效应进行建模如何揭示了对微生物行为的基本洞察力的精选实例。
如上所述,由于固有的生物化学噪声,即使是克隆种群也可能表现出异质性,这可能导致复杂的种群水平动态。这些效应及其后果已经得到了深入的研究,特别是在进化和基因表达的随机模型的支持下。这些模型已经证明,噪声引起的波动可以通过生物网络传播,从而决定行为。将这样的方法与反馈环和其他放大机制相结合,已经产生了微生物模型,这些模型解释了生长动力学中意想不到的实验观察,包括总体适合度的增加或细胞大小的瞬时振荡。生化异质性也会极大地影响细菌对生态紊乱的直接反应。在某些情况下,这种噪音可以被特定的基因网络放大,作为非线性决策的一种形式。
与生化噪声模型相比,理解遗传异质种群或群落的动态是一个相对较新且未得到充分认识的挑战;事实上,宏基因组学的出现直到最近才揭示了原位微生物群落的多样性和复杂性。尽管如此,面对这种变异性,建模已经被证明是推断微生物群落组装、功能和长期动态规律的一种特别有效的工具。不同的建模框架已经被用来基于较小的物种相互作用集推导出多物种组装原理,这是预测复杂微生物繁殖动态的第一步。这种方法揭示了特定的生态相互作用网络,可以解释多物种群落内的共存。
除生态因素外,一个群落的长期命运天生就取决于随着时间的推移对其它种群和当地环境的适应。这些进化动态可能导致意想不到的紧急特性。整合了生态和进化过程的不同模型揭示了随着时间的推移,这种反馈是如何约束或促进稳定的群落的。研究表明,尽管进化是随机的,但只要有了群落构建和环境适应的知识,就可以预测到进化。为此,最近的工作导出了简单的粗粒度统计定律,这些定律可以用来描述群落动态,而不是动力学建模;这样的模型可以被利用来产生长期预测,而不需要完全知情的机械论基础。
鉴于有助于微生物联合体组装和稳定的无数相互作用和可变性来源,将模型指导的方法和高通量实验平台相结合,可能有助于捕获全面的潜在动态,从而提高我们的预测能力。
由于自然选择是在表型水平上进行的,因此生化异质性和遗传异质性内在地联系在一起也就不足为奇了。生物化学变异性会影响微生物种群的长期进化结果,这取决于特定的环境。例如,一项研究表明,在周期性使用抗生素的情况下,随机产生的‘滞后时间’(细胞分裂时间)延长的突变体被选中。作者使用一个模型来预测滞后时间将被优化,以匹配抗生素暴露的持续时间;这些预测与实验测量结果密切匹配,为进化动力学提供了至关重要的见解。
微生物对抗生素治疗的反应和随后的耐药性突变的进化被合并到一个单一的数学框架中。这体现了预测复杂微生物群落动态的主要挑战之一:鉴于微生物基因组相对较小,以及它们的快速增殖和突变率,生态相互作用(例如,对扰动的反应)往往与进化变化同时发生。事实证明,建模在区分这些方面特别有用,提供了对每个过程的主要影响因素的基本见解。
挑战与机遇
显然,自然微生物系统和合成微生物系统的复杂性都因生物控制、生物分子可变性、网络水平和基于种群的相互作用而变得更加复杂。各种各样的建模策略使我们能够实现对这些系统的一定程度的可预测性和可控性。然而,随着实验能力和可用数据的广度不断增加,下一代生物模型将需要以更加深思熟虑和优化的方式进行设计。事实上,如上所述,增加模型复杂性并不一定会带来更高的受益或准确性。模型不应包含尽可能多的复杂性,而应基于明确定义的、具有生物学意义的假设,基于对潜在混杂因素和周围生物学背景的理解。在某些情况下,半机械式或粗粒度框架可能更适合于建立管理观察到的微生物行为的一般规则。
就像软件、架构或产品设计一样,建模应该被认为是形式遵循功能的情况-最低限度可行的、适合目的的模型是理想的,因为它们充分描述了感兴趣的动态,同时保持直观和易懂。在实践中,复杂性和抽象性之间的权衡通常由实验验证反复提供信息。尽管人们可以想象某些“经验法则”,例如,在研究繁重的网络时加入增长动力学,或者在拓扑结构显示非线性时整合噪声效应,但最终还是要由建模者来确定可靠地捕捉感兴趣的生物现象所需的尺度。
如上所述,预测性建模促进了我们对生物学理解的许多进步,展示了它的实用性。然而,随着该领域的发展,目前仍然存在一些技术和概念上的挑战,这些挑战限制了我们对复杂生物系统基础知识的范围和细节。在许多情况下,可以立即利用数学建模方法来开始解决这些缺点。在本节中,我们确定了我们认为是预测生物学领域的关键限制的五个主要挑战,特别强调合成生物学和系统生物学。我们将讨论每个挑战的代表性方面和示例,并强调合并建模可能特别有益的方式。
与前面关于复杂性的讨论一样,这些挑战通常是建立在彼此的基础上并相互促进的。此外,我们特别提醒要警惕越来越多地使用先进的计算技术,包括机器学习和深度学习。正如引言中提到的,更经典的建模与这些基于人工智能的方法的集成代表了数量生物学令人兴奋的新途径,但必须以理性、知情的方式使用。事实上,我们认为,强调动力系统建模和下一代机器学习各自优势的混合策略代表了预测生物学的未来。
1. 预测复杂的基因网络动力学
即使在几十年的进步之后,准确预测潜在的基因调控网络(无论是自然的还是人工的)所决定的细菌细胞动力学仍然是一个重大的挑战,因此我们在这里首先讨论它。随着基因通路变得越来越复杂,由于细胞内的混杂因素以及对环境条件的敏感性增加,预测它们的动态变得相应地变得更加困难。这些困难随着异质性的增加而进一步加剧,即使在进化不是重要考虑的短时间跨度内也是如此。尽管有这些挑战,基因通工程的进步,与建模方法相结合,为这个领域的未来提供了一幅蓝图。
最先进的合成基因通路的精确度和复杂性达到了前所未有的水平。展望未来,要实现明确定义的行为,将需要优化通路本身的生物物理约束,最小化不想要的次要影响(例如,资源负担或噪声),并扩展附带的模型以考虑种群间的相互作用。随着特征明确的遗传部分、以及快速无细胞组装方法的出现,这变得越来越有可能,从而产生高度复杂和分层的通路。继续挖掘和表征生物分子成分,以及建立报告最优组装配置的方法,将效率限制降至最低,这将确保即使微生物工程的范围扩大,模型仍保持直观和信息丰富。
除了基因通路本身的组成部分之外,具有明确敏感性和精算功能的特征良好的微生物群落的文库(例如,基因通路的种群水平类似物)可以允许模块化的群落组装,就像它们的基因通路前身一样。尽管有一些这方面的研究了,但还需要做大量的工作来系统地定义这些生态单位(例如,隔离、基因通路、环境或某种组合),并实现它们的系统表征。
2. 大规模数据的推论和参数化
最终,预测种群动态的能力取决于从日益庞大的数据集中发现具有生物学意义的见解。虽然大型计算基础设施可访问性的提高使我们有能力开始探索这些数据集,但随之而来的是巨大的挑战。这些挑战之一,也是我们提出的第二个挑战是,由下一代和高通量技术产生的数据集的巨大规模可能会导致不可预见的协变量或因素,模糊了生物学意义和统计意义之间的区别。机器学习方法非常适合于处理大数据集,以前的研究已经使用这些方法来整合和搜索大量类型和数量的数据,以提取感兴趣的特定特征,如识别网络体系结构。然而,机器学习模型容易出现过拟合、偏差和不可解释性,导致模型结构难以在体外验证或缺乏预测价值。
3. 合适的模型参数化和抽象化
因此,第三个关键的和相关的挑战是如何有效地从大数据集中提取准确的、生物相关的参数。有许多方法可以将机器学习和人工智能与动态建模方法相结合,以提高向前推进的参数估计的可靠性。也许其中最能实现的是使用算法来抽象和简化建模方法。例如,使用人工智能方法发现的生物关系可以用来简化后续的(半)机械模型,理想地减少所需参数的数量和/或获得可靠数值的难度。事实上,一项研究使用支持向量机方法推导出一个简化的标准,该标准在没有明确描述潜在的互惠作用的情况下预测一般互惠群体的结果(共存或崩溃)。通过模拟和实验数据验证了抽象判据的预测性。这种简化方法也可以应用于相反的方向-机械模型可以用来约束自动算法探索的交互空间。对于必须同时考虑生态和进化压力的混合微生物群落模型,精确参数估计的重要性尤为明显。在这些模型中,仅梳理和合并相关属性对于得出有用和可翻译的见解至关重要。结合适当抽象的模型,采用创新的实验方法,例如生长率估计的宏基因组量化,来评估难以测量的参数,无疑将通过消除无信息的协变量来提高生物学相关性。
4. 将体外观察转化为体内观察
我们提出的最后一个挑战是翻译过程:我们如何最好地从体外实验室环境中获得观察结果和结论,并将它们应用于体内环境和生物医学背景下出现的微生物群落?努力增加实验条件与自然环境的相关性,无论是通过转向活体模型,还是通过整合化学和物理约束来更好地模拟感兴趣的环境,可以更好地与旨在纳入额外生物复杂性的数学模型开发以互补的方式结合起来。缺乏可译性通常在另一个方向上也很明显,即在实验室环境中重建自然系统。例如,自然界中发现的大多数微生物是不可培养的,实验室微生物菌株往往描述得很差;需要培养技术和/或现场测量的进步来建立准确的预测模型。这些方法也许有一天能够使目前无法培养的菌株能够在体外进行操作。
图2. 预测生物学的未来研究范式。
经典系统方法由动力学建模和实验验证之间的连续反馈定义。 随着机器学习和深度学习算法的日益普及,预测生物学的新范式将越来越多地结合所有三种互补方法,这要归功于下一代高通量技术可访问的广泛实验数据。
结论
动态模型在我们对生物行为的集体理解方面取得了许多进展,特别是在微生物群体中。这些模型允许我们在多个层面上探究生物复杂性,从基因表达到进化结果。尽管有这种灵活性,但仍然有一些挑战限制了预测生物学的影响。毫无疑问,解决这些挑战将需要并行的多学科交叉努力,以推动微生物学的实验和计算技术超越当前的最先进水平。然而,在过去的二十年里,动力系统模型在微生物学中的效用已被证明是无价的。
大数据和机器学习方法的日益流行为经典系统方法提供了一个新时代的选择。整合这些进展以建立下一代预测生物学模型无疑将产生有意义的研究结果(图 2)。事实上,最近的几项研究表明,基于计算模型效用结合机器学习的非常规使用可以提供强大的量化观察力,包括生成生态相互作用的粗粒度预测,提高计算效率以加速模型预测,以及阐明药物扰动和细胞反应之间的因果机制关系。这些类型的综合方法包含了两个最完美的方面:一方面,建模提供了对微生物系统和参数空间的具体机械观察,否则很难探索(如果不是不可能的话);另一方面,数据包含了足够的生物学信息,因此,使用分析工具,可以对噪音进行分类,以找到生物学意义。
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
系列教程:微生物组入门 Biostar 微生物组 宏基因组
专业技能:学术图表 高分文章 生信宝典 不可或缺的人
一文读懂:宏基因组 寄生虫益处 进化树
必备技能:提问 搜索 Endnote
文献阅读 热心肠 SemanticScholar Geenmedical
扩增子分析:图表解读 分析流程 统计绘图
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
在线工具:16S预测培养基 生信绘图
科研经验:云笔记 云协作 公众号
编程模板: Shell R Perl
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
点击阅读原文,跳转最新文章目录阅读