在“组学”技术中,由于代谢物的不同物理化学性质及其不同的浓度范围,代谢组学是一种分析发展产生了深远影响的技术,这需要更强有力的分析策略。
来自西班牙和波兰的研究人员在《Analytical Chemistry》发表关于代谢组工作流程分析过程的最新进展。
综述要点:(i)样品采集和制备的最新发展,(ii)检测技术的最新发展,以及(iii)数据分析策略和化合物识别的新趋势。
样品采集和制备
样本采集和处理的标准操作程序(SOP)的开发和优化仍然是代谢组学研究的关键。在代谢组学工作流程中,在这两个因素上取得适当的表现是获得可靠信息的一个踏脚石,在进行流行病学规模的代谢组学研究(涉及不同生物库样本的分析)时更为关键。
血液,血浆和血清:在常规临床环境中正确采集的任何血样,包括最初为其他目的收集的生物库中的血样,都有可能被用于发现代谢组学的差异分析。然而,再现性在样品收集和制备中至关重要;因此,强烈建议遵循稳定的标准化的血液样本采集方案
尿液:根据临床情况,尿液样本可以在-20°C或更低的温度下存放少于30天,而长期储存强烈建议在-80°C以下。
组织: 使用组织样品进行代谢组学研究的第一个挑战是样品的异质性。因此,由于区域特定的代谢,必须特别注意。
粪便:基于粪便样品进行代谢组学研究的最佳策略要求将新鲜样品直接在输送容器中匀浆,然后准备多个等分试样,然后将样品置于-80°C以避免冻融循环。
细胞:胰酶消化法和刮取法是获得贴壁生长细胞以用于代谢组学研究的两种广泛使用的方法。
检测技术
毫无疑问,仪器技术(例如UHPLC或HRMS)的任何进步都涉及更多的信息和更高的质量,对于代谢组学而言当然也是如此。
多目标代谢组学:本质上是为高代谢物覆盖率设计的检测策略。为了获得更多信息需要克服两大挑战:定量策略和去除基质效应。基于定量是最终目标,针对目标分析可采取三种策略:靶向定量分析(SIL),靶向估计分析(SI-LIS)、靶向对比分析。
气相色谱法:GC−MS是代谢组学工作流程中一项非常重要的技术,因为尽管其适用性仅限于那些可挥发的化合物,且样品处理通常较长且复杂,但可通过该方法分析代谢过程中的关键化合物。GC×GC的非靶向代谢组学已用于不同的基质:细菌、尿液、血清和血浆、蔬菜和植物。但该方法仍然不够健全,在标准方法学、数据解析、结果稳定性仍有局限。
毛细管-质谱联用:CE-MS已被用于代谢组学研究,用于分析各种复杂的生物样品,以检测极性化合物和离子化合物。因此,CE−MS目前被认为是一种有价值的补充工具,用于提高通过其他技术(如HPLC-MS、GC-MS和NMR光谱)获得的代谢物的覆盖率。
离子迁移谱:在基于质谱的代谢组学评估中,尽管仪器的应用和进步不断增加,但仍有许多因素限制了鉴定。IMS提供了一个额外的分离维度,其工作时间为毫秒,并且有助于识别。此外,离子迁移率允许测量碰撞截面(CCS),这是一个比保留指数更具重现性的正交分析参数,可以与保留时间和准确的质量信息结合使用,以获得代谢物的特性。
使用不同类型的IMS的精选最新代谢组学研究
手性分析:手性代谢组学可采用靶向或非靶向方法进行评估。但是这些分析通常是基于一组相关的手性代谢物进行。对手性代谢物进行准确定量需要使用内标,以克服基质诱导的离子抑制作用, 最新策略是使用同位素标记和衍生化。
数据分析
质谱法产生的数据集非常庞大和复杂,因此需要大量的算法和工作流程来处理和分析所获得的大量信息。
优化数据质量:1)数据清洗:综合数据预处理和降噪算法以及多种数据过滤策略或考虑丢失和离群点,可以有效地解决噪声问题,有效地提高整体数据质量。2)排除混杂因素:LC−MS代谢组学数据暴露于特定的变化源中,这些变化源于(i)MS源中污染物的积累,(ii)来自流动相组成和制备的杂质或可变性,(iii)分析柱性能,或(iv)样品基质复杂性的差异,因此,需要更有效的批量修正策略。在这种情况下,基于质量控制(QC)重复分析的算法是最推荐的方法之一,假设质量控制响应与注入顺序无关。另外需要根据样本的具体情况选择相应策略,例如尿液分析中变异性的主要来源与样品浓度和分析漂移有关,建议的归一化策略包括(i)通过单个稀释因子对采集前样品进行归一化,以减小浓度范围并使分析条件标准化;(ii)基于采集后质量控制的校正信号漂移的策略;(iii)以及通过PQN、MSTUS进行的采集后标准化,或者另一种减少浓度变化影响的算法。
变量/特征选择:近年来,基于数据挖掘工具和计算方法的几种替代策略被广泛讨论。在此,维度关注的解决方案由数据简化方法提供,这些方法允许选择一个特定的重要变量子集(恰当地描述给定的问题),目的是最大化相关性和最小化冗余,并建立一个具有良好预测性能的综合学习模型。这类方法可分为(i)特征子集选择方法(过滤器、包装器和嵌入方法),去除不起作用或冗余的变量;以及(ii)特征提取方法,通过原始变量的组合创建新的特征,从而降低所选变量的维数。
代谢物的注释和识别:1)GC-EI-MS:GC - MS常用于测定衍生形式(分析物),而不是主要代谢物。因此,基于GC−MS数据有成熟的方法来鉴别代谢物。2)LC-ESI-MS 和 CE-ESI-MS:在代谢物鉴定方面,CE−MS和LC−MS的再现性不如GC−MS。研究人员开发了多个数据库及分析工具用于代谢物的注释和识别。
分析化学的概念正在演变,包括非靶向分析、差异分析和半定量分析。在进行差异分析时,统计分析可以消除可能以相同方式影响所有被比较样品的因素,因此严格控制这些因素并不重要。与此同时,这并不意味着代谢组学可以作为一个黑盒子来使用,在黑盒子里输入样品,按下仪器上的按钮,然后一个软件平台自动提供结果。当处理未知因素时,对分析的目标、样本、分析工具的深入理解,以及关于数据挖掘策略和代谢物识别的有意识和知情的决策对于获得有意义的结果是至关重要的。
首发公号:国家基因库大数据平台
参考文献
Gonzalez-Riano C, Dudzik D, Garcia A, et al. Recent developments along the analytical process for metabolomics workflows[J]. Analytical Chemistry, 2019, 92(1): 203-226.
图片来源:均来源于参考文献,如有侵权请联系删除。