临床代谢组学分析全流程

代谢组学定义

是研究代谢组在某一时刻细胞内所有代谢物的集合的一门学科,其研究对象大都是相对分子量1000以内的小分子物质。

基因组学和蛋白组学告诉你可能发生什么,而代谢组学则告诉你已经发生了什么。

代谢组学分类

非靶向代谢组、靶向代谢组/高通量靶标代谢组、广泛靶标代谢组/拟靶向代谢组

代谢组学技术平台

核磁共振NMR、气质联用GC-MS、液质联用LC-MS

临床代谢组学研究基本思路


图片来源百趣代谢组学
图片来源百趣代谢组学

代谢组学研究流程

组学信息挖掘-靶向检测验证-动物造模验证-干预实验验证

临床样本收集:

1.临床上,以组织和血液为主;最好选择无创和微创的体液样本。

2.样本量:参考知名杂志已发表的研究样本数量,病结合自身课题组已有的研究基础和经验;或实用PASS或者stata等统计软件等计算其所需的样本含量。

3.样本是否随机选择;用药、饮食情况和吸烟等;年龄、性别等在各组间无差异。样本分组符合公认标准。

组学数据分析

1.代谢组学数据到预处理

离群features和离群样本处理:离群值—四分位距法(IQR)和rsd法、离群样本--PCA

缺失值处理

数据归一化、标准化、中心化、LOESS和SVM(校正批次效应)

数据质控


2.代谢物初筛

差异倍数

T/U检验

对变量统计分析(O)PLS-DA,VIP值


3.锁定目标分子

    机器学习:从庞大复杂的特征数据中高效筛选到简单组合的、可以代表整体数据特性的一组panel。方法: 逻辑回归(LR)、LASSO、随机森林(RF)、支持向量机(SVM)、Xgboost和神经网络等

4.ROC曲线

5.患病风险概率:建立的随机森林模型中,预测到的各数据集样本的患病风险。

你可能感兴趣的:(临床代谢组学分析全流程)