谷禾健康
为了使研究更系统更全面,越来越多的研究人员追求在多组学背景下解释分子数据。
OmicsNet (www.omicsnet.ca) 顺应而生,这是一个在线平台,允许用户轻松地构建、可视化和分析多组学网络。
OmicsNet 2.0在原有基础上进行了升级,主要改进了三个方面:
(1) 可视化分析中2D图形布局选项增加了11个,以及一个新颖的3D模块。
(2) 支持三种新的组学类型:
(3) 分析时将同时输出使用的R包OmicsNetR和历史命令,并生成共享链接可在网页查看和交互操作,从而提高研究的可重复性。
研究中使用OmicsNet 2.0对炎症性肠病(IBD)的数据进行多组学分析。
OmicsNet 2.0工作流程
如图,主要为4个步骤:
OmicsNet 2.0 的改进
1、更新了分子相互作用数据库
包括PPI数据库(STRING,InnateDB和IntAct),TF-target数据库(TRRUST和JASPAR), miRNA-target数据库(TarBase和miRTarBase),代谢数据库(KEGG, Recon3和AGORA)。
2、支持三种新的组学类型
可支持来自遗传变异研究的SNP矩阵、来自非靶向代谢组学的 LC-MS 峰和来自微生物组分析的物种丰度矩阵数据的输入及互作分析。
对于那些对影响基因调控的变异感兴趣的用户,可以分别基于ADmiRE和SNP2TFBS将SNPs映射到miRNAs或TF结合位点。由此产生的网络可以通过proteins、miRNAs或TFs进一步扩展,以了解潜在的影响。
对于代谢组学分析,使用最近发布的NetID算法对LC-MS峰(m/z, retention time, intensity和p-value)进行数据处理,可选三种数据库(KEGG, PubChemLite_BioPathway和HMDB)进行注释。
使用Rcpp/C++ 引擎重新编写了核心算法,使其速度提高了10 倍以上。使用 lpsymphony 包进一步优化了整数线性规划。
直接上传物种丰度矩阵,可以使用贝叶斯逻辑模型预测潜在代谢物,该模型使用超过 6000 个高质量基因组规模的代谢模型进行训练。
3、代码开源
开放R包OmicsNetR(https://github.com/xia-lab/OmicsNetR),显示分析期间所执行的R命令。结果可输出为网页链接,有效期一个月。
4、减少假阳性
对于来自人类和小鼠的数据,提供了一个基于ENCODE、基因型-组织表达(GTEx)或人类蛋白图谱(HPA)的基因表达数据的过滤器,这些过滤器帮助研究人员专注于与生物相关的相互作用,并减少假阳性。
5、支持 2D 和 3D 网络可视化
2D模块可支持11种图形布局,3D模块可支持交互。图形化主要基于 igraph 包和 graphlayouts 包。
使用OmicsNet 2.0进行的IBD多组学研究
图A为2D视图,图B为3D视图
将获得的物种丰度矩阵,SNP矩阵和LC-MS峰数据上传至OmicsNet 2.0平台。
利用AGORA数据库预测潜在的微生物代谢物(potential score:0.9)。
利用PhenoScanner对基于eQTLs的基因进行SNP定位。
利用KEGG数据库对LC-MS峰进行注释。
通过添加代谢物-蛋白质相互作用,从SNPs和LC-MS峰生成的个体网络进一步扩大,这样三个网络可以在代谢组学层合并。
p-value过滤:(cut-off: 0.2)来排除p值较大的LC-MS峰值所贡献的节点。其网络连接基于其相关代谢物、基因或蛋白质。
如图A,生成的子网络1包含六种类型的节点(物种、SNPs、代谢物、SNPs或代谢物相关的基因/蛋白质),结果显示出glutathione是宿主-微生物相互作用中的重要交互作用点。
由此推测包括大肠杆菌在内的几种微生物会产生glutathione,两个SNPs(rs3197999和rs1428554)通过编码谷胱甘肽过氧化物酶(GPx)的基因GPX1和GPX3与代谢产物相关。
与此呼应的是,在以往的研究中证明大肠杆菌和相关物种在IBD中的过度表达可能是由于它们能更好地产生glutathione以抵抗氧化应激。
图B的3D分层网络提供了一个直观的多组学整合视角,突出显示了连接微生物组和宿主遗传的glutathione的流动路径。
OmicsNet 2.0与其它工具的比较
如下表,比较OmicsNet 2.0与其他基于web的多组学集成工具的关键特性。
‘√’表示支持,‘-’ 表示缺失,“+”表示定量评估(“+”越多表示更好的支持)
附带各工具的官网及主要特点描述:
PaintOmics
(http://www.paintomics.org)
专注于在视觉上呈现多组学数据的探索分析,包括转录组学,代谢组学,表观基因组学,miRNA和转录因子,将其映射到KEGG通路联合分析。
MergeOmics
(http://mergeomics.research.idre.ucla.edu)
整合了来自单个组学层面的关联研究的汇总统计数据,以及不同功能基因组学数据,以获得机理上的见解,最近还加入了多组学信息的药物重新定位(drug repositioning)。
OmicsAnalyst
(https://www.omicsanalyst.ca)
基于输入的数据,利用多元统计、相关性分析和聚类方法,结合网络、热图和散点图进行多组学分析。
Arena3D
(https://www.arena3d.org)
擅长使用基于3D的分层布局对多层网络进行交互式可视化,适用于多组学网络数据。
NedRex
(https://nedrex.net)
是一个Cytoscape插件,专注于疾病模块识别和药物再利用,使用各种模块识别和优先排序算法。
MetScape
(http://metscape.ncibi.org)
是一个Cytoscape插件,通过构建和分析不同类型的含有酶、代谢物和/或反应的网络,专注于基因表达和代谢组学数据的集成和可视化。
OmicsNet
(https://www.omicsnet.ca)
通过将多个分子互作数据库与强大的2D/3D可视化网络分析相结合,对于多组学集成分析和结果解释有更好的理论基础,对以上工具的不足做了补充。
结 语
OmicsNet 2.0是一个基于网络的多组学分析平台,支持2D和3D网络可视化探索。
在1.0版本中强调基于web的3D网络可视化。
在2.0版本中,进一步改进了其可视化分析系统,添加了一个功能完整的2D网络可视化系统,并支持三种新的组学数据输入(SNPs、微生物分类单元和LC-MS峰),目前的生物信息学工具无法很好地支持这些数据。
除了富集分析、搜寻模块和最短路径分析,用户还可以使用重启随机游走算法(Random Walk with Restart)搜索候选疾病标记物。最后,2.0版本通过发布底层的R代码和共享链接,改进了工具的可再现性和透明度。
使用IBD多组学数据的案例研究表明,OmicsNet 2.0可以揭示与原始出版物和后续出版物以及IBD文献一致的有意义的模式、关系和功能。总之,OmicsNet 2.0解决了对多组学数据进行分析的一些需求。
参考文献:
Zhou G, Pang Z, Lu Y, Ewald J, Xia J. OmicsNet 2.0: a web-based platform for multi-omics integration and network visual analytics. Nucleic Acids Res. 2022 May 26:gkac376. doi: 10.1093/nar/gkac376. Epub ahead of print. PMID: 35639733.