网络药理学+转录组AD候选药物筛选纯生信分析套路

今天跟大家分享的是六月份发表在Bioinformatics杂志(IF:5.61)上的一篇通过对疾病相关基因和药物靶标进行网络分析,筛选出潜在药物,并根据其基因表达谱进一步过滤获得有效药物的文章。

Screening novel drug candidates for Alzheimer’s disease by an integrated network and transcriptome analysis

通过整合的网络和转录组分析筛查阿尔茨海默氏病的新型候选药物

网络药理学+转录组AD候选药物筛选

阿尔茨海默氏病(AD)是一种严重的变性脑疾病,是痴呆症的最常见原因。目前用于AD的药物可提供对症治疗,但尚无有效的药物可治愈该疾病。这项研究利用基于通路和网络水平以及LINCS扰动数据集的系统生物学方法,引入系统的计算过程来发现新的AD相关药物。首先收集了561个已发表的AD风险基因,并进行功能富集分析。然后,通过基于人类互作组定量5595种分子药物与AD之间的接近度,筛选出了1092种与疾病最接近的药物。进一步对候选药物进行反向基因集富集分析,估计扰动对基因表达的影响,确定了24种潜在的候选AD治疗药物。研究结果为理解AD的分子机制提供了可能,可用于确定其他复杂疾病的有效疗法。

 

方法

这项研究包括以下步骤:1)收集与AD相关的基因;2)收集可用药物;3)通过与互作网络上AD相关基因的接近度来筛选药物;4)根据筛选出的药物与基因表达谱的相关性进一步筛选(图1)

 图1.用于识别AD潜在疗法的系统框架


收集AD相关基因,候选药物和蛋白质-蛋白质互作组

AD相关基因从KEGG(https://www.genome.jp/kegg/),OMIM(https:// www.ncbi.nlm.nih.gov/omim)和Phenotype-Genotype Integrator(PheGenI)(https://www.ncbi.nlm.nih.gov/gap/phegeni)下载。将这三个列表中的基因进行整合,将其比对到HGNC(https://www.genenames.org/)的人类基因符号上,保留了561个基因作为AD相关基因。药物信息来自DrugBank, 排除没有靶点的药物,共产生了5595种药物。为了评估药物与AD之间的相关性,构建了人类蛋白质-蛋白质互作(PPI)网络。互作数据集来自三个数据库,包括用于检索互作基因/蛋白质的搜索工具(STRING),蛋白质互作网络分析(PINA)和人类参考蛋白互作组(HuRI)。然后通过排除自交互和冗余对来合并三个互作数据集。同时,将列表中的蛋白质定位到HGNC的基因符号上,最终形成了一个相对全面的互作组,该互作组由17,232种蛋白质/基因之间的493,232种互作组成。此外,从基于集成网络的细胞特征库(LINCS; https://commonfund.nih.gov/LINCS/)L1000数据集,下一代连接图(CMap)获得了药物诱导的基因表达谱。为了确保结果的准确性,收集了10,174个最佳推断基因(BING)的扰动数据集,其中包括978个标志性基因和9,196个推断基因。

AD相关基因的生物功能富集分析

使用Cytoscape应用程序ClueGO进行功能富集分析。

药物与AD基于网络的接近度

使用基于网络的方法来分析药物与疾病之间的关系,根据与疾病中使用的已知药物的特征相似性筛选候选药物,药物和疾病之间的相关性通过网络距离来衡量。无监督框架可用于通过测量药物与疾病之间的接近度值来量化药物的治疗效果。S,AD相关基因的集合;D,PPI中AD相关基因的程度;T,药物靶基因集;d(s,t),网络中结点s(AD相关基因)和t(药物靶标)的最短路径长度,w,w=-ln(D+1),公式如下:

为了评估药物与AD之间关联的显著性,生成了与药物相对应的模拟参考距离分布。在网络中随机选择一组与药物靶标大小相匹配的蛋白质(表示为R),然后计算模拟药物靶标与AD相关基因之间的距离d(S,R)。通过重复该过程10,000次来生成参考分布,参考分布的平均值和标准偏差用来将对应于真实药物的观察距离转换为归一化距离,公式如下:

药物特征的反向基因集富集分析

为了避免与基因集筛选的原始GSEA混淆,命名为反向基因集富集分析(IGSEA)(图2)。从LINCS检索了许多与药物治疗相关的基因表达数据集;接下来,通过具有一个基因集的定制GSEA对每个数据集进行分析,并使用富集得分(ES)和p值分别测量AD相关基因集的富集幅度和统计显著性。然后,对所有表达数据集的p值进行多重比较校正,并通过Benjamini和Hochberg的方法计算FDR。

 图2.通过反向基因集富集分析(IGSEA)过滤AD药物

 

结果

AD相关基因的生物学过程

在研究中,收集了561个AD的风险基因,并检测到19个主要的GO生物学过程,包括淀粉样β代谢过程,淀粉样前体蛋白质分解代谢过程的调控,蛋白质寡聚化的调控和神经系统发育的调控。已确定许多证实的AD风险基因与上述GO术语相关(例如APOE,APP,PSEN1和PSEN2)。

互作网络中药物与AD的接近度

研究得到了药物靶标与AD相关蛋白之间距离的分布(图3)。排除与AD明显无关的药物,并保留了足够数量的可靠药物后,有1092种药物接近AD。目前,有四种FDA批准的AD治疗药物,其中的三种药物(多奈哌齐,卡巴拉汀和美金刚)被列入1092种药物清单,这表明可有效筛选阿尔茨海默氏症药物。

图3.药物与AD之间的接近度

 

阐释药物特征

通过IGSEA,鉴定出24种FDR <0.25的药物(表1),它们对受试神经细胞系中AD相关基因表达的影响更大。所有这些药物的靶基因都与AD相关基因或已知的阿尔茨海默氏症药物的靶重叠。

 表1. AD的预测药物

 网络药理学+转录组AD候选药物筛选

结束语

在这项研究中,有分析意向(http://gaptechsxr.mikecrm.com/1vdMmqy)生信人WX公众号为了寻找新的候选药物,首先收集了与疾病相关的基因以及可用药物,然后通过对疾病相关基因和药物靶标进行网络分析,筛选出潜在药物,根据其基因表达谱进一步过滤候选药物,最终获得了一些可能对治疗有效的药物信息。这篇文章介绍的计算框架为发现其他复杂疾病的潜在药物提供新思路,简直是超好用的万能模板!

你可能感兴趣的:(网络药理学+转录组AD候选药物筛选纯生信分析套路)