AI医药论文笔记--Machine learning-based prediction of drug–drug interactions by integrating drug phenotypic

基于机器学习的药物-药物相互作用预测–通过整合药物表型、治疗、化学和基因组特性

论文题目 Machine learning-based prediction of drug–drug interactions by integrating drug phenotypic, therapeutic, chemical, and genomic properties
论文出自 JAMIA

文章目录

  • 基于机器学习的药物-药物相互作用预测--通过整合药物表型、治疗、化学和基因组特性
      • 一、模型框架?
      • 二、数据采集?
      • 三、使用五种机器学习算法在 HNAI 中实现预测模型?
      • 四、实验结果?
      • 五、思考?

一、模型框架?

提出了一个异构网络辅助推理(HNAI)框架来帮助预测 DDI。
AI医药论文笔记--Machine learning-based prediction of drug–drug interactions by integrating drug phenotypic_第1张图片
用于预测药物-药物相互作用 (DDI) 的异构网络辅助推理 (HNAI) 框架。

(A) 从 DrugBank 数据库中收集全面的 DDI 数据集并构建 DDI 网络。

(B) 计算四种药物-药物对相似性。 表型相似性基于全面的药物-不良药物反应网络,治疗相似性基于药物解剖学治疗化学(ATC)分类系统,结构相似性源自化学结构数据,基因组相似性基于大药物-靶点 来自 DrugBank 和治疗目标数据库的交互网络。 使用先前公布的方法计算药物表型、治疗和结构相似性。

(C) 基于机器学习的 HNAI 模型的构建和评估。

主要步骤:

1、首先构建了一个全面的 DDI 网络,其中包含 6946 个独特的 DDI 对,连接基于 DrugBank 数据的 721 种批准的药物。

2、使用四个特征计算了药物-药物对相似性:基于综合药物-ADR 网络的表型相似性、基于药物解剖学治疗化学分类系统的治疗相似性、来自 SMILES 数据的化学结构相似性以及基于大数据的基因组相似性。

(其中三种类型的药物相似性(表型相似性、治疗相似性和结构相似性)是使用以前的方法计算的。 此外,引入了一种新类型,即药物的基因组相似性,基于建立的大型药物-靶标相互作用 (DTI) 网络 来自 DrugBank 和治疗目标数据库 )

3、使用 DrugBank 和治疗靶点数据库构建的药物-靶点相互作用网络。

4、在 HNAI 框架中应用了五个预测模型:朴素贝叶斯、决策树、k-最近邻、逻辑回归和支持向量机。

二、数据采集?

  • DDI 网络

    从 DrugBank 数据库收集 DDI 数据。分为三种类型:药物、药代动力学和药效学相互作用。专注于预测可能发生在先前确定的配体-受体位点的药代动力学和药效学相互作用配体-受体 DDI)。 总共编制了 6946 个高质量、独特的配体-受体 DDI 对,连接了 721 种已批准的药物,用于模型构建和验证。 从 DrugBank 数据库中检索了药物的 SMILES 数据,使用 Open Babel29 (V.2.3.1) 将它们转换为规范的 SMILES。

  • 药物-ADR

    涉及两个数据集

    第一个药物-ADR 数据集是从最近发布的数据库 MetaADEDB 中下载的。

    第二个数据集来自美国 FDA 创建的 FAERS

  • DTI

    从两个数据库 DrugBank26 和 TTD27 收集了 DTI 数据。

三、使用五种机器学习算法在 HNAI 中实现预测模型?

  • 四种相似性测量?

表型相似性、治疗相似性、结构相似性、基因组相似性
AI医药论文笔记--Machine learning-based prediction of drug–drug interactions by integrating drug phenotypic_第2张图片

  • 朴素贝叶斯:贝叶斯算法使用属性的相等和独立贡献对数据集中的实例进行分类。因此分类器使用以下等式估计后验概率:
    AI医药论文笔记--Machine learning-based prediction of drug–drug interactions by integrating drug phenotypic_第3张图片

  • 决策树:树的元素包括叶子节点和决策节点。叶表示类别(例如,DDI 和非 DDI),决策节点指定要在四个药物-药物对相似性上实施的测试;每个可能的测试结果都有一个分支和一个子树。

  • k-最近邻

    k-NN 算法使用四个药物-药物对相似空间中最接近的训练示例对药物-药物对进行分类。使用hamming distance matrix来测量接近度。

    使用三个步骤实现了 3-NN 的标准协议:

    1计算未知药物-药物对与训练集中所有药物-药物对之间的距离;

    2根据计算的hamming distance,从训练集中选择与药物-药物对 y 最相似的三个药物-药物对;

    3将药物-药物对归入三个药物-药物对中的大多数所属的组(例如,DDI 或非 DDI)。

  • 逻辑回归 LR 算法用于使用逻辑函数估计定性响应模型中参数的经验值。在二元 LR 中,结果设置为“正 (DDI)”或“负 (非 DDI)”

  • 支持向量机

    在 SVM 训练中添加了类别标签 y。数据集中的第 i 个分子定义为 M i =(t i , y i ),其中 y i =1 用于“DDI”类别,y i =-1 用于“非 DDI”类别。SVM 根据以下等式构建分类器:

在这里插入图片描述

α i是要为分子 i 训练的系数,K 是核函数。通过最大化拉格朗日表达式来训练参数αi
AI医药论文笔记--Machine learning-based prediction of drug–drug interactions by integrating drug phenotypic_第4张图片

四、实验结果?

AI医药论文笔记--Machine learning-based prediction of drug–drug interactions by integrating drug phenotypic_第5张图片
在异构网络辅助推理中使用五种模型进行五重交叉验证的接收器操作特征 (ROC) 曲线。使用朴素贝叶斯(NB,红色曲线)、决策树(DT,青色曲线)、k-最近邻(k-NN,蓝色曲线)、逻辑回归(LR,绿色曲线)和支持向量机( SVM,黑色曲线)算法。

HNAI 模型假设断言,如果两种药物具有相似的化学结构,具有相似的靶蛋白和相似的 ADR,并且具有相似的治疗目的,则它们具有很高的 DDI 概率。

五、思考?

本文的改进:

(i)引入了一个额外的重要药物相似性类型(基因组相似性),并通过结合药物基因组相似性和三个先前报道的药物相似性 25 来构建预测性 HNAI 框架用于 DDI 预测;

(ii) 系统地评估了五种机器学习算法,并在 HNAI 框架中建立了预测模型;

(使用系统药理学方法对药物表型、治疗、结构和基因组相似性进行基于机器学习的整合是一种预测未知 DDI 的简单有效的策略。)

你可能感兴趣的:(AI与药物联合疗法,人工智能,机器学习,ddi)