DTIs(药物靶标关联)预测,在机器学习中的常用方法。(一)

药物靶标预测的套路

    把药物、靶点(蛋白质)和已经确认的DTIs的知识转化为特征,用于训练预测模型,进而用于预测新药物或新靶点之间的相互作用。这里的相互作用也分为几类。

这些研究的主要假设是,如果药物d与蛋白质p相互作用,那么

(i)类似d的药物化合物可能与蛋白质p相互作用

(ii)类似p的蛋白质可能与药物d相互作用

(iii)类似d的药物化合物可能与类似p的蛋白质相互作用。

    药物化合物和蛋白质序列之间的相似性通常用专门为此目的设计来测量。在实践中,基于相互作用药物化合物和靶蛋白的知识,DTI预测问题可以分为四类:(i)已知药物与已知靶点,(ii)已知药物与新靶点候选,(iii)新药物与已知靶点,(iv)新药物与新靶点候选。虽然机器学习方法的最终目标是对新药和候选靶标的交互预测,但文献中的大多数方法都局限于前三类。DTI预测中使用的机器学习方法可以被认为是复杂网络中更广泛的“链接预测”问题。

 机器学习方法在DTI预测中的应用

    用于DTI预测的机器学习方法可以追溯到药理学DTI预测的早期工作。虽然他们的工作重点不是具体的“药物发现”,但他们的目标是找到与每个单独的GPCR结合的分子配体排序列表,由于缺乏结晶的3D结构,对接模拟不能使用。在这里,机器学习方法被分为六组。DTIs(药物靶标关联)预测,在机器学习中的常用方法。(一)_第1张图片

相似性/基于距离的方法

用于DTI预测的最流行的一组方法包括药物-药物和靶标-靶标相似性度量,通过用于进行预测的相似性或距离函数。

通常,这些方法包括一个基于已知的药物-药物和靶标相似性度量的药物-药物、靶标-靶标或药物-靶标关联的相似性评分方案。类似地,相似度度量可以通过距离函数来定义一种新药相对于已知药物对的相似程度(或“接近”程度)。通过最近邻(KNN)算法的距离函数来定义“近度”有几种方法,其中欧氏距离最为人熟知。

DTIs(药物靶标关联)预测,在机器学习中的常用方法。(一)_第2张图片

除此之外,还可以根据药物的药理相似性和蛋白质序列的基因组相似性,以及现有药物和蛋白质靶标的多部网络的拓扑性质来定义相似/距离函数。为此,有人将5种药物-药物相似度指标定义为:基于化学的、基于配体的、基于表达的、基于副作用的和基于注释的。这组方法的主要缺点在于,已知的药物及其相互作用很少,而数据集中有大量的未标记数据。尽管已经有一些努力试图解决缺乏标记数据的问题,但这一挑战仍未被克服。下表列出了基于相似度/距离的方法列表。

DTIs(药物靶标关联)预测,在机器学习中的常用方法。(一)_第3张图片

出去玩了,剩下几种方法回来接着写。

 参考文献:《Machine learning approaches and databases for
prediction of drug–target interaction: a survey paper》

你可能感兴趣的:(机器学习,人工智能,深度学习)