DrugCombDB: 药物组合数据库

DrugCombDB: a comprehensive database of drug combinations toward the discovery of combinatorial therapy

DrugCombDB

摘要

药物组合效应在肿瘤疾病中应用广泛,现存大量药物组合数据集。因此考虑构建药物组合数据库。
DrugCombDB数据库数据来源:
(i)HTS assays of drug combinations; (实验)
(ii) manual curations from the literature; (文献)
(iii) FDA Orange Book and external databases;(外部数据库)
(iv) failed drug combinations.(失败的药物组合)
其中包括448555个药物组合,>2887个单独药物,来源于124个人类细胞系。
该数据库还提供了多个可训练分类和回归分析预测模型的数据集。

INTRODUCTION

研究背景

1、肿瘤药物耐药性导致很多药物使用后出现耐药性而失去作用,但组合药物出现可以减少耐药性同时有更好的疗效。因此单靶点药物向多靶点喝联合靶点药物发展。
2、已知数据较多,相似数据库较少
3、无法大规模对所有药物组合进行临床验证实验。

研究目的

该数据专注于药物组合协同评分的计算和可视化。当前发布的DrugCombDB包括6055926定量剂量反应,通过计算多个协同作用评分来确定药物联合的整体协同或拮抗作用。
为了方便下游对数据资源的使用,准备了多个数据集,用于构建分类和回归分析的预测模型。

DATA SOURCES

1、HTS assays(高通量筛选技术实验)
2、AstraZeneca–Sanger drug combination dataset
3、Manual literature curations
4、External databases
5、Multiple-agent combinations (>2种的组合)


各个数据来源下载数据数量细节展示

DATA PROCESSING AND INTEGRATION

标识符统一

数据来源不同,所以标识符不一致。采用the PubChem compound identifiers (CIDs)作为统一标识符。
细胞系标识符选择COMICID标记。

协同作用得分的计算

模型 计算方法 条件 说明
HSA
HSA
E表示常用的药物指数,如EC50 or IC50
bliss independence
bliss
药物作用相对独立
loewe additivity
loewe
药物作用相互独立 dA和dB表示药物A、B的剂量,Emin 、Emax是药物组合效应最值,且在(0,1)之间,m是中点效应的剂量,λ是曲线斜率
ZIP
ZIP
λA、λB表示分别用药的曲线斜率

剂量响应的正规化:
通常的剂量标准选择治疗后细胞存活率和凋亡率,因此采用抑制率作为衡量标准。但由于数据来源广泛,需要进行正规化处理。
方法:min-max normalization method,归一到(0,1)之间,1敏感对最高,0 最低


正规化方法

协同作用和拮抗作用的分类

通常使用0作为区分标准,但是发现四种计算联合作用的结果主要集中在0附近,同时还没去噪声。因此使用z-score作标准化,取1/4位点。前1/4为协同,后1/4为拮抗。
特殊的,loewe模型得分大部分偏低,因此降低阈值来保证样品数量。而且取在四个模型中均协同或者拮抗的药物组合定义为协同或拮抗。
最终存在85154个协同,155824个拮抗。


四种算法药物协同得分分布图

药物组合重复的整合

由于一个数据集或者多个数据集之间存在很多药物组合的重复,需要检验重复实验的可重复性。因此引入css(combination sensitivity score)来进行衡量。在两个最大的数据集中进行了实验,概率分布如图。作者根据sd分布,将ONEIL的重复实验作均值处理,ALMANAC未作处理,总体来说重复还是比随机实验结果sd更小。


概率分布曲线

功能

功能区:搜索,筛选,可视化,下载


功能示例1

功能示例2

禁止转载,如有需要,请简信联系作者!

你可能感兴趣的:(DrugCombDB: 药物组合数据库)