AIDD机器学习深度学习药物发现与设计教程总结

AIDD(AI Drug Discovery & Design):是近年来非常火热的技术应用,且已经介入到新药设计到研发的大部分环节当中,为新药发现与开发带来了极大的助力。倾向于机器对数据库信息的自我学习,可以对数据进行提取和学习,一定程度上避免了化合物设计过程中的试错路径,同时还会带来很多全新的结构,为药物发现打破常规的结构壁垒。覆盖了机器学习和深度学习,能与新药研发相结合并实质性的应用到靶点预测、高通量筛选、药物设计、药物的ADMET性质预测等;且算力方面,由早期应用于药物发现领域的决策树、随机向量机等机器学习模型,进展到深度神经网络、卷积神经网络、循环神经网络等深度学习算法。具体到新药研发环节:如靶点识别,基于决策树来预测与疾病相关的基因,有研究者发现了多种EF在信号通路和胞外定位中的调控作用,并进一步基于靶点的结构和几何特征,选取一定量蛋白的数十个结合位点以及大量的非药物结合位点,构建随机森林分类器来预测药物靶点,并有研究者进一步采样提升了随机森林算法,成功的从非药物靶点中区分了药物靶点。再如,活性筛选方面,AIDD可以对候选化合物进行筛选,从而更快的筛选出作用于特定靶点且具有较高活性的化合物

  1. 基于配体结构的虚拟筛选——分类模型的构建与应用
    1.1 数据处理与特征化(RDKit,Pandas)
    1.1.1 数据标准化
    1.1.2 数据特征化
    1.2 模型构建(Sklearn)
    1.2.1 支持向量机算法原理
    1.2.2 随机森林算法原理
    1.2.3 k最近邻算法原理
    1.2.4 极限梯度提升算法原理
    1.3 模型评估
    1.3.1 模型的评估方法
    (1)交叉验证
    (2)外部验证
    1.3.2 分类模型的常用评价指标
    (1)混淆矩阵
    (2)准确率
    (3)敏感性
    (4)特异性
    1.4 模型选择
    1.4.1 参数格点搜索
  2. 分类模型的实例讲解与练习
    以给定数据集为例,讲解基于支持向量机算法的毒性预测模型的构建与使用。引导学员自行实现基于其他三种算法的毒性预测模型,并用于小分子化合物的毒性预测。
  3. 基于配体结构的虚拟筛选——分类模型的构建与应用
    1.1 分类模型与回归模型的异同
    1.2 回归模型常用评价指标
  4. 回归模型的实例讲解与练习
    以给定数据集为例,讲解基于支持向量机算法的pIC50值预测模型的构建与使用。引导学员自行实现基于其他三种算法的pIC50值预测模型,并用于小分子化合物pIC50值的预测。
  5. 深度学习简介
    1.1 深度学习的发展历程
    1.2 深度学习在药物开发中的应用
  6. 深度学习的主要算法与工具
    2.1 深度神经网络的基本原理
    2.1.1 基于梯度的学习
    2.1.2 架构设计
    2.1.3 反向传播算法
    2.1.4 深度模型中的优化——随机梯度下降
    2.2 深度神经网络的常用框架
    2.2.1 PyTorch
    2.2.2 TensorFlow
  7. 基于PyTorch的多层感知机算法的实例讲解与练习
    以给定数据集为例,讲解基于PyTorch的多层感知机的毒性预测模型的构建与使用。
  8. 图理论
  9. 基于图的分子特征
    2.1 ConvMolFeaturizer
    2.2 WeaveFeaturizer
    2.3 MolGanFeaturizer
    2.4 MolGraphConvFeaturizer
  10. 卷积神经网络
  11. 模型的可解释性
  12. 实例讲解与练习
    以血脑屏障通透率数据为例,构建基于图卷积神经网络的QSAR模型。并通过计算原子贡献,对模型进行解释。
  13. 基于字符串的小分子化合物生成模型
    1.1 循环神经网络
    1.2基于上下文的循环神经网络序列建模
  14. 基于图数据的小分子化合物生成模型
    2.1 生成器
    2.2 判别器
    2.3 奖励网络
    3 实例讲解与练习
    以 tox21 数据集为例,使用 MolGAN 模型进行小分子化合物的生成练习。
    详情请您查阅链接文档:链接详细内容

你可能感兴趣的:(机器学习,深度学习,人工智能)