RDKit | 基于Ward方法对化合物进行分层聚类

从许多化合物构建结构多样的化合物库:

  1. 聚类方法
  2. 基于距离的方法
  3. 基于分类的方法
  4. 使用优化方法的方法

通过使用Ward方法进行聚类从化合物库中选择“各种”化合物,Ward方法是分层聚类方法之一。


导入库

from rdkit import rdBase, Chem, DataStructs
from rdkit.Chem import AllChem
from rdkit.Chem.Draw import rdMolDraw2D, IPythonConsole
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import AgglomerativeClustering
%matplotlib inline
print(rdBase.rdkitVersion)

载入数据

suppl = Chem.SDMolSupplier('Screening_Collection.sdf')
mols_free = [x for x in suppl if x is not None]
len(mols_free)

随机地改变分子的顺序 

你可能感兴趣的:(RDKit,化学信息学与AI)