RDKit | 化合物库的相似性分析

               展示一种小分子数据库的相似性分析策略。

实例中使用SMILES文件,该分析可以以相同的方式从分子的SDF或其他格式文件中加载数据,只需确保使用适当的方法将分子加载到RDKit中。


导入库

import os
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from matplotlib import gridspec

from rdkit import Chem, DataStructs
from rdkit.Chem.Fingerprints import FingerprintMols
from rdkit.Chem import Draw

# clustering
from scipy.cluster.hierarchy import dendrogram, linkage

载入数据

该库包含超过8 000 000个SMILES。

database=[]
with open('mol_parent.smi','r') as file:
    for index,line in enumerate(file):
        if 0

你可能感兴趣的:(RDKit,化学信息学与AI)