RDKit | 通过Lipinski规则了解如何在RDKit中处理描述符

以Lipinski的为主题,学习RDKit如何处理表征分子特性的“ 描述符 ”。

 

描述符

        描述符是确定分子性质的指标。当然,水的性质是水的溶解度和大小的性质,生物活性的存在或不存在也可以说是自然的。特别是在化学信息学领域,可以从分子结构衍生的那些被描述符进行属性描述。

        许多情况下,使用描述符的目的是通过组合多个描述符来了解实验数据(例如生物活性),并最终创建一个用于预测的模型(QSAR模型)。已经开发了许多描述符,并将在将来继续使用。

 

通过Lipinski规则了解如何在RDKit中处理描述符

导入库

import pandas as pd
import seaborn as sns
from rdkit import rdBase, Chem
print(rdBase.rdkitVersion) 
from rdkit.Chem import AllChem, Descriptors

载入数据

suppl = Chem.SDMolSupplier('platinum_dataset_2016_01.sdf')
mols = [x for x in suppl 

你可能感兴趣的:(RDKit,化学信息学与AI)