基于RDKit探索DrugBank

如题:仅供参考

 

#导入依赖包
#!/usr/bin/python3

from rdkit import Chem
from rdkit.Chem.Draw import IPythonConsole
from rdkit.Chem import AllChem
from rdkit import DataStructs
from rdkit.Chem import Draw
import pandas as pd
#载入数据
#获取数据集中第一个分子
drugbank = Chem.SDMolSupplier('structures.sdf')
drugbank[0]
#获取数据集中第一个分子名称
drugbank[0].GetProp('GENERIC_NAME')
#输出数据集中分子包含的属性
properties = drugbank[0].GetPropNames()
for prop in properties:
    print(prop)
#获取数据集中批准的药物数目
approved = []
for drug in drugbank:
    if drug and 'approved' in drug.GetProp('DRUG_GROUPS'):
        approved.append(drug)
len(approved)

你可能感兴趣的:(RDKit,化学信息学与AI)