RDKit是一个用于化学信息学的开源工具包,基于对化合物2D和3D分子操作,利用机器学习方法进行化合物描述符生成,fingerprint生成,化合物结构相似性计算,2D和3D分子展示等。基于PYTHON语言进行调取使用。
官网:https://rdkit.org
官方安装文档:ttps://github.com/rdkit/rdkit/blob/master/Docs/Book/Install.md
第二个链接介绍的非常清楚, 对于英语好的朋友推荐大家直接阅读.
因为又很多化学领域的小伙伴需要安装rdkit, 博主尽量写的详细一点, 有不清楚的地方可以在评论留言~
博主推荐步骤:
Anaconda是一个非常非常常用的包管理工具, 我们几乎可以通过conda安装所有我们需要的包
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
# 设置搜索时显示通道地址
conda config --set show_channel_urls yes
虚环境抽象理解: 就像有的时候我们需要Python3,有的时候需要Python2, 如果把各种可能需要的Python版本都装到电脑中, 加载在电脑的环境变量里, 管理成本是非常高的. 我们日常不同的实验,不同的项目也需要各种不同种类不同版本的包, 因此为了相互干扰, 我们可以创建一个新的虚环境, 在这个虚环境中下载各种包, 选择指定版本的Python, 当我们想做某实验时, 需要这一系列的包, 直接加载个这虚环境就好了.
创建虚环境
conda create -n your_env_name python=3.6
# your_env_name 是你随便起一个环境的名字
# python=X.X 是指定python版本, 博主为了兼容tensorflow等包这里选择3.6
激活(进入)虚环境
#windows系统:
conda activate rdkit_py36
#linux系统:
conda activate rdkit_py36
# 出bug 就加source在前面
发现命令行前边带一个括号: (rdkit_py36)xxxx , 说明进入环境成功
如果不想用了,关闭虚环境:
#windows
conda deactivate
#linux
conda deactivate
# 出bug 就加source在前面
conda install -c rdkit rdkit
# 解释: -c 是选择channels, 选择从哪里下载, 第一个rdkit是通道,第二个是我们需要的rdkit包
conda info -e
#查看所有的虚环境
conda remove -n xxx --all
#删除某个虚环境
conda list
#查看已经安装的包
conda config --show
# 查看所有的通道(包括各种配置信息)
通过指定通道的方式解决
#使用推荐的方法
conda install -c rdkit rdkit
换一个通道试试,
conda install -c conda-forge rdkit
conda 的版本太低了! 需要升级新的版本:
#查看当前版本:
conda -V
#更新conda
conda update -n base conda
#再看一下,是不是升级了
conda -V
执行:
python3 #先在shell中进入python环境
from rdkit import Chem
from rdkit.Chem import Draw
smi = 'CCCc1nn(C)c2C(=O)NC(=Nc12)c3cc(ccc3OCC)S(=O)(=O)N4CCN(C)CC4'
m = Chem.MolFromSmiles(smi)
Draw.MolToImageFile(m,"mol.jpg")
# 在当前的文件夹下找到我们一个图片就是mol.jpg