基于Smiles2vec预测化合物物理性质

Smiles2vec

简而言之,它是自然语言处理(NLP)领域的一项技术,可将字符串转换为矢量。 许多人用smiles字符串预测物理属性。

 

Smiles2vec的结构

将字符串转换为矢量是NLP领域的一项技术名为Seq2Seq。 在没有学习的情况下简单地解释它,它经常被用在“机器对话和机器翻译等模型”中。 该技术基于递归神经网络的思想使用诸如LSTM和GRU的层。 下图显示了原始论文中Smiles2vec的结构。 在本文中隐藏层的根据化合物结构和物理性质而改变。

基于Smiles2vec预测化合物物理性质_第1张图片


导入库

from __future__ import print_function
import keras
from sklearn.utils import shuffle
from keras.models import Sequential, Model
from keras.layers import Conv2D, MaxPooling2D, Input, GlobalMaxPooling2D, BatchNormalization
from keras.layers.core import Dense, Dropout, Activation, Flatten
from keras.optimizers import Adam
from keras.preprocessing.image import ImageDataGenerator
from keras.callbacks impor

你可能感兴趣的:(RDKit,化学信息学与AI)